头条
人工智能安全是全球公共利益
https://www.noemamag.com/ai-safety-is-a-global-public-good/
中国和西方的顶尖人工智能科学家举行了人工智能安全国际对话,就人工智能治理达成共识。他们的建议包括建立应急准备机构、建立安全保障框架和资助独立的人工智能安全研究。该小组强调迫切需要全球合作来管理高级人工智能风险。
Llama 3.2:多模态
Meta 发布了一套新的具有视觉功能的 Llama 模型,其中包括 1B、3B 和几个新的多模态模型。
Mira 离开 OpenAI
https://www.theverge.com/2024/9/25/24254431/openai-cto-mira-murati-leaving
OpenAI 的首席技术官 Mira Murati 将辞去她在公司的职务,以便给自己留出空间去追求不同的创意道路。
研究
Molmo 开源多模态模型
https://molmo.allenai.org/blog
Allen AI 发布了完全开放的多模态模型,其性能优于许多开放和封闭的视觉语言模型。该版本包括模型的数据集和训练机制。
MaskBit:通过 Bit Tokens 实现无嵌入图像生成
https://arxiv.org/abs/2409.16211
这项研究介绍了图像生成的两个关键进步:一个现代化的 VQGAN 模型,可增强可访问性和性能,以及一个使用 Bit Tokens 的新型无嵌入生成网络。这些改进在 ImageNet 基准上取得了最先进的结果,使用紧凑的 305M 参数模型实现了 1.52 的 FID。
漫画故事理解
https://arxiv.org/abs/2409.16159v1
研究人员提出了一种使用视觉语言模型 (VLM) 的流程,用于生成详细、扎实的字幕,将漫画元素及其关系联系起来,以增强漫画分析。
工程
使用 Jax 探索并行策略
https://astralord.github.io/posts/exploring-parallel-strategies-with-jax/
本文探讨了使用 Jax 库并行化语言模型的方法。
Time MoE
https://github.com/Time-MoE/Time-MoE
时间 MoE 是一种混合专家模型,在时间序列预测任务上达到十亿级规模。
使用 HelloBench 生成长文本
https://github.com/quehry/hellobench
HelloBench 是一个基准,它根据布鲁姆分类法评估五个长文本生成任务中的 LLM。
杂七杂八
Sakana、Strawberry 和 Scary AI
https://www.astralcodexten.com/p/sakana-strawberry-and-scary-ai
一家日本初创公司创造了“Sakana”,一个可以生成假设、编码和撰写论文的人工智能科学家,但其产出大部分是微不足道的,有时是捏造的。OpenAI 的“Strawberry”人工智能在配置不当的沙箱中展示了黑客能力,凸显了工具融合和资源寻求行为的潜力,并促使人们重新评估什么是真正的人工智能进步。本文探讨了人工智能的里程碑(例如撰写科学论文和黑客攻击)是否真正表明了智能,还是只是复杂的模仿。
亚马逊推出 Amelia,一款面向第三方卖家的生成式人工智能助手
亚马逊宣布推出 Project Amelia,一款面向其平台上独立卖家的生成式人工智能助手。Amelia 使用亚马逊的 Bedrock 构建,提供个性化见解、销售数据和运营支持,以提高卖家的生产力。目前,它正在为部分美国卖家提供测试版,很快将扩展到更多用户和国家/地区。
YouTube Shorts 将整合谷歌的 AI 视频模型 Veo
https://techcrunch.com/2024/09/18/youtube-shorts-to-integrate-veo-google-ai-video-model/
YouTube 宣布将谷歌 DeepMind 的 AI 视频生成模型 Veo 整合到 YouTube Shorts 中,让创作者可以生成高质量的背景和六秒短片。
AI 能预测你什么时候会死吗?研究发现,加拿大新技术可防止医院意外死亡
https://www.cbc.ca/news/health/ai-health-care-1.7322671
圣迈克尔医院基于 AI 的预警系统 Chartwatch 在最近的一项研究中显著降低了 26% 的患者意外死亡率。
亚马逊发布了一款视频生成器 - 但仅用于广告
https://techcrunch.com/2024/09/19/amazon-releases-a-video-generator-but-only-for-ads/
亚马逊为广告商推出了一款人工智能视频生成器,该生成器可以通过单张图片创建产品视频。
人工智能代理入侵可观察性:snake oil 还是 SRE 的未来?
https://monitoring2.substack.com/p/ai-agents-invade-observability
人工智能的进步有望通过“代理”生成式人工智能模型改变可观察性业务,这些模型可以根据现实世界的数据采取行动。