头条
Qwen 1.5车型发布
https://qwenlm.github.io/blog/qwen1.5/
从0.5B到72B参数。 这些是令人印象深刻的多语言模型套件。 有趣的是,最小的模型是第一个严肃的 sub 1B 参数语言模型。
OpenAI 让人工智能变得更加“民主”的计划
https://time.com/6684266/openai-democracy-artificial-intelligence/
2023 年 5 月,Colin Megill 会见了 OpenAI,包括联合创始人 Wojciech Zaremba,讨论整合他的公共审议平台 Polis,该平台使用人工智能来增强民主参与。 此次合作旨在通过广泛的公众投入使人工智能与人类价值观保持一致。 它引发了 OpenAI 的“人工智能民主投入”倡议,通过 100 万美元的资助计划探索人工智能治理。
研究
Boximator:可控视频合成
https://arxiv.org/abs/2402.01566
众所周知,视频合成很难控制。 这项工作提出使用方框和箭头来指导随着时间的推移生成,这改善了人类的偏好判断,但仍然没有给用户提供完美的指导。
一种新的人工智能对齐优化方法
https://arxiv.org/abs/2402.01306v1
卡尼曼-特沃斯基优化 (KTO) 是一种训练人工智能模型以更好地符合人类思维的新方法。 通过利用 Kahneman 和 Tversky 前景理论中的概念,KTO 专注于效用最大化,而不仅仅是偏好可能性。
人工智能中的多模态幻觉
https://arxiv.org/abs/2402.01345v1
本文阐明了为什么大型视觉语言模型(LVLM)有时会错误地描述图像,这种现象被称为多模态幻觉。 语义转移偏差,尤其是段落中断处的语义转移偏差,是一个关键因素。
工程
Rabbit 的开源替代品 (GitHub Repo)
https://github.com/KillianLucas/01
一个小组正在致力于构建 Rabbit 硬件的开源版本,包括语言建模部分。
NaturalSQL (GitHub Repo)
https://github.com/cfahlgren1/natural-sql
ChatDB 的 NaturalSQL 是一系列在文本到 SQL 指令上具有最先进性能的模型。
从单张照片生成多样化的人物肖像
https://caphuman.github.io/
CapHuman 是一个框架,可以仅使用一张参考照片创建一个人的各种图像。 它巧妙地保持了人的身份,同时改变了头部位置和表情。
杂七杂八
Pearls 上下文教程
https://github.com/facebookresearch/Pearl/blob/main/pearl/tutorials/contextual_bandits/contextual_bandits_tutorial.ipynb
Pearls 是由 Meta 维护的强化学习框架。 本教程将介绍该软件的基于老虎机的学习问题。
人工智能对劳动力市场的影响比预期慢
https://aisupremacy.substack.com/p/mit-paper-ais-labor-market-impacts
工作论文“超越人工智能曝光:哪些任务通过计算机视觉实现自动化具有成本效益?” 麻省理工学院和 IBM 的研究人员研究了自动化基于视觉的任务的经济可行性。 研究发现,只有 23% 的自动化具有成本效益。 该论文预测,与更具破坏性的预测相比,多年来劳动力市场的影响将逐渐显现。
文本嵌入模型的新基准
https://arxiv.org/abs/2402.01613v1
Nomic-Embed-Text-V1 作为开源、完全可复制的文本嵌入模型设立了新标准。 它在短上下文和长上下文任务中都表现出色。 Nomic-Embed-Text-V1 具有独特的透明度,提供对其训练代码、模型权重和包含 2.35 亿文本对的庞大数据集的完整访问。
Matrices
https://matrices.app/
Matrices 是一种人工智能原生电子表格,可以自行创建并填充您需要的任何信息。 它可以仅用自然语言进行扩展。
人工智能如何帮助我们了解鸟类
https://themarkup.org/hello-world/2024/02/03/how-ai-is-helping-us-learn-about-birds
BirdCast 是康奈尔鸟类学实验室、科罗拉多州立大学和麻省大学阿默斯特分校之间的合作项目,利用机器学习和雷达数据来预测鸟类迁徙。 该项目展示了人工智能通过增强对生态系统健康和迁徙模式的理解来彻底改变鸟类学的潜力。
Roblox 发布实时人工智能聊天翻译器
https://www.theverge.com/2024/2/5/24061495/roblox-generative-ai-chat-translator
Roblox 开发了一种人工智能模型,能够实时翻译 16 种语言的文本聊天内容,通过打破语言障碍来增强用户参与度。 它在专家混合架构中利用基于变压器的大型语言模型,以有效利用资源,同时维护隐私和安全流程。