头条
LangChain 筹集了 1000 万美元的种子资金
LangChain 于去年 10 月推出,是一个用于组合模型的开源工具包。它们使使用工具、调用 API 和利用强大的预训练生成模型变得容易。他们正在筹集资金,以帮助更好地实现安全、检索和集成到更广泛的 ML 生态系统的目标。
PaLM API 和 MakerSuite:一种开始原型设计和构建生成式 AI 应用程序的平易近人的方式
谷歌通过提供易于使用的 API 和工具(例如新发布的 PaLM API 和 MakerSuite),使开发人员能够使用生成式 AI 构建下一代应用程序。这些工具将通过 Private Preview 提供给选定的开发人员,从而可以轻松安全地试验 Google 的大型语言模型。
Daniel Gross 和 Nat Friedman 关于 AI 产品革命的访谈
Ben Thompson 曾在去年 10 月和 12 月采访过 Daniel Gross 和 Nat Friedman。在第一次采访中,他们讨论了尽管 GPT-3 等模型具有先进的功能,但 AI 产品的可用性有限。在 12 月的后续采访中,谈话在 ChatGPT 出现后发生了变化。现在,三个月后,汤普森计划赶上格罗斯和弗里德曼,讨论最近出现的人工智能产品。
研究
数据越多越好,即使对于机器人也是如此
一个有趣的悖论是 Moravec 的悖论,它本质上说让计算机做知识工作很容易,但简单的操作很难。这项工作是改进机器人移动操作的重要一步。他们训练了一个 Visual Cortex 模型(开源),可以处理 17 种不同的具有挑战性的任务表示。然后,他们在波士顿动力机器人上进行了一些巧妙的模拟训练和现实世界的适应,该机器人在导航陌生房屋、寻找物体并将它们移动到目标位置方面取得了令人印象深刻的成功。如果说有什么不同的话,那就是从语言模型的泛滥中解脱出来。
RLHF 如何改变Transformers的内部工作原理?
一直以来,可解释性领域研究神经网络的内部运作,试图找出哪些部分对应于哪种行为。 尽管这种效果可能无法扩展到功能更强大的模型,RLHF 似乎极大地改变了模型的行为。 “正在发生什么变化?”这一主要问题仍未得到解答。这篇博文是对经过训练生成负面电影评论的小型 GPT 样式模型的有趣探索。他们发现模型的一小部分是造成新行为的原因。
另一个 llama 模型加入竞争
与斯坦福大学的Alpaca 类似,Koala 接受了对话和指令数据的训练。然而,他们没有使用 OpenAI 模型的蒸馏,而是从网络上免费提供的资源中获取数据。他们的模型实际上似乎可以与强大的闭源模型相媲美,并且可以与数据集一起微调代码以供进一步研究。
工程
跟随你的姿势:使用无姿势视频生成文本到视频
本文提出了一种两阶段训练方案,用于生成文本可编辑和姿势可控的角色视频,使用易于获得的数据集和预训练的文本到图像模型。该方法成功生成了姿势可控的角色视频,并保留了预训练模型的编辑能力。
快速实时视频增强
ReBotNet 是一种视频模型,旨在实时增强直播流和视频会议。他们使用双分支网络学习不同类型的视频抽象,例如基于位置和时间的视频抽象。然后他们使用一个通用的解码器网络来输出增强的帧。它以 50 fps 的速度运行,使用大约 5GB 的内存,并且性能与比它大 8 倍的模型相当。
Babyagi (GitHub Repo)
Babyagi 是一个 Python AI 驱动的任务管理系统
杂七杂八
AI in 14 Charts
在 14 张图表中了解 AI 进展。
斯坦福 386 页 AI 报告的要点
本文深入探讨了斯坦福大学大量 AI 报告中的一些高级要点。以下是一些要点:在过去的十年中,人工智能的发展已经从学术界主导转变为行业主导,而且幅度很大,而且没有任何改变的迹象。在传统基准测试模型变得越来越困难,这里可能需要一种新的范例。人工智能训练和使用的能源足迹越来越可观,但我们还没有看到它如何在其他地方提高效率。
拜登会见顾问讨论人工智能
拜登总统将与总统科学技术顾问委员会(PCAST)的科学顾问会面,讨论人工智能的“风险和机遇”。
亚马逊为生成式人工智能公司推出创业加速器
亚马逊为构建生成式 AI 技术的公司推出了新的加速器。
Expedia 集成 GPT-4
Expedia 集成了 GPT-4 以协助旅行规划。
Rask - 人工智能视频本地化和配音应用
Rask AI 是一种一站式本地化工具,允许内容创作者高效地将他们的视频翻译成 60 多种语言。借助“文字转语音”和“语音克隆”技术,您可以在不聘请配音演员的情况下为视频添加类人画外音。