头条
OpenAI 发布 GPT-4
终于来了! GPT-4 是其前身的更智能、更安全、更强大的版本。 GPT-4 更安全、更一致,但仍有局限性。根据内部评估,与 GPT-3.5 相比,它响应不允许内容请求的可能性降低 82%,产生事实响应的可能性提高 40%。 Duolingo、Khan Academy 和 Stripe 等公司已经在使用这项服务。此外,昨天的时事通讯更正:之前关于 GPT-4 将包括文本到视频功能的传言实际上是不正确的。 GPT-4 尚未实现视频等多模式输出的飞跃,但它可以将视频和文本作为输入!
谷歌推出新的 PaLM API 和 MakerSuite 工具
谷歌宣布推出 PaLM API,这是一种新产品,允许开发人员以安全、简单的方式试验大型语言模型。除了 API,他们还发布了 MakerSuite,该工具使开发人员能够快速轻松地制作生成式 AI 应用程序的原型。这些工具将通过私人预览版提供给选定的开发人员,预计随后会有候补名单。该公告标志着谷歌致力于让 AI 易于访问并授权开发人员构建下一代应用程序。
Anthropic 公司发布 Claude
OpenAI 的主要竞争对手之一 Anthropic 推出了 Claude,这是 ChatGPT 的聊天机器人竞争对手。 Anthropic 由前 OpenAI 员工共同创立。可以指示 Claude 执行一系列任务,包括跨文档搜索、总结、写作和编码,以及回答有关特定主题的问题。但 Anthropic 认为,与 OpenAI 的 ChatGPT 相比,克劳德“产生有害输出的可能性要小得多”、“更容易交谈”和“更易于操纵”。
研究
新的预训练范例提高了语言模型的能力
本文提出了一种新的预训练范式,可以提高训练数据的效率和语言模型在填充任务中的能力。该范例包括一个双向训练目标,该目标对齐从左到右和从右到左 LM 的预测,以及一个双向推理过程。该方法在编程和自然语言模型上进行了评估,并且优于强大的基线。
通过Prompt进行模型调整:提高 NLP 中的对抗鲁棒性
MVP 方法在对抗性鲁棒性方面表现出惊人的进步,对抗性词级同义词替换的性能比标准方法平均提高 8%,甚至比最先进的防御方法高出 3.5%。通过使用提示模板修改输入而不是通过附加 MLP 头来修改模型,MVP 在下游任务中取得了更好的结果,同时保持了清晰的准确性。
工程
UniDiffuser:用于多模态数据分布拟合的统一扩散框架
UniDiffuser 是一个框架,用于在一个模型中拟合与多模态数据相关的所有分布。它通过统一边际分布、条件分布和联合分布的扩散模型来实现这一点。 UniDiffuser 能够执行图像、文本、文本到图像、图像到文本和图像文本对生成,并具有高质量的结果和有竞争力的量化分数。
UniDiffuser (GitHub Repo)
UniDiffuser 是一个统一的扩散框架,用于在一个模型中拟合与一组多模态数据相关的所有分布。
Writeout.ai (GitHub Repo)
Writeout.ai 使用 OpenAI 的 Whisper API 翻译音频文件。
杂七杂八
康奈尔大学应用机器学习 (在线课程)
这个开放的在线课程是对机器学习 (ML) 领域的广泛介绍,基于 Cornell Tech 的 CS 5785。它涵盖了机器学习算法(线性回归、核方法、神经网络等)、它们的数学基础及其实现。我们很高兴向所有人开放这些材料,并欢迎您参加本课程。
Wonder Dynamics 发布 Wonder Studio
Wonder Studio 是一种 AI 工具,可以自动将 CG 角色制作动画、打光并将其合成到真人场景中。将其视为浏览器中的 VFX Studio。
微软解雇了其中一个 responsible AI 团队
Platformer 获悉,微软解雇了人工智能组织内的整个道德和社会团队,作为最近裁员的一部分,影响了整个公司的 10,000 名员工。现任和前任员工表示,此举让微软没有专门的团队来确保其 AI 原则与产品设计紧密相关,而此时该公司正带头向主流提供 AI 工具。
谷歌宣布 Workspace 的新 AI 功能
谷歌为其各种工作区应用程序引入了一套即将推出的生成人工智能功能,包括谷歌文档、Gmail、表格和幻灯片。
摩根士丹利为其财务顾问测试基于 OpenAI 的聊天机器人
摩根士丹利现在正在使用聊天机器人来帮助银行的财务顾问。
无限错误信息的时代已经到来
在本文中,加里·马库斯 (Gary Marcus) 论证了不良行为者可以利用大型语言模型以前所未有的规模制造谎言。