头条
Alpaca:一个强大的开源指令跟随模型
GPT-3.5 (text-davinci-003)、ChatGPT、Claude 和 Bing Chat 等指令跟随模型变得越来越强大。然而,指令遵循模型仍然存在许多缺陷:它们会产生虚假信息、传播社会刻板印象并产生有毒语言。为了在解决这些紧迫问题方面取得最大进展,学术界的参与很重要。 Alpaca 是从 LLaMA 7B 模型在 52K 指令跟随演示中微调的模型。
一起发布 OpenChatKit
OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。 OpenChatKit 是 OpenAI 的 ChatGPT 的 Together 版本。该模型的所有权重、代码和训练数据均可在线获得。它甚至接受了 100% 负碳计算的训练。
Grammarly 推出生成式 AI 产品 GrammarlyGO
语法检查工具 Grammarly 宣布支持生成式 AI 工具,该工具可以按照您的个人写作风格编写内容。 “GrammarlyGO”将在未来几个月推出,是一款生成式人工智能产品,旨在“提高人们写作时的生产力”。与 ChatGPT 一样,GrammarlyGO 能够根据简短提示创建文本,不过 Grammarly 的特殊技巧是生成的内容会复制您通常的写作风格
研究
詹森不等式
对于应用数学家和机器学习从业者来说,这是一个非常有用的不等式。这篇文章探讨了这种经常倒退但有用的不平等现象。如果您希望了解更多 ML 背后的数学知识,那么这篇文章值得一读。
StyleGANEX:使用扩张卷积重新缩放 StyleGAN 以实现稳健的未对齐面部操作
本文针对 StyleGAN 的局限性提出了一种解决方案,该局限性仅限于以固定图像分辨率裁剪对齐的人脸。该解决方案涉及使用扩张卷积在不改变模型参数的情况下重新调整 StyleGAN 中浅层的感受野,从而产生可以适应可变分辨率并更好地表征未对齐面孔的特征。此外,该论文还介绍了一种编码器,它提供了扩展 StyleGAN 的第一层特征,并验证了该方法在各种面部操作任务中的有效性,包括超分辨率、面部属性编辑、草图/面具到面部转换,以及脸部美白。
MVImgNet:多视图图像的大规模数据集
作者介绍了 MVImgNet,这是一个用于 3D 视觉的大规模多视图图像数据集。它包含来自真实世界对象的 650 万帧,弥合了 2D 和 3D 视觉之间的差距。还介绍了 3D 对象点云数据集 MVPNet。
工程
Hyper light speed GPT (GitHub Repo)
基于 NanoGPT 存储库,此代码可以在短短 3 分钟内将仅解码器的 Transformer 模型训练到一定程度的合理困惑度。它旨在易于理解、易于破解,并且可以快速收敛,供研究人员探索他们的想法。
Guardrails (GitHub Repo)
Guardrails 是一个 Python 包,允许用户为 LLM 的输出添加结构、类型和质量保证。
Whisperboard (GitHub Repo)
Whisperboard 是一款基于 OpenAI 的 Whisper 模型的 iOS 应用程序,用于随时随地录制和转录音频。
杂七杂八
人工智能错位的热点理论
许多机器学习研究人员担心构建人工智能的风险。一种流行的 AI 风险集中在 AGI 失调上。它假定我们将构建一个超级智能、超级能力的 AI,但 AI 的目标将被错误指定并且与人类价值观不一致。如果人工智能足够强大,并且足够不灵活地追求其目标,那么即使是细微的偏差也可能对人类构成生存风险。
GPT-4 升级将包括文本转视频
微软德国 CTO Andreas Braun 表示,OpenAI 即将进行的 GPT-4 升级将允许用户将文本转换为视频。 Braun 补充说,更强大的人工智能将在本周推出,结束对其发布的猜测。 “我们将在下周推出 GPT-4,在那里我们将拥有提供完全不同可能性的多模态模型——例如,视频,”布劳恩说。
人工智能可以预测下一次粮食危机
一项新的研究表明,人工智能能够在世界各地爆发粮食不安全事件之前就更好地识别它们。
通用汽车计划让您通过 ChatGPT 与汽车交谈
微软和通用汽车之间的一项新合作将使 ChatGPT 聊天机器人能够被添加到通用汽车的汽车中
ChatGPTNet (GitHub Repo)
ChatGPTNet 是 .NET 的 ChatGPT 集成库