头条
DBRX MoE
Databrix 和 Mosaic 训练了一个 132B 参数 MoE 模型,性能令人印象深刻。 他们在 3,000 台 H100 上训练了模型并发布了权重。 该模型也可在 Databricks API 上使用。
亚马逊又向 Anthropic 投资 $2.75B
亚马逊最终向 Anthropic 投资 40 亿美元,这是其迄今为止最大的风险投资。
为什么人工智能搜索引擎真的无法杀死谷歌
新兴的人工智能驱动的搜索工具通过提供直接和探索性的答案来挑战谷歌,但难以匹配其速度、多样化的功能和高效的数据呈现,这凸显了用人工智能取代传统搜索的复杂性。
研究
二分搜索向量
搜索嵌入向量是 RAG 管道的关键。 如果将 fp32 数字替换为单个 0 或 1,然后使用 KNN 聚类器和重新排序器,则可以在保持性能的同时将内存需求减少 30 倍。
Deepfake技术及检测方法
这项全面的调查深入探讨了 Deepfake 技术及其检测的进步和挑战,突出了 Deepfake 创造者与开发技术来发现它们之间的军备竞赛。
音频驱动动画
AniPortrait 是一个旨在从单个参考图像和音频输入创建逼真的动画肖像的框架。 通过将音频转换为 3D 表示,然后将其映射到 2D 面部标志,该方法生成的动画在自然面部表情、各种姿势和高视觉质量方面表现出色。
工程
通过玩《街头霸王》来衡量LLM的基准 (GitHub Repo)
LLM非常有用,因为它们快速、准确且遵循指示。 这种组合使得带有文本输入的街头霸王模拟器成为找出哪些模型擅长这三个标准的绝佳方法。
具有文本和姿势条件的图像生成
AID 及其变体 PAID 是两种旨在通过合并文本和姿势等条件来改进图像插值的技术。 这些方法可确保生成的图像具有增强的一致性、平滑度和保真度,而无需额外的培训。
无需额外训练即可提高模型效率
OPTIN 框架引入了一种新颖的方法来提高跨各个领域的基于 Transformer 的 AI 模型的效率,而无需重新训练。 通过使用一种称为中间特征蒸馏的技术,OPTIN 可以在特定约束下压缩网络,同时几乎不影响准确性。
杂七杂八
控制人工智能的阴暗全球战争的内部
世界正在努力应对监管人工智能的挑战。 全球领导人、技术高管和政策制定者参加的一系列备受瞩目的会议和大会暴露了在如何控制这一变革性技术方面存在分歧和缺乏共识。
根据您自己的数据构建评估管道
定期发布的新模型声称在标准基准上是最先进的。 根据您自己的任务和数据来衡量这些模型非常重要。 Superpipe 是一种帮助根据您的数据构建这些评估管道的工具。
黑客可以读取人工智能助手的私人聊天记录,即使它们是加密的
研究人员发现了一种侧信道攻击,可以通过利用加密中的令牌传输来高精度破译特定主题的加密人工智能助手聊天。 该攻击利用大型语言模型将令牌序列重建为可读文本,可能会暴露敏感的用户对话。 除 Google Gemini 之外的主要人工智能助手都容易受到这种方法的影响,促使提供商寻求缓解策略。
OpenAI开始测试GPT收益分享
OpenAI 正在与一小部分美国建筑商合作,测试基于使用情况的 GPT 收入。
Nvidia 在 MLPerf 推理测试中名列前茅
Nvidia 的 GPU,尤其是 H200,在 MLPerf 的推理基准测试中处于领先地位。