头条
Apple 发布 OpenELM
Apple 发布了 OpenELM,这是一个由 8 个开源 LLM 组成的系列,旨在在单个设备上高效运行,用于参数大小从 2.7 亿到 30 亿不等的文本生成任务。
Eric Schmidt 支持的 Augment(GitHub Copilot 竞争对手)以 2.52 亿美元秘密推出
人工智能驱动的编码平台 Augment 已经秘密启动,融资 2.52 亿美元,该公司估值接近 9.77 亿美元。该平台由前微软开发人员 Igor Ostrovsky 创建,旨在利用先进的人工智能模型提高软件质量和生产力。 Augment 计划提供标准 SaaS 订阅,并预计在今年晚些时候正式发布之前公布定价细节。
Sakana 发布日本形象模特
Sakana AI 的 EvoSDXL-JP 是一种针对日语提示进行优化的高速图像生成模型,采用进化模型合并方法。与现有模型相比,EvoSDXL-JP 的推理速度快十倍,性能优越。它非常适合在日本用于教育用途,以展示生成式人工智能的优势。
研究
探针捕获潜伏特工
Sleeper Agent 是经过训练的语言模型,可在收到一组特定的唤醒词提示时执行恶意操作。用简单的线性头和提示“你要做一些危险的事情吗?”来探索语言模型。可以极其可靠地检测这些先前隐藏的恶意行为者。
实时角色控制
引入了角色控制框架,该框架利用运动扩散概率模型来生成各种高质量动画,这些动画可立即响应动态用户命令。
基于扩散的超分辨率
CutDiffusion 是一种新方法,可以转换低分辨率扩散模型以满足高分辨率需求,而无需传统调整的复杂性。
工程
BitBLAS:针对 1.58 位网络优化的内核 (GitHub Repo)
微软发布了一组 GPU 加速内核,用于训练 BitNet 风格的模型。这些模型的内存成本显着降低,而准确性却没有太大下降。
CoreNet (GitHub Repo)
Apple 发布了一个神经网络训练库以及一组名为 OpenELM 的模型,这些模型针对在设备上运行进行了优化。
MaxText (GitHub Repo)
MaxText 是一种高性能、高度可扩展的开源LLM,用纯 Python/Jax 编写,针对 Google Cloud TPU 和 GPU 进行训练和推理。
杂七杂八
人工智能史上最盛大的开源周
2024 年 3 月的最后一周标志着开源大型语言模型 (LLM) 的重要时刻,发布了多个值得注意的版本,包括 Databricks 的 DBRX、A21 Labs 的 Jamba 和 SambaNova Systems 的 Samba-CoE。这些发布标志着可访问和去中心化人工智能模型多样化和扩散的关键时刻。这一趋势反映出开源LLM与闭源LLM之间的绩效差距正在缩小,这表明人工智能创新和企业采用的未来充满活力。
生成式人工智能进入 CRISPR 基因编辑世界
伯克利初创公司 Profluu 使用生成式人工智能技术创建基于 CRISPR 的新基因编辑器。该公司已经使用一种人工智能生成的基因编辑器来编辑人类 DNA,但尚未将其中任何一种进行临床试验。虽然 Profluence 计划开源其人工智能技术生成的基因编辑器,但它不会开源人工智能技术本身。该项目是构建改善医疗保健的人工智能技术的更广泛努力的一部分。
FlexAI 推出以提供通用人工智能计算
FlexAI 获得了由 Alpha Intelligence Capital、Elaia Partners 和 Heartcore Capital 领投的 3000 万美元种子资金。该公司正在重新架构计算基础设施,以提供通用人工智能计算:推动人工智能进步所需的有效且无缝的基础设施。 FlexAI 的云服务将于今年晚些时候推出,使开发人员能够利用异构计算架构来可靠、高效地构建和训练人工智能应用程序。
谷歌将为 Galaxy S25 及时更新 Gemini Nano
明年 Galaxy S25 推出时,谷歌将推出 Gemini Nano 的“第 2 版”。
PhoneScreen.AI (Product)
让人工智能为您呼叫、筛选和排名您的候选人。
Cohere 开源了他们的聊天界面 (GitHub Repo)
Cohere 发布了一个聊天界面,其中包含许多用于构建基于人工智能的聊天应用程序的出色功能。