头条
Claude 3.5 Haiku
https://www.anthropic.com/claude/haiku
Claude 3.5 Haiku 比 GPT-4o 稍差,没有视觉功能,但相对于其他同等质量的模型,它仍然非常智能且价格便宜。
谷歌 10 月宣布的 7 项 AI 新闻
https://blog.google/technology/ai/google-ai-updates-october-2024/
本文回顾了 10 月份的七项 AI 更新,涵盖了 Google Maps 最大的 AI 更新、NotebookLM 入门技巧以及人们可以提出问题、搜索信息和获取 AI 概览的更多方式。
Meta 的 AI 丰富性
https://stratechery.com/2024/metas-ai-abundance/
Meta 具有独特的优势,可以利用生成式 AI,尤其是在数字广告领域。该公司对 AI 的投资(包括其 Llama 模型)将支持创新广告策略,如生成式广告和 AI 驱动的聊天代理,通过利用机器学习来增强广告定位和效率,有可能增加需求和收入。Meta 专注于在其平台上集成 AI,这凸显了其致力于在快速发展的 AI 领域保持竞争优势的承诺。
研究
PII 检测模型
https://gretel.ai/blog/gliner-models-for-pii-detection
GLINER 模型和数据集是可用于合成数据的合成数据集。
用于图像生成的随机自回归建模
https://arxiv.org/abs/2411.00776v1
本研究引入了用于图像生成的随机自回归 (RAR) 建模,该建模在 ImageNet-256 基准上取得了最先进的结果,FID 得分高达 1.48。
具有内置可解释性的模型
https://arxiv.org/abs/2411.00715v1
“B-cosification”是一种适应现有预训练模型的方法,可为其预测提供高度可解释的解释。
工程
Hertz Dev:开源语音转语音
https://github.com/Standard-Intelligence/hertz-dev
非常令人印象深刻的开放版本,已获得许可。它经过训练,可以从各种输入模式生成人类语音。代码质量很高,并且在编码器和解码器架构方面有一些有趣的花絮。
无线电传播建模
https://github.com/jeertmans/DiffeRT
该项目提出了一种新颖的机器学习辅助射线追踪方法,用于无线电传播建模,旨在克服传统方法的高计算要求。
图形标记化
https://arxiv.org/abs/2410.13798v1
GQT(图形量化标记器)是一种用于几何深度学习中图形数据的新型标记器。
杂七杂八
AI 服务浪潮:Palantir 在 AI 新时代的经验教训
https://www.8vc.com/resources/the-ai-services-wave-lessons-from-palantir-in-the-new-age-of-ai
AI 正在重塑服务业,Palantir 等公司通过将 AI 与运营相结合来提高可扩展性和效率,处于领先地位。初创公司正在利用 AI 来自动化和改进传统复杂流程,创造重大价值并转变商业模式。重点是开发 AI 驱动的“技术服务”,将软件功能与人类专业知识相结合,以获得更好的结果并提高市场竞争力。
Sapien 获得由 General Catalyst 领投的 870 万美元种子轮融资
https://www.getsapien.com/blog-posts/sapien-raises-8-7m-seed-led-by-general-catalyst
Sapien 正在开发人工智能驱动的财务分析工具,将复杂、易出错的任务转化为快速洞察,彻底改变 CFO 角色。该平台整合来自不同来源的数据,提供动态和情境感知分析,旨在消除财务流程中的人为错误。该公司最近筹集了 870 万美元的资金。Sapien 计划扩展和增强其人工智能能力,为各个行业的财务团队提供支持。
我如何使用 Cursor 编写代码
https://www.arguingwithalgorithms.com/posts/cursor-review.html
Cursor 是 VS Code 的一个分支,它集成了 LLM 支持的功能,如制表符补全和聊天界面,通过自动执行样板和重复更改来简化编码任务。虽然制表符补全高效且快速,但也存在潜在的缺陷,例如偶尔会出现错误的建议。该工具鼓励新的工作流模式,减少对样板库的依赖,并帮助在陌生的语言或框架之间更快地进行迭代。
ElevenLabs 聘请了阅读器应用 Omnivore 背后的团队
https://techcrunch.com/2024/10/29/elevenlabs-has-hired-the-team-behind-omnivore-a-reader-app/
ElevenLabs 收购了 Omnivore 团队,以增强其 AI 驱动的阅读应用 ElevenReader。
LinkedIn 推出首款 AI 代理,担任招聘人员的角色
LinkedIn 的“招聘助理”是一款旨在简化招聘人员招聘任务的 AI 工具。
Anthropic 的 Claude AI 聊天机器人现在有桌面应用程序
https://www.theverge.com/2024/10/31/24284742/claude-ai-macos-windows-desktop-app
Anthropic 已在 Mac 和 Windows 上为其 AI 聊天机器人 Claude 发布了一款桌面应用程序。
Meta 正在制造一只可以“感受”触摸的机械手
https://techcrunch.com/2024/10/31/meta-is-making-a-robot-hand-that-can-feel-touch/
Meta 正在与 GelSight 和 Wonik Robotics 合作,将先进的触觉传感器商业化,用于 AI 研究。