头条
年度人工智能市场状况地图
https://mattturck.com/mad2024/
深入分析人工智能领域的公司状况和解决方案。 有超过两千家公司致力于解决各种人工智能问题。 这篇文章还探讨了开源、包装器、资金等等。
微软正在开发 Xbox AI 聊天机器人
https://www.theverge.com/2024/4/2/24118728/microsoft-xbox-ai-chatbot-testing
微软正在测试一款新的人工智能驱动的 Xbox 聊天机器人,旨在自动执行支持任务,扩大其测试池,并将该机器人与 Xbox 的支持文档集成,以回答查询和处理游戏退款。
Sam Altman 不再拥有 OpenAI 启动基金
https://techcrunch.com/2024/04/01/sam-altman-gives-up-control-of-openai-startup-fund-resolving-unusual-corporate-venture-structure/
OpenAI 首席执行官 Sam Altman 已将 OpenAI 企业风险基金 OpenAI Startup Fund 的控制权移交给 Ian Hathaway,后者于 2021 年加入 OpenAI,并在管理 Startup Fund 方面发挥了关键作用。
研究
工业文档 OCR 数据集
https://huggingface.co/datasets/pixparse/idl-wds
包含 2600 万页和 18B 标记的巨大数据集,是工业 PDF 文档的高质量 OCR 数据集。
许多人拍摄越狱
https://www.anthropic.com/research/many-shot-jailbreaking
Anthropic 开发了一种越狱长上下文模型的技术。 它已与其他组织分享这些发现并实施缓解措施。 这篇文章概述了该技术以及它为防御该技术所做的一些事情。
高效的视频理解
https://arxiv.org/abs/2404.00801
研究人员开发了 R2-Tuning,通过根据口头提示识别特定时刻来理解视频。
工程
工业文档 OCR 数据集 (GitHub Repo)
https://github.com/princeton-nlp/SWE-agent
包含 2600 万页和 18B 标记的巨大数据集,是工业 PDF 文档的高质量 OCR 数据集。
Chug dataset loader (GitHub Repo)
https://github.com/huggingface/chug
Anthropic 开发了一种越狱长上下文模型的技术。 它已与其他组织分享这些发现并实施缓解措施。 这篇文章概述了该技术以及它为防御该技术所做的一些事情。
高效的视频理解
https://draw-and-understand.github.io/
研究人员开发了 R2-Tuning,通过根据口头提示识别特定时刻来理解视频。
杂七杂八
构建人工智能模型比您想象的更快、更便宜
https://www.ycombinator.com/blog/building-ai-models
YC 公司在 YC 的支持下通过训练或微调自己的基础模型来挑战构建人工智能模型需要大量资源的观念,在短短三个月内实现了生成专业音乐和设计新颖蛋白质等非凡成就。 这 25 家初创公司利用 YC 的资金和技术资源,在各个领域开发了创新的人工智能解决方案,表明凭借创造力和战略洞察力,较小的团队也可以实现人工智能的重大进步。
生成科幻小说:AI 版本中的市场
https://lsvp.com/stories/generative-sf-marketplaces-in-ai-edition/
在本文中,Instacart 和 Faire 的领导者讨论了生成式 AI 如何增强他们的 B2B 和 B2C 市场、改进内部工作流程以及个性化的客户交互。 他们强调了人工智能在加速关键任务、提高生产力和提高运营效率方面的作用。 两家公司都强调,虽然人工智能工具具有变革性,但核心业务原则保持不变。
用于预训练模型的大规模合成数据
https://huggingface.co/blog/cosmopedia
HuggingFace 团队展示了如何为语言模型预训练播种、合成、过滤和扩展合成数据创建。
AutoQuant 笔记本 (Colab Notebook)
https://colab.research.google.com/drive/1b6nqC7UZVt8bx4MksX7s656GXPM-eWw4
该笔记本可以将 HuggingFace 模型导出为 5 种不同的量化格式:GGUF、GPTQ、EXL2、AWQ 和 HQQ。
三星可能会通过 Galaxy AI“重新定义”Bixby
https://9to5google.com/2024/04/02/samsung-bixby-galaxy-ai-report/
三星正在考虑升级其语音助手 Bixby,融入类似于 Galaxy S24 系列上的 Galaxy AI 功能的生成式 AI 技术。
Replit 推出新产品争夺人工智能编码助手
https://www.semafor.com/article/04/02/2024/replit-launches-new-product-in-race-for-ai-coding-assistants
Replit 正在推出 Replit Teams,这是一款新工具,允许开发人员与自动修复编码错误的 AI 代理在软件项目上进行实时协作。