头条
DeepMind 的 AI 数学发现
https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/
DeepMind 在《自然》杂志上发表了一篇关于 FunSearch 的论文,该论文利用大型语言模型引导的函数搜索来解决数学和计算机科学中的开放问题。它解决了帽子集问题,并发现了迄今为止一些最大的帽子集。
OpenAI 超级对齐补助金
https://openai.com/blog/superalignment-fast-grants
OpenAI 正在发放一系列补助金,用于支持希望研究超级对齐的学生和研究人员。申请截止日期为 2 月 18 日。
Fast AI 创始人启动新的盈利性研究实验室
https://www.answer.ai/posts/2023-12-12-launch.html
Answer AI 是一个新的实验室,它的目标不是构建新模型,而是试图找出现有模型的真正有生产力和有价值的用途。它旨在为组织机构进行基础研究,以帮助他们发掘 AI 支持的用例。
研究
从弱到强的泛化
https://openai.com/research/weak-to-strong-generalization
来自 OpenAI 超级对齐团队的这一新成果(附带代码)表明,你可以使用更弱的监督模型来引导或对齐一个更强大的模型,这类似于弱小的人类对齐超级智能模型。他们使用 GPT-2 恢复了 GPT-4 的大部分对齐性能。他们指出的一个重要点是,这种方法有一个可行的路径,可以实现显著改进,这与 RLHF 类方法不同。
利用大型语言模型更好地理解 3D 场景
https://arxiv.org/abs/2312.08168v1
这种新的研究方法引入了大型语言模型中的对象标识符,以改善对 3D 场景的理解并回答相关问题。这种方法着重于识别场景中的对象并建立它们之间的关系,已经显示出让 AI 更加善于解释复杂空间关系的有希望的结果。
SwitchHead:更高效的变压器模型
https://arxiv.org/abs/2312.07987v2
SwitchHead 是提高 AI 模型效率的一个突破。它减少了变压器的内存和计算需求,同时不损失性能。
工程
2024 年学习生成式 AI 的路线图
https://github.com/krishnaik06/Roadmap-To-Learn-Generative-AI-In-2024
这是一个正在进行的仓库,旨在帮助了解最新创新。它主要面向初学者,包括学习 Python、深度学习和语言建模的资源。
改善 HDR 图像的智能方法(GitHub 仓库)
https://github.com/fengzhang427/LLF-LUT
该研究引入了 LLF-LUT 技术,通过关注重要的图像细节来提高 HDR 照片的质量。
Nous 研究推出的新型多模态模型(Hugging Face Hub)
https://huggingface.co/NousResearch/Obsidian-3B-V0.5
Capybara 是一个新的语言基础模型,而 Obsidian 是多模态扩展。它拥有 30 亿参数,可以在手机等边缘设备上运行。
杂七杂八
为什么 Stability AI 推出订阅费
https://sifted.eu/articles/stability-business-model
AI 领域的竞争已经开始充满了执行不佳的案例。Stability AI 似乎在不断变化的路线图和愿景中摸索,希望保持相关性。一天是开源的,第二天又不是。当你没有一个“东西”时,这肯定是失去一切的方式。
如何看待关于 OpenAI Q* 的传言
https://www.understandingai.org/p/how-to-think-about-the-openai-q-rumors
Q* 不太可能是通往人工通用智能的关键突破,但它可能是迈向具有通用推理能力 AI 的重要一步。
关于 AI 未来的两位巨头(与 Reid Hoffman & Vinod Khosla)
https://www.newcomer.co/p/two-titans-on-the-future-of-ai-with
来自 11 月的 Cerebral Valley AI 峰会的这个播客结合了两次与科技巨头的采访,收集了他们对 AI 未来及其对社会影响的看法。
每日练习以提高 AI/ML 技能(Hacker News 主题)
https://news.ycombinator.com/item?id=38638373
一系列你每天可以做的事情来提高你的 AI 技能。
三星推出其生成式 AI 模型三星高斯
https://www.zdnet.com/article/samsung-unveils-its-generative-ai-model-samsung-gauss/
三星推出了其生成式 AI 模型,三星高斯,它用于提高员工生产力,并将扩展到产品应用。该模型包括语言处理、编码辅助和图像编辑模块。与此同时,三星还专注于数据隐私和安全 AI 使用。
Dover AI 应用排序(网站)
https://www.dover.com/ai-sorting
更快速地审查工作申请。