2024-10-11 简讯 : Anthropic 的批处理 API


头条


Anthropic 的批处理 API

https://www.anthropic.com/news/message-batches-api

Anthropic 宣布了一个新的批处理 API,使开发人员能够每批发送最多 10,000 个查询。每个批次的处理时间不到 24 小时,成本比标准 API 调用低 50%。这使得处理非时间敏感任务更加高效和具有成本效益。

Hopfield 和 Hinton 获得诺贝尔物理学奖

https://www.nytimes.com/2024/10/08/science/nobel-prize-physics.html

参与创建神经网络的两位科学家获得了诺贝尔物理学奖。

Reflection-70B 的更新

https://glaive.ai/blog/post/reflection-postmortem

对备受欢迎的 Reflection-70B 模型发生的事情进行深入分析。它的基准代码中有错误。其团队已修复这些问题,并且性能仍然令人印象深刻,但尚未达到他们声称的水平。


研究


大规模模型合并的重要性

https://arxiv.org/abs/2410.03617
模型合并是一种将两个模型结合起来并获得每个模型性能的方法。但是,它并不总是能随着模型大小而适当扩展。本文探讨了如何使其与非常大的模型配合良好。

超球面上的规范化表示

https://arxiv.org/abs/2410.01131

规范化语言模型的内部表示是许多资源活动的目标。这项工作表明,如果将每个内部向量放在超球面上,它会大大减少合理大小模型的收敛时间。

CodeMMLU

https://arxiv.org/abs/2410.01999

语言模型在编写代码方面变得如此出色,以至于许多基准测试都已饱和。本文提出了一个更难的基准测试,旨在确定模型在推理和代码生成任务中的表现。


工程


终端中的彩色 logit 打印

https://github.com/swairshah/Intensify
intensify 包是一种很好的方式,可以根据终端的颜色显示 logprobs 或其他实数调制文本。

测量 AI 中的视频质量

https://oooolga.github.io/JEDi.github.io/

JEDi 是一种基于联合嵌入预测架构 (JEPA) 的新指标。它提高了评估准确性,同时需要更少的样本并且更好地与人类评估保持一致,为 FVD 提供了更强大的替代方案。

机器人的位置识别

https://arxiv.org/abs/2410.04939v1

PRFusion 和 PRFusion++ 是多模态模型,旨在提高机器人和计算机视觉中的位置识别能力。


杂七杂八


四足机器人学会爬梯子

https://techcrunch.com/2024/10/02/four-legged-robot-learns-to-climb-ladders/

苏黎世联邦理工学院使用强化学习使 ANYMal 机器人能够以 90% 的成功率爬上梯子。该系统增强了四足机器人在工业环境中的能力,与现有方法相比,爬梯速度提高了 232 倍。这项研究强调了机器人形态和高级控制策略的整合。

数据泄露的三个微妙示例

https://www.lesswrong.com/posts/rzyHbLZHuqHq6KM65/three-subtle-examples-of-data-leakage

本文探讨了机器学习中数据泄露的陷阱,重点介绍了两种因数据处理不当导致模型性能误导的情况。一家公司在建模之前犯了一个错误,根据价格上限过滤数据,而另一家公司则因不遵守严格的时间顺序而面临问题。关键要点包括检测泄漏和了解其对模型准确性的影响的重要性。

真正的数据墙是数十亿年的进化

https://dynomight.substack.com/p/data-wall

随着语言模型对所有可用文本进行训练,人工智能开发面临着“数据墙”带来的潜在挑战。本文反对依赖人类类比来克服数据限制,强调了有助于人类智能的海量数据和进化过程。虽然人类的学习策略可能不直接适用于人工智能,但这并不排除其他模式或算法进步来提高人工智能能力。

Braintrust 筹集 3600 万美元 A 轮融资

https://threadreaderapp.com/thread/1843653246612873701.html
Braintrust 帮助 Airtable、Brex、Notion 和 Stripe 构建 AI 产品,在由 a16z 领投的 A 轮融资中筹集了 3600 万美元。

Hamming

https://hamming.ai/

Hamming AI 为 AI 语音代理带来信任。

Clout Kitchen 为模仿内容创作者的 AI 游戏伙伴筹集 445 万美元

https://venturebeat.com/games/clout-kitchen-raises-4-45m-for-ai-gaming-pal-that-mimics-content-creators/

Clout Kitchen 筹集了 445 万美元的种子资金,用于为英雄联盟开发由 AI 驱动的“后座 AI”伙伴,以流行创作者的声音提供游戏技巧和评论。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341