头条
Anthropic 提示库
https://docs.anthropic.com/claude/prompt-library
Claude 3的发布颇受欢迎,但这些型号的提示风格略有不同。 Anthropic 收集了一组适用于各种任务和主题的用户提示。
苹果研究人员在多模态人工智能方面取得突破
https://venturebeat.com/ai/apple-researchers-achieve-breakthroughs-in-multimodal-ai-as-company-ramps-up-investments/
苹果研究人员开发了在文本和图像上训练大型语言模型的方法,从而在多模式人工智能任务中实现最先进的性能。
Stability AI 发布 Stable Video 3D
https://stability.ai/news/introducing-stable-video-3d
Stable Video 3D 建立在 Stable Video 之上,可以从单个图像生成 3D 模型。 它的性能优于Stable Zero 123 和其他方法。 Stability AI 会员可将权重用于研究目的和商业用途。
研究
使用自注意力机制预测下一个标记的机制
https://arxiv.org/abs/2403.08081
下一个令牌预测是一个导致复杂行为的简单目标。 这项工作发现,通过梯度下降训练的单个自注意力层将问题分解为硬检索和软组合,从而实现了上下文学习和强大的整体性能。
使用 Visual Transformer 增强对象检测
https://arxiv.org/abs/2403.09313v1
YOLOX-ViT 通过集成视觉变换器和知识蒸馏,引入了一种水下机器人中物体检测的新方法。
使用 16 个不同的分词器预训练同一模型
https://github.com/alasdairforsythe/tokenmonster/blob/main/benchmark/pretrain.md
现代语言建模的一个奇怪的事实是,我们在训练模型之前首先训练分词器。 第二个奇怪的事实是,词汇量的大小在大范围内似乎并不那么重要。
工程
LLM4Decompile (GitHub Repo)
https://github.com/albertan017/LLM4Decompile
使用大型语言模型反编译二进制代码。
3D 场景理解 (GitHub Repo)
https://github.com/dvlab-research/groupcontrast
GroupContrast 通过将分段分组与语义感知对比学习相结合,重新定义了自监督 3D 表示学习。
跨不同频谱的对象识别 (GitHub Repo)
https://github.com/924973292/editor
该项目引入了一种新方法,用于识别来自 RGB、近红外和热成像等各种光谱的图像中的物体,重点关注以物体为中心的信息,以克服背景噪声并提高识别精度。
杂七杂八
船长日志:提示人工智能的不可简化的怪异
https://www.oneusefulthing.org/p/captains-log-the-irreducible-weirdness
一个新的配套网站“更多有用的东西”提供了大量免费的人工智能和机器学习资源,强调了人工智能生成的提示(例如富有想象力的场景)在解决数学问题等任务中可以超越人工提示的奇特而有效的方式。 该实验强调了添加上下文、小样本学习和思维链技术以获得更一致的提示结果的重要性。 随着人工智能模型的进步,随着人工智能在推断用户意图方面的进步,提示作为一项技能可能变得不再那么重要,但目前,结构化提示仍然是一种不断发展的艺术,具有巨大的潜在好处。
AI 提示工程已死
https://spectrum.ieee.org/prompt-engineering-is-dead
最近的研究表明,随着人工智能和机器学习模型越来越优化自己的提示,人类提示工程师可能会被淘汰。 算法生成的提示可能很奇怪但很有效,其性能优于人工生成的提示,并显着缩短优化时间。 虽然自动调整的提示显示出希望,但专家认为,对提示相关工作的需求将不断发展而不是消失,可能会出现 LLMOps(大型语言模型操作)等新职位。
谷歌研究人员推出了一种可以让静态视频栩栩如生的人工智能
https://venturebeat.com/ai/google-researchers-unveil-vlogger-an-ai-that-can-bring-still-photos-to-life/
VLOGGER 是谷歌研究人员创建的人工智能,可以根据单张照片生成人们说话和动作的逼真视频。
微软已将 GPT-4 Turbo LLM 添加到免费版本的 Copilot 中
https://www.neowin.net/news/microsoft-has-added-the-gpt-4-turbo-llm-to-the-free-version-of-copilot/
Copilot Pro 用户仍然可以选择旧型号,他们还可以访问 Copilot GPT Builder,无需编程专业知识即可创建自定义聊天机器人。
韩国研究人员用新的神经人工智能芯片让英伟达羞愧
https://www.tomshardware.com/tech-industry/artificial-intelligence/korean-researchers-power-shame-nvidia-with-new-neural-ai-chip-claim-625-times-less-power-41-times-smaller
KAIST 研究人员开发了 C-Transformer,这是一款适用于大型语言模型的超低功耗 AI 芯片,与 Nvidia 的 A100 GPU 相比,其能效显着提高。