数据科学简讯 2023-03-17


头条


GPT-4既令人兴奋又令人恐惧

这篇文章讨论了作者通过向 GPT-4 提出各种问题来测试它的经验——帮助解决税务问题、想出一个新词、计划生日派对。作者发现 GPT-4 能够执行更广泛的任务,响应更流畅,并且似乎比其前身有更多的保护措施。 GPT-4 在各种测试中也取得了高分,包括 Uniform Bar Exam 和 Biology Olympiad。虽然这篇文章承认 GPT-4 的积极潜力,但它也讨论了消极的一面——人工智能比人类更聪明的想法、这种技术的伦理影响以及滥用的可能性。此外,昨天新闻通讯的另一个更正:GPT-4 可以将图像和文本作为输入,但不能作为视频。对不起脑放屁!也许我应该让 GPT-4 校对它 :)

Adept AI 在 B 轮融资中筹集了 3.5 亿美元

作为由 General Catalyst 和 Spark Capital 领投的 B 系列的一部分,Adept 已经筹集了 3.5 亿美元的新资金。 Adept 是一个研究和产品 AI 实验室,可为开发人员自动化软件流程。它类似于机器人过程自动化 (RPA),或结合使用自动化、计算机视觉和机器学习来自动执行重复性任务(如填写表格和回复电子邮件)的软件机器人。 Adept 正在通过允许人类和计算机创造性地协作来创造通用智能。

谷歌云为开发者、企业和政府带来了生成式人工智能

谷歌云在 Vertex AI 和 Generative AI App Builder 中推出了 Generative AI 支持,使企业和政府能够访问和定制生成 AI 技术。这些工具允许开发人员使用开箱即用的模板和对 Google 基础模型的 API 访问,快速轻松地创建生成式 AI 应用程序,并完全控制数据使用。此举体现了谷歌云致力于通过 AI 技术赋能团队和变革行业的承诺。


研究


从隐私反馈中强化学习

语言模型经常泄露敏感数据。这对于许多用例来说是不可取的,但由于下一个令牌预测训练目标而很难避免。通过用隐私保护奖励取代 RLHF 中的人类反馈目标,我们能够调整比未经训练的语言模型泄漏更少的语言模型。

UPRISE:用于改进大型语言模型中零样本评估的通用提示检索

本文提出了一种解决方案,以应对可能限制大型语言模型 (LLM) 泛化能力的微调和特定任务提示工程的挑战。所提出的方法 UPRISE 使用轻量级多功能检索器自动检索给定零样本任务输入的提示,并在跨任务和跨模型场景中展示了普遍性。该方法在一组不同的任务上进行了测试,使用一个小的冻结 LLM 在更大的 LLM 上进行调整和测试,并且在 ChatGPT 的实验中被证明可以减轻幻觉问题,这表明即使是最强大的 LLM 也有可能得到改进。

DeepMIM:蒙版图像建模的深度监督

本文介绍了 DeepMIM,这是一种深度监督技术,可显着提高 Vision Transformers 中每一层的表示能力,用于掩模图像建模。结果表明,DeepMIM 加速了模型收敛,扩大了注意力多样性,并在各种下游任务上实现了最先进的性能。


工程


Pip install pytorch 2.0

这个新版本的 pytorch 于 12 月发布,现已稳定且易于安装。有了一系列新功能、速度改进和界面——现在是使用最流行的深度学习框架的激动人心的时刻。

Edit-A-Video:一种用于视频编辑的文本到视频方法

本文介绍了 Edit-A-Video,一种基于文本到视频 (TTV) 模型的视频编辑框架,该模型改编自基于扩散的文本到图像 (TTI) 模型。所提出的框架将 2D 模型膨胀为 3D 模型,并将源视频转换为噪声以使用目标文本提示和注意图注入进行编辑,同时还通过一种新颖的掩码混合方法减轻了背景不一致问题。实验结果表明,与基线相比,所提出的方法在背景一致性、文本对齐和视频编辑质量方面具有优越性。


杂七杂八


Google 与 Gretel 合作将合成数据添加到 Vertex AI 中

Gretel 提供了一个合成数据平台,可以为因数据共享限制或缺乏数据而受阻的企业轻松生成匿名、安全共享和隐私优先的合成数据。使用 Vertex AI 进行 ML 操作的开发人员现在将能够使用合成数据来满足隐私和数据增强要求,从而加速 ML 研发和操作。

Siri、Alexa 和 Google Assistant 是如何输掉人工智能竞赛的

像 Siri、Alexa 和 Google Assistant 这样的虚拟助手有十多年的先机,变得不可或缺。但它们受到笨拙的设计和错误计算的阻碍,为像 ChatGPT 这样的聊天机器人留下了崛起的空间。

以下是减缓或停止 AI 的方法

在这个思想实验中,作者分解了创建 AI 的每个阶段——训练、微调和推理——以及在每个阶段如何减缓 AI 的发展。作者提出的减缓 AI 的想法包括人为干预、GPU 成本、政策变化、法律限制,甚至入侵。

LinkedIn 正在添加 AI 工具

LinkedIn 现在拥有 AI 工具来协助进行个人资料复制和职位描述。

LLaMA-rs (GitHub Repo)

LLaMA-rs 是 LLaMA 的 Rust 端口。

GPT-4-For-Code (GitHub Repo)

这个 GitHub 存储库包含一些令人印象深刻的 GPT-4 编码示例。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容