原文:Microsoft Researchers Claim GPT-4 Is Showing "Sparks" of AGI
“我们相信 GPT-4 的智能标志着计算机科学及其他领域真正的范式转变。”
在 GPT-4 公开发布之后,微软 AI 科学家团队发表了一篇研究论文,声称 OpenAI 语言模型——显示出人类智能或通用人工智能的“火花” (通用人工智能 AGI)。
强调“火花”。研究人员在论文中谨慎地将 GPT-4 的能力描述为“只是迈向一系列日益普遍的智能系统的第一步”,而不是完全孵化的人类级 AI。他们还反复强调了一个事实,即这篇论文是基于 GPT-4 的“早期版本”,他们在“仍在由 OpenAI 积极开发”时研究了它,而不一定是已经被纳入产品的版本.
不过,除了免责声明之外,这些都是一些严肃的声明。虽然很多人,甚至人工智能行业的一些人,都认为 AGI 是一个白日梦,但其他人认为开发 AGI 将迎来人类未来的下一个时代;下一代 GPT-4 是迄今为止 OpenAI 构建的大型语言模型 (LLM) 最强大的迭代,并且在潜在 AGI 竞争者的理论列表中,GPT-4 位于列表的顶部。
“我们认为,”研究人员在昨天发表的论文中写道,“(这个早期版本的)GPT-4 是一组新的 LLM(以及 ChatGPT 和谷歌的 PaLM)的一部分。”
就研究人员的推理而言,他们基本上只是认为 GPT-4 比之前的其他 OpenAI 模型更强大。设计一个在特定考试或任务中表现出色的模型是一回事——构建一个可以完成很多任务并且做得很好的设备,而无需任何特定培训,则是另一回事。他们说,后者才是 GPT-4 真正闪耀的地方。
“我们证明,除了对语言的掌握之外,GPT-4 还可以解决跨越数学、编码、视觉、医学、法律、心理学等领域的新颖而困难的任务,而无需任何特殊提示,”论文中写道。 “此外,在所有这些任务中,GPT-4 的表现都非常接近人类水平,并且常常大大超过 ChatGPT 等先前的模型。”
“鉴于 GPT-4 功能的广度和深度,”他们继续说道,“我们相信它可以合理地被视为人工智能 (AGI) 系统的早期(但仍不完整)版本。”
这些研究人员确实有道理。 GPT-4 当然还有它的缺陷;与其他法学硕士一样,该机器仍然存在幻觉问题,并且在数学方面可能会遇到困难。但不管它的失误如何,该模型确实有一些突出的 - 并且比上一个模型有很大改进 - 技能。例如,GPT-4 是一个特别优秀的应试者,在法律律师考试、LSAT 甚至是认证侍酒师理论考试等众所周知的困难考试中分别取得了第 90、88 和 86 个百分位数——而且,在考试之前没有经历过任何形式的培训。
对比一下:去年年底发布的 GPT-3.5 在所有考试者中得分倒数 10%。二者相比,这是一个巨大的进步。
此外,研究人员声称,他们的研究表明该机器人“克服了一些基本障碍,例如获得许多非语言能力”,同时还“在常识方面取得了巨大进步”——后者是 ChatGPT 的最大障碍之一。
尽管如此,AGI 的论点还有一些警告,研究人员在论文中承认,虽然 GPT-4“在许多任务上达到或超过人类水平”,但它的整体“智能模式绝对不像人类”所以,基本上,即使它确实很出色,它仍然不会像人类那样思考。 (也可以说,考试对机器人更加友好,但我们离题了。)
值得注意的是,自今年早些时候微软与 OpenAI 建立了数十亿美元的合作伙伴关系以来,微软研究人员可能会无意识地或以其他方式炒作 OpenAI 的工作。
正如科学家们还指出的那样,AGI 仍然没有一个坚定的、公认的定义——就此而言,更普遍的“智能”概念也没有。
“我们声称 GPT-4 代表了 AGI 的进步并不意味着它在它所做的事情上是完美的,或者它接近能够做人类可以做的任何事情(这是 AGI 的通常定义之一) ,或者它具有内在动机和目标(AGI 某些定义中的另一个关键方面),”该论文中写道。
但他们说,前进只有一步也是前进。
“我们相信 GPT-4 的智能,”研究人员写道,“标志着计算机科学及其他领域真正的范式转变。”