郑重声明:本文系原创首发,文责自负。
最近人工智能比较火,其中ChatGPT是大家谈论最多的。有一个孩子的家长,为了提高上初中孩子的英语水平。将一册书的全部英语单词汇集在一起,由ChatGPT生成了一篇文章。孩子通过学习,成绩满分。只是一篇英文文章,就涵盖了一本书的内容。还是很让人震惊的。还有程序员,要求的一些代码,可以拿来直接使用,省时省力。
难怪这么多人追捧。
那么什么是ChatGPT。我也查阅了一些资料,也登陆了网站。很遗憾,目前国内的手机无法注册。
关于这个话题,我给大家普及一下,ChatGPT的技术起源,以及这款AI聊天机器人背后的核心技术是什么。
首先我们以一种易于理解的方式,去拆解一下GPT三个字,GPT的全称是:Generative、Pre-trained、Transformer。中文翻译是:“生成性预训练变换模型”。那我们一个一个字母来看,第1个字母G,翻译过来就是“生成性”。所以我们称ChatGPT是生成性人工智能,也就是所谓的生成性AI。
在此之前呢,人工智能机器学习,在很大程度上都是局限于观察分析和分类内容。一个经典的机器学习的例子,就是图像识别。比如说让机器去识别一只狗,那程序就会仔细地去搜索和分析大量的图像,去寻找与狗匹配的图像。而以GPT代表的生成性AI,是一项技术上的突破,它是可以去生成新内容,而不是仅限于分析现有的数据的一种AI。它可以根据我们的需要,去创建一个狗的图像,或者生成文本描述。明白了吧,多了一个生成性AI模型。这就是进步,说起来简单,实际上是非常复杂的。那生成性AI模型呢。也可以用于去生成程序代码、诗歌、文章、艺术品等等。
最新发布的ChatGPT,是专注于文本内容的生成,那未来应该也会有图像、艺术等各种形式的生存性AI。尽管应用领域不同,但是它的技术核心是类似的。也就是说所谓的生成性的人工智能。
那GPT的第2个字母是P,他表示这个模型,已经在某些有限的数据集上进行了训练。就像我们在被要求回答某个问题之前,我们会事先去阅读一些相关的书籍一样。ChatGPT之所以能够听起来像人一样来回答我们的问题。就是因为它已经接受过大量数据地训练。
而这些数据呢,是由我们真实的人来编写的。也就是说,是我们人类发布在互联网上的,这样看来,它应该包括了所有2022年以前的互联网上的内容。
那么怎么去进行预训练呢,它使用的是两项技术。一个叫监督学习,另一个通过人类反馈强化学习。
这个听起来比较专业,我举个通俗的例子,来帮助大家理解。请你想象一个场景,老师要教学生写一篇文章。那监督学习呢,相当于老师在让学生写文章之前,先给学生成千上万篇文章让他们阅读,这不可能,只是举个例子。那这个目标就是,让学生通过学习大量论文的语气、词汇和结构。去学习如何写一篇文章。这就是预训练里面的监督学习。
但是那些文章会有好有坏,学生如果参考不好的范文,仍然有可能写出不符合,不合格的文章,不符合老师要求的文章。
这个时候就用到第二项技术,就是通过人类反馈强化学习。也就是说老师,还会经常给学生去布置一些作业。然后根据学生交上来的作业去进行反馈,告诉学生,哪些地方做得好,哪些地方需要改进。那么在这个反馈的过程中。去进一步强化学生的写作水平。
所以在GPT发布之前,已经用类似的方法进行了大量的监督学习,和通过人类反馈强化学习。所以我们在使用它的时候,这个模型,也就是这个超人,它能非常准确快速的去生成连贯,富有教养的,而且是引人入胜的回答。听起来像人类的一个响应。这就像是一个饱读诗书功力深厚的学者,被要求现场写文章,他能够一气呵成去完成一样。可以想像一下,李白、杜甫这样的诗仙诗圣写诗一样。我估计,它写出来没那么好吧,没那么经典吧。成诗是没问题的,我有时,诗兴大发时,还能写上两句,人人都能写。
那么GPT第3个字母那就是T,是Transformer。如果你直接翻译过来了,就是转换器或者是变形金刚。有一部电影叫变形金刚,就叫Transformer。如果你把Transformer翻译成转换器或者变形金刚,那就不对了。
它真正的含义的是一个非常底层的人工智能,机器学习的一个算法架构,它是一种深度神经网络,最初这个架构是在2017年,由谷歌的一个人工智能的团队研发的,就是谷歌大脑。
这团队发布的这种模型,它是使用一种叫“自注意力”的机制。它允许模型在进行预测的时候,可以根据语言序列的任何位置,为输入数据的不同部分,赋予不同的权重,并支持处理更大的数据集。
现在所有的GPT模型都是采用了这种架构,他们会有一个编码器,来处理输入的序列,然后会有一个解码器来生成输出的序列。所以你可以问他一个问题,他会用对话的方式来提供给你答案。而不是像传统的搜索引擎那样,扔给你一堆信息源,让你自己去筛选。从一众垃圾中自行筛选。
那这三个字母拼在一起就是GPT。
说了这么些,大家应该有些了解吧。当然,有些 太专业,好多我也不太明白,太专业了。
ChatGPT火起来之后,很多人都争相效仿,出现了大量的伪人工智能,目的就是吸引人们的眼球。最不要脸,当数国内某些平台发布的一些劣质聊天机器人,声称如何,如何。要多恶心就多恶心。要多低能就多低能。人家发展到目前阶段,也只是个初级阶段。前面还经历了GPT-1,GPT-2.这也只是GPT-3,未来还有很长的路,毕竟,也只是在文档上略显功力。
也有很多人吐槽回答很弱智,即使集人间知识大成于一体,也难免会有疏漏。
还有一个现像,很引人观注,对于它的提问,我都不知道该用哪个他了。它会看人回答问题,比如用中文问问题的,用英文问的,它可以区别回答。就是中文,用简体字和繁体字提问,它的回答都不一样。完全像是一个有思想的超人。
另外,它写文章是超棒的,这篇文章可能就是他写的。当然,里面有错别字的话,那是我故意改的,让别人觉得是我写的。