ChatGPT使用、原理及问题

chatGPT官网

引言

chatGPT问世

2022年11月30日,OpenAI公布了他们的新产品:ChatGPT。随后ChatGPT火得一塌糊涂。通过b站搜索“ChatGPT”的结果:


b站搜索结果

搞学术的想着从它身上找点创新,吃瓜群众吃着这锅热瓜,想赚钱的眼睛贼亮🌟🌟🌟
由于OpenAI不支持对中国服务,就有人通过淘宝卖ChatGPT注册账号赚了不少钱(月销达到了3万)
我也好奇看看这个新玩意,于是我试着注册账号。。。
却发现:


难啊

不过最后呢,我还是成功了。
这篇博客聊一下我使用的情况、ChatGPT的原理以及存在的问题。

ChatGPT的使用

说实话,我用得有点晚了,之前一直忙七七八八的事,昨天才开始使用的,我登录进去之后出于礼貌,首先用英文发了句“hi”:


image.png

看它也挺有礼貌的回了我,但是,,发第二句就出错了。
可能是网络问题,也可能是它太火了,访问人数太多吧
我又试着用中文跟它聊天:


image.png

它回复中文了,我好开心,它是一个字一个字的回答的,因此我很期待的等啊等,,结果却报了个网络错误。(难过。。)
今天,我帮我老师也注册了个账号,她问了下ChatGPT关于糖尿病的问题,ChatGPT还是给出了挺好的回答:
image.png

我老师让它写段条件随机场的代码:


image.png

可惜写着写着掉线了

这里用的是英文,不过我在网上也看了很多中文的问题,也回答得挺好。
以上就是我的使用情况,总体来说还行,就是网络不太好总掉线

下面我讲一下它的一个简单原理吧~
由于ChatGPT的论文还没出来,也没有提供开源代码,我只能通过OpenAI的博客和相关研究等来了解ChatGPT了。

首先了解一下OpenAI公司

OpenAI

OpenAI

OpenAI是一个人工智能研究实验室,由营利组织 OpenAI LP 与母公司非营利组织 OpenAI Inc 组成,目的是促进和发展友好的人工智能,让更多人受益。

OpenAI 有两位创始人其中一位是埃隆·马斯克,这个大家应该都认识,就是特斯拉的CEO,提出造火箭带人类星际旅行的人,《硅谷钢铁侠》里说的就是他:


他就长这样

OpenAI 另一个创始人是原Y Combinator(美国著名创业孵化器)总裁山姆·阿尔特曼,美国斯坦福大学计算机系辍学生。
总的来说OpenAI是不差钱了,在ChatGPT之前研发的GPT3的训练就花了1200万美元。

OpenAI除了今天的主角之外,还有很多产品,
如:OpenAI曾跟Github合作,开发了智能编程助手 Copilot :


image.png

这里说的是“产品”,虽然OpenAI曾说自己是非营利机构,但从出产品的情况来看,有趋向营利的目的,例如:ChatGPT,很多人都关心它会不会开源,而目前它的论文还没出来,它的前一代InstructGPT没有开源,就连前前代GPT3都没开源,从趋势上判断,ChatGPT开源的可能性有点小了。

ChatGPT原理

要讲ChatGPT的原理,不得不向上追溯这样的一个链:


模型链

从上图来看,有两条链,上面那条是OpenAI,下面是Google,其根源还在于2017年Google技术提出的 Transformer[1]
而Transformer由Encoder和Decoder组成:


来自Attention is all you need

如果看起来复杂,请看下面这张图:


简化版

Google的BERT系列使用的是Transformer的Encoder部分,而OpenAI的GPT系列使用的是Decoder部分。
Google提出的Transformer一开始是用于机器翻译,Encoder用于输入,Decoder用于输出,如:英语翻德语,Encoder就主要是学习到英语句子中的词及其关系,然后丢给Decoder,Decoder得到后进行处理并输出德语出来。
其中,Encoder的输入是整个句子,比如一句话“I love China”,其中"love"的上文是"I",下文是“China”,而Decoder输出是一个词一个词的输出的如“我爱中国”的输出顺序是“我”、“爱”、“中国”,
从上可知Encoder的特点是:在结构上对上下文的理解更强,更适合嵌入式的表达,因此它比较适合做“完形填空”式的任务;而Decoder的特点是:基于上文而不知道下文,因此它比较适合做“根据上文推测下文”的任务。

由上可知,Decoder就适合ChatGPT这种聊天的场景了。
回到前面的图,在ChatGPT之前是由:GPT->GPT2->GPT3,再然后有一个叫:InstructGPT[2]的,我从ChatGPT官网上看到这样一句话:


InstructGPT

请注意我用蓝色框 框起来的这里,他说 ChatGPT是InstructGPT的姊妹,她俩都是“基于人类反馈的强化学习”(后面这句是我从文献中获得的)
ChatGPT和InstructGPT与之前GPT系列模型的区别就在于“基于人类反馈的强化学习”。
通俗来讲,我们可以把之前的GPT模型想象成一大堆数据训练出来的模型,在应用时,这模型有个致命缺点就是它输出的内容对人类不太友好(比如输出有毒的内容或编造出来的内容,不符合人类逻辑等等)

“基于人类反馈的强化学习”,就是在训练GPT模型之前,先用一批专家的知识来训练一个反馈模型,然后再训练GPT3模型,如下图:


训练过程

从图中可知,该模型与之前GPT模型区别就像是“注入了人类的意识”,基于人类反馈模型训练的模型就被叫做“基于人类反馈的强化学习”(Reinforcement Learning from Human Feedback)
原理就简单介绍到这里了,如果你有兴趣的话,给我留言,激励我出更多GPT相关内容。

ChatGPT的应用

ChatGPT的应用就很多了,这里简单提一下,如:写作、写代码、聊天、指导决策等等。。
我老师关注医疗方面的应用,于是我也搜了一下,
有人对ChatGPT医疗建议进行图灵测试[3],发现机器人对于不同的问题,回答的正确分类在49.0%到85.7%之间,平均而言,患者对聊天机器人功能的信任度反应较弱,并随着问题任务与健康相关的复杂性增加,信任度也会降低,但整体而言,ChatGPT对患者问题的回答与人类提供者对问题的回答难以区分,外行似乎相信使用聊天机器人来回答风险较低的健康问题。
看来未来应用于医疗也不是不可能。

到这里,就不得不担心ChatGPT可能带来的问题了。

ChatGPT可能存在的问题

什么某些人失业啊,这啥啥的,我就不说了。
我想提的是“道德问题”,这灵感也是来源于我老师。
我也搜了一下,确实有这方面的文献[4]。
这也可想而知的,该模型的训练注入了人类老师的标记嘛。
而该聊天模型功能强大,能作为工作、决策的好助手,那么它作为一个机器人,如何对自己说的话负责呢?
这就存在自动驾驶一样的问题了。

总结

本文主要讲了以下内容:

  1. 我对ChatGPT的使用过程;
  2. OpenAI的简单介绍;
  3. ChatGPT的简单原理:
    Transformer的Encoder->GPT->GPT2->GPT3->InstructGPT->ChatGPT;
    以及,“基于人类反馈的强化学习”是什么;
  4. ChatGPT的应用;
  5. ChatGPT可能带来的道德问题。

参考文献
[1] Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[J]. Advances in neural information processing systems, 2017, 30.
[2] Ouyang L, Wu J, Jiang X, et al. Training language models to follow instructions with human feedback[J]. arXiv preprint arXiv:2203.02155, 2022.
[3] Nov O, Singh N, Mann D M. Putting ChatGPT's Medical Advice to the (Turing) Test[J]. medRxiv, 2023: 2023.01. 23.23284735.
[4] Krügel S, Ostermaier A, Uhl M. The moral authority of ChatGPT[J]. arXiv preprint arXiv:2301.07098, 2023.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,179评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,229评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,032评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,533评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,531评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,539评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,916评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,813评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,568评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,654评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,354评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,937评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,918评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,152评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,852评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,378评论 2 342

推荐阅读更多精彩内容

  • hi,我是熵减,见字如面。 本文是关于ChatGPT 背后核心技术实现的一个通俗白话版,不涉及到的AI具体实现的技...
    熵减黑客阅读 263评论 0 1
  • 本文参考的博客链接: chatGPT的出现给大家带来了很多惊喜,展示了很多语言能力: 文本生成的能力prompt ...
    心机葱阅读 1,629评论 0 0
  • 本文上两篇系列 NLP的巨人肩膀(上) NLP的巨人肩膀(中) 4.6 Bidirectional Encoder...
    weizier阅读 6,370评论 1 22
  • 简介 2022年11月,OpenAI推出了一款AI聊天机器人程序,其强大的问答能力瞬间引爆全网关注度。 组成部分:...
    臻甄阅读 1,707评论 0 0
  • 本文保存记录一下如妹的文章,文章内容没有很详细,但大纲比较清晰,可以之后做参考用。公式因为复制不过来,就靠自己脑补...
    高斯纯牛奶阅读 782评论 0 0