AI前沿专题015_ GPT的底牌和命门-AI能力的局限.docx
《AI前沿专题015_ GPT的底牌和命门-AI能力的局限.docx》由会员分享,可在线阅读,更多相关《AI前沿专题015_ GPT的底牌和命门-AI能力的局限.docx(8页珍藏版)》请在第一文库网上搜索。
1、AI前沿专题015_GPT的底牌和命门-AI能力的局限这一讲开始我们专注讨论GPT。前面讲了大型语言模型有开悟,有涌现,有思维链,所以才有现在如此神奇的各种功能。但我们还需要进一步理解GPT:它跟人脑到底如何对比?它有什么限制?有没有它不擅长的东西?身处历史变局时刻,GPT的进展非常快。各种产品、服务,学术论文层出不穷,进步是以天来计算,一个月以前的认识都可能已经过时了。不过我们这讲用的书很厉害,史蒂芬沃尔夫勒姆(StePhenWOIfram)的ChatGPT在做什么以及它为什么好使(WhatIsChatGPTDoing.andWhyDoesItWork?),2023年3月9日刚刚出版。STE
2、PHENWO1FRAMWhatIsChatGPTDoing.andWhyDoesItWork?这本书不会过时。因为它讲的不是GPT的一般功能,而是数学原理和哲学思辨一一数学和哲学是不会过时的。沃尔夫勒姆你可能比较熟悉,我们专栏之前专门讲过他I1o他是一个神人。他发明了Mathematics软件,他做了Wo1franuMpha网站,他搞了一个计算语言叫沃尔夫勒姆语言,他对整个物理学提出了全新的看法。你要让我列举当今世界上活着的最聪明的三个人,那其中必定有沃尔夫勒姆一一而且我还不敢肯定另外两个是谁。GPT和目前市面上所有的AI,本质上都是神经网络。沃尔夫勒姆关注神经网络已经四十多年了,他早在198
3、3年就自己编程研究过神经网络,他最近用GPT做了很多研究。他这本书得到了OPenA1CEo山姆奥特曼(San1A1tman)的背书,说是他所见过最好的解释。事实上,沃尔夫勒姆不但讲清楚了GPT的底牌和命门,而且提出了一个可谓惊世骇俗的洞见。我先给你演示个小案例,加深你对GPT的认识。我让GPT-4做了个最简单的计算题,纯粹是我随手打的:1231X434523+323X34636等于多少?1231*434523+323*34636根据您提供的数学表达式,我们可以计算出结果如下:1231*434523=534922713323*34636=11183308接下来,将这两个结果相加:53492271
4、3+11183308=546106021因此,1231*434523+323*34636=546106021oGPT-4煞有其事地算了一番,给出的结果是546106021。但是你随便找个计算器算算,正确答案应该是546085241o(1231*434523)+(323*34636)=546085241这是怎么回事呢?GPT-4有强大的推理能力,我让它做奥数题它有时候都能做对,怎么这么简单的计算题它做不对呢?当然它也不是什么计算都不会。你要让它算个25+48,它肯定能做对问题是对于数字特别长的计算,它就不行了。根本原因在于,GPT是个语言模型。它是用人的语言训练出来的,它的思维很像人的大脑一一而
5、人的大脑是不太擅长算这种数学题的。让你算你不也得用计算器吗?GPT更像人脑,而不是像一般的计算机程序。在最本质上,语言模型的功能无非是对文本进行合理的延续,说白了就是预测下一个词该说什么。沃尔夫勒姆举了个例子,比如这句话:ThebestthingaboutA1isitsabi1ityto(AI最棒的地方在于它具有的能力)”下一个词是什么?模型根据它所学到的文本中的概率分布,找到五个候选词:Iearn(学习),PrediCt(预测),make(制作),understand(理解),do(做事),然后它会从中选一个词。具体选哪个,根据设定的温度有一定的随机性。就这么简单。GPT生成内容就是在反复问
6、自己:根据目前为止的这些话,下一个词应该是什么?输出质量的好坏取决于什么叫应该。你不能只考虑词频和语法,你必须考虑语义,尤其是要考虑在当前语境之下词与词的关系是什么。TranSfonner架构帮了很大的忙,你要用到思维链,等等等。是,GPT只是在寻找下一个词;但正如奥特曼说过,难道人不也*只是*在生存和繁衍吗?最基本的原理简单,可是各种神奇和美丽的事物却可以从中产生。XSamA1tmansama3/2/23,1anguagemode1sjustbeingprogrammedtotrytopredictthenextwordistrue,butifsnotthedunksomepeop1ethi
7、nkitis.anima1s,inc1udingus,arejustprogrammedtotrytosurviveandreproduce,andyetamazing1ycomp1exandbeautifu1stuffcomesfromit.Q379。679O5,4601803K,训练GPT的最主要方法是无监督学习:先给它看一段文本的前半部分,让它预测后半部分是啥。这样训练为啥就管用呢?语言模型为什么跟人的思维很接近?为了让它有足够的智慧,到底需要多少个参数?应该喂多少语料?你可能觉得OPenA1已经把这些问题都搞明白了,故意对外保密一一其实恰恰相反。沃尔夫勒姆非常肯定地说,现在没有科学答案
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI前沿专题015_ GPT的底牌和命门-AI能力的局限 AI 前沿 专题 015 GPT 底牌 命门 能力 局限