AI前沿专题005_LLM语言模型的开悟时刻.docx
《AI前沿专题005_LLM语言模型的开悟时刻.docx》由会员分享,可在线阅读,更多相关《AI前沿专题005_LLM语言模型的开悟时刻.docx(10页珍藏版)》请在第一文库网上搜索。
1、AI前沿专题005_ LLM语言模型的开悟时刻现在最流行的几个生成性Al,包括ChatGPT和画画的Ab背后都是大型语言模型 (Large Language Models,简称LLM)。这大约也是通往AGl的技术路线。这一讲咱们就 来说大型语言模型为什么这么厉害。我先举个例子。我问ChatGPT:棒球棒能被藏进人的耳朵里吗?它说不能,因为人的耳 朵是非常小的,棒球棒的大小和形状超出了耳朵所能容纳的范围很有条理。我又问它:为什么金箍棒能被藏进孙悟空的耳朵里?它回答说因为那是虚构的故事,金 箍棒的形状和大小可以随意改变回棒球棒能被藏进人的耳朵里吗?不,棒球棒无法被藏进人的耳朵里。人的耳朵内部是非常
2、小且复杂的结构,只 能容纳适合大小的物品,例如耳机或耳塞。即使是较小的物品,如小型器械或 药物,也需要通过特殊的工具才能安全地放入耳朵内部。棒球棒的大小和形状 显然是超出了耳朵所能容纳的范围。此外,把物品塞进耳朵可能会导致耳朵内 部组织受到损伤,引起疼痛、感染或其他健康问题,因此绝对不应该尝试这种 行为。 为什么金箍棒能被藏进孙悟空的耳朵里?金箍棒是西游记中孙悟空所使用的武器,它的形状和大小可以随意改变, 甚至能够缩小到可以被藏在孙悟空的耳朵里。然而,这只是一个虚构的故事情节,不具备现实可行性。在现实中,任何物体 都有一定的大小和形状,无法无限制地缩小或扩大,而人的耳朵内部也有固定 的大小和结
3、构,不能容纳大的物体。因此,孙悟空将金箍棒藏进耳朵里这一情节是一个神话和传说中的故事,不应 该被看作是现实世界中的真实情况。你仔细想想的话,这两个回答非常了不起。很多人说语言模型都是基于经验的,只能根 据词汇之间的相关性输出答案,根本没有思考能力但是从这两个问答来看,ChaIGPT是 有思考能力的。谁会写一篇文章讨论棒球棒能否被藏进人的耳朵里呢? ChatGPT之所以能给出答案,肯 定不是因为它之前听过这样的议论,而是因为它能进行一定的推理。它考虑到并且知道棒球 棒和耳朵的相对大小,它还知道金箍棒和孙悟空是虚构的。它这些思维是怎么来的呢?你可能没想到,这些能力,并不是研发人员设计的。研发人员并
4、没有要求语言模型去了解每种物体的大小,也没有设定让它们知道哪些内 容是虚构的。像这样的规则是列举不完的,那是一条死胡同。ChaIGPT背后的语言模型,GPT-3. 5,是完全通过自学,摸到了这些思考能力。以及别的 能力一一你列举都列举不出来的能力。连开发者都说不清楚它到底会多少种思考能力。语言模型之所以有这样的神奇能力,主要是因为它们足够大。GPT-3有1750亿个参数。Meta刚刚发布了一个新语言模型叫LLaMA,有650亿个参数。 GOogle在2022年4月推出一个语言模型叫PaLM,有5400亿个参数;之前GoOgIe还出过 有L6万亿个参数的语言模型。据OPenAl的CEo山姆阿尔特
5、曼(Sam Altman)说,GPT- 4的参数并不会比GPT-3多很多;但大家猜测,GPT-5的参数将会是GPT-3的100倍。这是只有在今天才能做到的事情。以前不用说算力,光是存储训练模型的语料的花费都 是天文数字。1981年,IGB的存储成本是10万美元,1990年下降到9000美元,而现在也 就几分钱。你要说今天的Al科学跟过去相比有什么进步,计算机硬件条件是最大的进步。今天我们做的是大模型。大就是不一样Ello当然语言模型有很多高妙的设计,特别是我们一再提到的 transfOrnIer就是一个最关键的架构技术,但主要区别还是在于大。当你的模型足够大,用 于训练的语料足够多,训练的时间
6、足够长,就会发生一些神奇的现象。2021年,OPenAl的几个研究者在训练神经网络过程中有一个意外发现2o我给你打个比方,比如说你在教一个学生即兴演讲。他什么都不会,所以你找了很多现 成的素材让他模仿。在训练初期,他连模仿这些素材都模仿不好,磕磕巴巴说不成句子。随 着训练加深,他可以很好地模仿现有的演讲了,很少犯错误。可是如果你给他出个没练过的 题目,他还是说不好。于是你就让他继续练。继续训练好像没什么意义,因为现在只要是模仿他就都能说得很好,只要是真的即兴发 挥他就不会。但你不为所动,还是让他练。就这样练啊练,突然有一天,你惊奇地发现,他会即兴演讲了!给他一个什么题目,他都能现编现讲,发挥得
7、很好! 这个过程就是下面这张图一一Modular Division (training on 50% of data) oo 80 60 40 20 0IO1IO2IO3IO4IO5IO6Optimization Steps红色曲线代表训练,绿色曲线代表生成性发挥。训练到一千步乃至一万步,模型对训练 题的表现已经非常好了,但是对生成性题目几乎没有能力。练到10万步,模型做训练题的 成绩已经很完美,对生成题也开始有表现了。练到100万步,模型对生成性题目居然达到了 接近100%的精确度。这就是量变产生质变。研究者把这个现象称为开悟(Grokking)Jo 开悟,到底是发生了什么呢?先别急,我再举
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI 前沿 专题 005 _LLM 语言 模型 开悟 时刻
