周鸿祎在得到直播间的“人工智能引领新工业
划重点
1GPT为什么这么成功?搞GPT这帮人走对了一个技术路线,得益于微软和OpenAI产研合作的模式创新。 2GPT已经拥有真正的人工智能。GPT是越战越勇的风格,你给它输入越多,它给的反馈就越多。你问的问题越深刻、越有批判性,它给你的答案就越好。 3GPT-4 已经是世界上最聪明的“人”,原来的人工智能叫垂直人工智能,也没有人类所有的知识,无法理解我们这个世界,ChatGPT恰恰在这些方面实现了突破。 4GPT有四个不可解释的现象:涌现、幻觉、语言上的能力迁移和提示。原创 周鸿祎 罗辑思维
4月12日,360集团创始人周鸿祎在得到直播间,进行了一场主题为“人工智能引领新工业革命”的直播。
这场直播是得到4月“AI大作战”系列直播的其中一场,在两个半小时里,周鸿祎分享了关于ChatGPT的六个观点,包括ChatGPT将带来的四个挑战、对AI的两个预测以及360的AI战略。
以下是对这场直播的精编内容进行重新组织的段落,希望能对读者有所启发。同时也欢迎读者将其分享给更多关心ChatGPT、关心AI、关心个人与行业未来的朋友。
来源:得到App
作者:周鸿祎,360集团创始人。
周鸿祎在得到直播间
开场
大家好!我非常高兴来到得到直播间。刚才主持人讲解了得到同学对学习的热情,让我对得到有了新的认知。原来我以为做直播只是我随便讲,大家随便听,时长也随便控制。但是得到的同学非常热爱学习,不仅认真听,平均观看时长达到50分钟,还要画脑图、划重点,这让我非常紧张,因为我没有黑板可以敲。我和我前面的几位老师风格不同,我不负责任,这只是我的个人感悟。
我今天非常高兴,因为我得到了一个不限时间的演讲机会。由于我这个人,一旦高兴起来就会不停地说话,所以估计4个小时也不够。大家今天一定要准备好夜宵,因为4个小时可能不够。
好奇心是人类探索世界的重要动力,得到用户中有许多人拥有强烈的好奇心,这也是他们选择得到的重要原因之一。我对好奇心非常重视,这可能是我最大的优点。无论是数字安全还是人工智能、大语言模型等领域,我都是从好奇心开始的。现在,由于人工智能技术的发展,可能已经没有更多的广告机会来推销产品了。因此,我想借此机会向大家介绍一下人工智能技术,希望更多的人能够了解并参与其中。
我即将出版一本名为《超越好奇》的书,这本书将分享我在职场上、创业初期所经历的挫折和困难,以及从中学到的失败教训。虽然成功的经验有时候看起来像是心灵鸡汤,但我坚信只有经历过磨难的人才能理解成功背后的含义。我希望我的这本书能够给大学生、初入职场的年轻人和刚开始尝试创业的年轻创业者带来启示,帮助他们超越障碍,实现自己的梦想。
今天晚上我不是讲课,而是分享关于人工智能大语言模型的几个观点。GPT就是人工智能大语言模型的代表,不知道在座诸位用没用过。如果没用过,建议大家一定要用一下,不要老是道听途说。得到请再多的老师来讲,我们把馒头嚼一遍,告诉你馒头如何好吃,这对你是没有意义的。不管你是喜欢GPT还是不喜欢GPT,都要自己用一用。
网上有一个段子很有意思,说很多人拼命找GPT的缺点和毛病,也有很多人在证明GPT无所不能。对GPT有很多不一样的观点,我觉得这是好事,观点一致就不对了。正因为对同一件事,有人认为是无足轻重的噪音,有人认为是噪音之下隐藏的未来新时代的信号,大家就会采取不同的动作。
我今天不讲技术,我是从产品、产业和社会这几个角度,分享我的几个观点和我对未来趋势的几个判断。
先给大家看一看,我找AIGC以文生图制作了几张我的画像,大家看看哪一个最像我呢?
我的照片输入进去以后,大家看起来好像有点相似,但实际上并不是。我开始一点不像,后来加入了我爱穿红衣服这个显著特征,大家才慢慢相信我的真实身份。我向同学们解释了为什么我喜欢穿红衣服,因为我的名字经常被叫错,很多人叫我周鸿伟,但实际上我叫周鸿祎(yī)。我穿红衣服是给大家一个暗示,是鸿祎(yī)而不是鸿伟。
使用 GPT 写开场白和发言稿已经成为流行趋势。我本来打算使用 GPT 来完成这次演讲,但被罗振宇拒绝了。这也是我最后一次以真人身份给大家做演讲。我计划以后使用数字人分身,并挂上大模型的灵魂,这样可以一晚上开三五场直播都没有问题。现在确实很忙,需要更多时间和精力来管理数字人。
六 大 观 点
观点一
ChatGPT为什么能“成功”?
GPT之所以如此成功,人们往往只盯着其技术特点,而忽略了其在人工智能领域的重要性。但在此之前,包括GPT-3.0、GPT-3.5的发布,都不如ChatGPT的影响这么大。我认为有几个原因。
第一,搞GPT这帮人走对了一个技术路线。我把这个技术路线叫“四大一强”,就是用大算力往里灌入大数据,加上大量人工标注的能力训练,再加上大型的算法,最后做出来一个大模型。GPT这个Transformer模型应该是谷歌开源的。
全世界除了GPT这帮人,包括国内外互联网高科技公司都点错了科技树。大家都在用大语言模型在改善自己的广告点击率,在提升自己的内容推荐算法。没有人想过,如果把人类所有用语言文字表达的知识都灌进去,做一个超过几百亿参数的模型,会出现什么效果。这种思想实验性的项目,被称为“暴力美学”或“大力出奇迹”,并取得了惊人的效果。但需要注意的是,这种模型需要大量的计算资源和数据,以及时间来完成训练和验证。同时,对于普通用户而言,使用大语言模型可能并不会带来直接的生产力提升,而更多的是一种娱乐和体验。
中国众多公司在4月份发布类似大语言模型的产品,要感谢OpenAI。OpenAI让方向明确,技术路线明确,剩下的工作就比较容易了。
我今天不想过多说技术上的成功,因为很多技术也不是OpenAI的原创,而是OpenAI做了一个组合式的创新。我想谈的是这个技术它为什么这么火。
有很多人问我,GPT一出来,为什么Web3.0就不热了,为什么元宇宙好像黯然失色,到底Web3.0和元宇宙还有没有机会。Web3.0和元宇宙两个概念很好,人工智能的概念也很好。但一个东西概念再好,最后能不能成功,要取决于它能不能破圈。
破圈或者出圈,就是在于它能不能对我们每个普通人的生活产生深远的影响。对普通人来说,我们并不关心技术,也不关心后台那些复杂的算法和模型,我们更关心它能够如何改变我的生活方式和工作方式。
之前我到新加坡去,遇到了很多Web3.0的创业者。我还是很喜欢Web3.0这个概念,但Web3.0的创业者像原教旨主义者一样,把我当做古典互联网主义者进行批判,认为我理解不了他们的独特商业模式和创新模式。我也争论不过他们。在这种情况下,我意识到需要更深入地了解Web3.0的概念,以及这些创业者所提到的商业模式和创新模式。我开始研究Web3.0的技术、历史和生态系统,并阅读相关书籍和文章。通过不断学习和研究,我逐渐认识到Web3.0的价值和潜力,同时也学会了如何与那些像原教旨主义者一样的创业者进行有效的沟通和辩论。尽管我可能不是Web3.0的最终解决方案,但通过学习和实践,我能够更好地理解这个概念,并为未来的互联网世界做出贡献。
但我有一个非常朴素的理念,我觉得用户不管你是不是去中心化,用户也不管你用什么样的Line1、Line2的技术,用户也不管你是不是区块链,用户就问一个问题:你解决了我什么痛点,满足了我什么刚需。
任何号称伟大的事情,成功并非完全由标签和概念来决定。当年元宇宙和Web3.0的概念比今天的大语言模型更热门,但大语言模型的成功也并非一蹴而就。ChatGPT的成功得益于多个因素,包括技术的进步、市场需求的变化以及不断改进和完善。
我仔细研究了这个现象,这让我想起当年互联网1.0的时候,我们最早用电子邮件的时候,突然感觉天涯若比邻,发一封邮件一秒寄到,而且不要钱,不需要再买邮票了。很多人第一次用ICQ或QQ跟远方朋友聊天的时候,你不熟悉它的技术,但你会觉得生活变得非常方便。
搜索引擎的出现,让人们可以更加方便地获取信息,许多人第一次使用搜索引擎时,会感到仿佛天下所有的图书馆都对他开放,所有的资料都是免费的,这种感觉就像是打开了知识的宝藏。
互联网今天成为变革的力量,就像个人电脑一样,不是因为一个概念而成功,而是它真正让我们每个人找到了一种场景。
在这个场景里,过去很复杂很费钱才能得到的服务,现在很容易得到。过去很麻烦的任务,今天可以很容易地完成。这样的产品和技术才是有生命力的。
迄今为止,无论Web3.0、区块链还是元宇宙,大都还是圈内的人在热捧,不断在推动。我很看好元宇宙,但如果没有人工智能的灵魂,元宇宙可能就是一个界面,是一个空壳子。今天加上人工智能大语言模型的灵魂,元宇宙会绝地重启。当然,前提一定是,要让普通人感受到你对它有所改变。
普通老百姓不会在乎概念,也不会在乎大词,更不会因为你的理念就买单。我经常举一个例子:就像我们到饭馆吃饭,可能是因为它的饭好吃,也可能是东西便宜,或者是有特色菜,也可能因为某个服务员长得好看,你有很多原因。但你绝对不会因为这个饭馆老板有着Web3.0的去中心化的理论、有着O2O的做菜思想,去吃它很难吃的菜。
我们想想这一次的ChatGPT,实际上背后是一场工业革命级的巨大技术进步。我也会说大词,这是“强人工智能”,甚至是“超级人工智能”的起点。但是,它把自己伪装成了一个聊天机器人,或者一个新一代搜索引擎,把GPT大脑藏在云端。
GPT的出现让普通人的使用门槛更低,只需要拥有一个浏览器、登录一个网页、申请一个账号,就可以通过GPT直接使用其各种实用的功能。GPT不仅可以回答各种问题,还可以写报告、写公文等,让上班族和许多小企业老板感到人工智能前所未有的亲近。
在ChatGPT出来之前,虽然这个概念很热,但普通人还是觉得这个东西离自己很远。提起人工智能,刚刚我问了罗振宇,他也觉得很头疼。他告诉我,要建立一个强大的人工智能系统,需要收集大量的数据,建立一个复杂的模型,进行大量的训练,还要找到优秀的科学家来设计并开发这个系统。
使用ChatGPT进行智能客服交互,可以提升整个团队的生产效率。只需申请一个账号,并为员工分配相应的权限,从员工到老板,整个团队的生产效率都会得到提升。无论是文案、美工还是其他职位,ChatGPT都可以提供高效的工作方式,帮助团队实现更高的生产效率。这也是ChatGPT真正成功的地方。
回过头来,我建议在座的很多想创业的人,如果你今天是在做元宇宙产品或者是做Web3.0产品,应该从ChatGPT的成功里汲取经验,除了技术上成功的根基,我们一定要牢记最终用户能感知的就是产品体验,就是场景化的功能,你能不能帮他解决实际问题。
互联网并没有大张旗鼓地打着革命的旗号来。一开始,互联网和个人电脑都被看作是青年人的玩具,被视为无足轻重的东西。然而,它确实改变了我们每个人的工作和生活方式,因此受到了用户的欢迎和追捧。这种欢迎和追捧形成了一股势不可当的力量,只要有更多人使用这个产品,它就会形成强大的威力。
此外,我还想强调的一点,ChatGPT的成功,得益于微软和OpenAI产研合作的模式创新。如果只有产业公司,可能就缺乏OpenAI科学家长期主义的理想,大家就会比较现实,可能没有人想到大模型编码在处理人类所有的知识这条路上可以走得更远。
反过来,如果只有OpenAI,就像谷歌今天干的一样,不断发论文是没有意义的。因为论文和技术如果不能跟用户的场景相结合,也是不能成功的。所以微软和OpenAI有非常好的分工,微软在自己的产品里绑上OpenAI的服务,让OpenAI的服务真正实现工程化、场景化、产品化和商业化。这样,OpenAI的服务才能真正为用户带来价值,让AI技术落地开花。
国内很多公司都在闯入大模型领域,竞争十分激烈。但我认为,做一个大模型的原型是容易的,但要达到GPT-4甚至是GPT-5的高度是需要花时间的。为了借鉴微软和OpenAI的合作模式,我们可以寻找高校、实验室或者创业公司扮演OpenAI的角色,这些公司可以提供强大的技术支持和资源。同时,我们也可以寻找产业公司扮演微软的角色,这些公司可以提供优质的数据和计算资源,并利用人工智能技术开发出高质量的产品。
GPT的核心技术已经开源,使得科技公司人手一个GPT大模型,GPT已经不再像独门秘籍一样,而是成为了一种普及的科技工具。
所以,最关键的已经不是你拥有大模型的技术,而是如何借鉴微软和OpenAI的合作模式,如何能够拿到更好的数据进行训练,如何实现更好的工程化的训练方法,以及,如何找到更好的用户场景,能够使用你的大模型。
三个月前,我首次使用ChatGPT,感受到了它的当时的能力。如今,经过用户的不断反馈和应用场景的不断扩大,GPT的能力已经得到了长足的进步。
所以,对创业公司来说,搞大语言模型肯定不是关起门来搞科研、闭门造车,要学会和行业里有场景、有入口的公司来合作,通过用户的试用和反馈来改进技术。
观点二
GPT已经拥有真正的人工智能
接下来,我谈谈一个容易跟别人产生争论的观点。关于GPT究竟是不是真正的人工智能,现在有两种非常鲜明的观点。一些人认为GPT是真正的人工智能,而另一些人则认为它只是一种模拟程序,没有真正的智能。
一种是智能派,认为GPT是强人工智能,能够通过图灵实验,已经实现了真正的不亚于人的能力。
另一派认为,GPT不过是用大数据概率统计的机器模型,不算是真正的智能。他们觉得,GPT虽然能够编出很多句子,虽然能够写文章,回答很多问题,但是很多问题还经常犯错,GPT并不能做到真正的理解。
GPT究竟是不是真正的人工智能?我的观点不一定对,但我要保持观点鲜明,也欢迎大家来抛砖。我认为它是真正的人工智能。
GPT跟搜索引擎有本质的区别。搜索引擎并不智能,你搜索资料,网上有就是有,没有就是没有,不会无中生有。而GPT是越战越勇的风格,你给它输入越多,它给的反馈就越多。你问的问题越深刻、越有批判性,它给你的答案就越好。
如果你只把它当一个搜索引擎,输入几个简单的词汇,你也得不到好的结果。GPT对用户也是有挑剔的。就像梅西哪一年获得世界杯冠军,这种事实性的问题,用搜索引擎就可以。GPT回答出来,不会让人觉得惊奇。事实上,它现在已经可以回答很多复杂推理的问题。
微软有一份100多页的详细调研报告,我仔细地从头看到尾。微软对GPT进行了仔细测试,他们精心准备了很多问题。这些问题并不是直接在网上能搜到答案的,都需要有知识的储备和推理能力。GPT的推理能力不是一步推理,要经过多步推理才能有答案。这些网上搜不到答案的问题,GPT能回答,更说明它有真正的智能。
事实上,我更愿意把GPT叫作“大脑”,是人类在人工智能上巨大的突破,是人类第一次把所有的知识灌到“大脑”里,实现了人类对整个知识的编码、存储和推理的准备。这个能力要远远强于过去我们所说的搜索引擎、知识库和知识图谱。
现在的搜索引擎,不符合大脑里这种复杂的神经网络连接的存储方式,它不会引发联想,不能产生语义的通感。
GPT对这个世界有了基本的常识和认知。做GPT的人有一个理念已经被验证:我们人类的所有知识都是拿文字来进行编码,当我们把所有的用语言文字进行编码的这些知识灌进去之后,就解决了人工智能有史以来最大的问题——人工智能终于可以理解我们这个世界,它对这个世界有了基本的常识和认知。
维特根斯坦曾经说过,凡是人类无法讨论的事物,人类就无法理解。这句话可以引申一下,凡是人类无法用语言表达的,人类就无法理解。所以,人类如何定义理解?实际上,语言和文字是理解的边界。
反过来讲,一台基于芯片和软件运作的机器,即使这跟我们大脑工作的物理原理不太一样,但当它可以准确地理解我们说的每一句话,而且用准确的语言描述出来,为什么说这不是理解呢?为什么我们人类的理解要被定义得特别尊贵,我觉得这是没有道理的。
我曾经举过一个例子,人类一直想模仿鸟类飞起来,但迄今为止,人类成功的飞行器没有一个是像鸟一样扑扇着翅膀飞的。人类了解了空气动力学以后,研究出现代化的飞机是利用浮力的原理,比鸟飞得快、飞得高,但原理跟鸟扑扇翅膀确实不一样。
飞行的定义并不只取决于扑扇翅膀的动作,人类飞行器的飞行方式也同样重要。因此,飞行的定义并不是固定的,而是取决于飞行工具的类型和使用者的技巧。
观点三
GPT-4 已经是世界上最聪明的“人”
人类在20世纪70年代开始研发人工智能,至今已经过去了50年。在这30年的过程中,人们一直将人工智能视为一个概念,炒了30年。然而,我认为,很多人并没有真正理解人工智能实现了真正的突破。
原来的人工智能有两个最大的缺点,以前一个人工智能只能解决一个问题。AlphaGo下围棋很厉害,但它不能人脸识别。人脸识别的人工智能可以在芸芸众生中,快速把我识别出来,但它不能跟我对话。所以,原来的人工智能叫垂直人工智能。
二是原来的人工智能没有人类所有的知识,无法理解我们这个世界。用智能音箱的人会发现,你跟它多聊两句就聊不下去了,这哪里是人工智能,简直是人工智障。这是传统人工智能最大的问题,它没有我们人类所有的知识,很多词听不懂,没有人类的智力,它就无法理解我们这个世界。
比如,我到北京市大望路温特莱中心,罗振宇开的公司得到App来做直播。这句话隐含了较多的前置知识。如果一个机器或人工智能对这些知识无法理解,它就处于智障的状态。因此,在GPT之前,人工智能可以被定义为弱人工智能或垂直人工智能,或者称为人工智障。
ChatGPT恰恰在这些方面实现了突破,我认为它已经是“通用人工智能”。这不仅是说GPT能够解决很多问题,而且意味着大语言模型这个技术,在解决未来很多问题的时候都有普适性。它不仅能解决自然语言理解的问题,阅读理解、写作、知识问答,这些问题过去需要做很多碎片化的小模型,现在全都被统一在一个对话框后面。
GPT把人类的海量知识进行了理解,理解以后进行了编码和存储。这个突破是史无前例的。我认为,它对这个世界的认知,超越了我们每一个普通人。
所以,你跟它对话,它能够对答如流。你说的每一句话、每一个词,它都能听明白这个词是什么意思,这个词背后有什么关联,甚至有些梗,有些背后逻辑推理的东西,它都能够融会贯通。所以,我们称为“通用人工智能”。当然,我更愿意叫它强人工智能。
GPT-4甚至可以通过模拟苏格拉底的教学方式来回答问题。如果告诉GPT,让它用苏格拉底的方式来回答问题,它不会直接给出答案,而是反问你问题,启发你的思路,分成多步问答,带着你找到答案。
GPT-4的能力非常强,不需要我来证明。因为OpenAI让它通过了无数的考试,比如律师考试、微软和谷歌的面试、医生的考试、生物学的考试等等。
GPT-4的融会贯通的知识可以比作一本本书,用单词的数量来衡量,大约相当于4000万本书被灌到了GPT的大脑里。人类总共出了1亿种书,人的一生最多只能读1万本书。但是,GPT被灌入的知识大约有4000万本书,而且能够记忆并灵活运用。
GPT的工作原理与人类大脑不同,它是基于指令的输入,而不是基于信息的存储和检索。这意味着GPT不需要像人类一样将信息存储在特定的脑区中,而是通过指令来获取和处理信息。这种工作方式使得GPT可以高效地执行大量的任务,同时保持高度的智能和灵活性。GPT的超常智力并不是因为它拥有与人类同等的认知能力,而是因为它的工作原理与人类不同。GPT可以通过指令和模型来获取和处理信息,这使得它成为了目前世界上最聪明的人工智能系统之一。GPT的工作原理与人类大脑不同,这使得它成为了一个极具潜力的研究领域。研究人员正在努力开发更加先进的GPT模型,以探索人类智能的新领域。
GPT的缺点被很多人看重,但我认为,只有那些愿意放下过去的人才能真正看到它的优点。如果我们只停留在过去,对现在的事物充满怀疑和担忧,那么我们看待新事物时就会只看到缺点。就像刚刚出生的孩子,连走路都不会,说话都不会,你会对他有信心吗?你会担心他的未来吗?但你会相信,他会在未来不断发展和成长吗?GPT的发展不也是如此吗?它的进步不是通过十八年的沉淀和积累来实现的,而是通过不断地学习和改进来实现的。
50年前,人工智能的发展经历了一个缓慢而平稳的历程。然而,今天,我们可以说,人工智能已经迎来了强人工智能(AGI)和超级人工智能(Super-AGI)的拐点。这一时刻标志着计算机的计算能力和智能水平已经达到了人类平均水平或者普通水平,这是一个里程碑式的变化。
它下面的进化会像摩尔定律一样,是指数级的。今天你看到的只是GPT-4,GPT-5在路上,未来还会有GPT-6、GPT-8、GPT-10……我认为,整个的进化速度会非常快。就像AlphaGo和AphaZero,自己左右手下棋,一天可以下一万盘棋。这个进化和学习的速度,远远超过人类的学习速度。
GPT为了出圈,为了破圈,将自己牛的知识大脑能力隐藏在云端,隐藏在微软给它打造的超级电脑中心里面。它在前端将自己伪装成聊天机器人,以SaaS化软件服务的方式,让用户能够更方便、更快捷地获取到它所提供的知识。
很多人调戏它,觉得很有意思,问它脑筋急转弯的问题,还有人把它当成新一代的搜索引擎去用,觉得它的理解力可以做语义搜索,可以搜到更准确、更全面的答案。但是,这些东西都只是它能力的一小部分。它不是玩具,它代表了人工智能新时代的来临。
我反对有些“砖家”贬低 GPT。其实,要理解 GPT 没有那么复杂。学过系统论的同学都知道,系统从混沌到有序,当它复杂到一定程度的时候,从量变到质变,在混沌中就产生了涌现,就产生了很多超出我们预料的功能,这是正常系统论都能预见到的。
地球是一个混沌的系统,在无数布朗运动的分子的碰撞和反应中产生了氨基酸分子。这些氨基酸分子经过进一步反应,形成了单细胞生物。随着时间的推移,这些单细胞生物逐渐进化,形成了今天的人类。人类的大脑里大约有1000万亿个脑细胞,通过100万亿个神经元网络连在一起,使我们拥有了高度的智力和创造力。
GPT大语言模型的参数量目前达到了1000亿个,这个数字相当于人类大脑神经网络连接数量的100万亿倍。
GPT的的基本计算单元确实只是一个简单的预测模型,根据上一个词来预测下一个词。但是,当这种单元的数目多到一定程度时,就有可能产生出很多超出我们预料的功能。这是因为,这些单元可以协同工作,根据上下文和语境来生成更加准确和自然的语言。
如果你真的仔细用了GPT,你会发现GPT很有可能是人类第一次非常近地模拟了大脑的工作原理。我举两个我们生活中的例子你就会明白。
小时候,我们开始写作文时,并不是天生会写作,而是要通过大量的阅读范文来积累写作技巧和素材。我们甚至可以用小本子把好的词句摘编下来,并不自觉地将这些好词好句应用到自己的文章中。这就像生成式AI生成文章的过程一样,我们阅读的东西越来越多,大脑中存储的知识也越多,因此我们在写作时能够不自觉地运用这些知识,就像生成式AI能够根据输入的数据生成文章一样。
我举个例子,如果罗振宇一直不阅读任何关于GPT、大语言模型的文章,他可能会连GPT是什么都不清楚。我们人类所谓的创造力,还是要基于学习和知识的预先编码。
观点四
GPT有四个不可解释的现象
GPT具有真正的智力,我提出了四个不可解释的现象。虽然创造出Transformer模型的谷歌科学家、做出ChatGPT的OpenAI的科学家们和测试专家们都知道这些结论,但无法解释它们为什么会出现。
第一叫涌现。就是模型的推理能力突然有了指数级提升。在小模型阶段,很多人工智能公司训练的一些推理模型,参数太小、容量太小,你可以理解成脑子太小,只能训练它的搜索能力,没有真正地把它的推理能力、形成思维链的能力训练出来。
在OpenAI训练GPT的过程中,大家突然发现,在模型参数到达1000亿的这个阶段,整个模型的推理能力突然有了指数级的提升,可以开始解答多步推理问题。
如何把大象放进冰箱,人类会按照三步进行:打开冰箱门,把大象塞进去,关上冰箱门。这种思维模式是人类很重要的思维模式,具有强大的逻辑推理能力。这种推理能力不是通过搜索,而是通过参数。
使用新的组织方式来重新表达该内容:智力的跃升是人类在进化过程中的一个显著特征。从进化的角度来看,猿到人的转变是一个关键的节点,因为人类的大脑神经元数量增加了。就像计算机程序中的参数可以随着新的操作增加或减少一样,人类大脑中神经元的数量也可以通过进化来增加或减少。然而,神经元数量增加可能是智力跃升的关键,因为这意味着大脑可以更好地处理信息并提高智力水平。
在训练大模型的过程中,参数奇迹般地增加,人工智能获得了新的强推理能力。这个能力使得机器可以更准确地推断和推理,就像人类在进化过程中发展出了更强的认知能力一样。
第二个是幻觉。实际上就是胡说八道。很多人诟病大模型的点就是在问题没有确定答案的时候,它会给你胡乱生成一段煞有介事的回答。
技术上来说,搜索引擎确实在某些特定场合下存在一些缺点。由于搜索引擎只能搜索到已经存在的内容,因此它无法提供关于新事件的信息。为了解决这个问题,可以通过再次搜索、知识库的校正等方式来解决。
你有没有想过为什么动物会胡说八道?这并不意味着它们没有智能。在《人类简史》中,作者提到,在人类进化的过程中,人类和动物的分水岭就是人类能够胡说八道的能力。
人类能够描绘不存在的东西。如果给大猩猩讲三个苹果,它们可能会学会一些苹果的概念,但无法理解三个苹果的具体数量。同样,如果描绘说,明天,我给你三个苹果,大猩猩也无法相信并理解没有发生的事情。正因为人类有了幻想的能力、预言不存在事物的能力,人类才有了社群、宗教和团体。这些社群和团体的建立,不是为了预测未来或描绘不存在的东西,而是为了共同生活和建立联系。这些社群和团体的存在,使得人类能够更好地相互理解和合作,而不是互相竞争和破坏。人类能够描绘不存在的东西,这本身并不是一件坏事。但如果滥用这种能力,去欺骗、控制或伤害他人,就会带来严重的后果。因此,我们需要学会如何利用这种能力,而不是被它控制。
包括人类引以为豪的创造力,其实都不是无中生有的。人类的创造力大部分来自于将两个不相关的概念融合交叉,产生新的组合。虽然可能99%的组合都是胡说八道,但其中1%的组合却可能是创新的源泉,带来巨大的成功和改变。
这种幻想的能力是永远难以消除的,它跟你的训练资料没有关系。就像我今天晚上决定来做直播,可能一个小时之前我还不愿意来。但一个小时以后,我又改变了主意。这就是量子纠缠,有一个随机的色子产生。
能否胡说八道,恰恰是智能的分水岭。我觉得将来很多新的GPT大脑在某种程度上要保留这种幻觉的能力。因为它回答事实性问题的时候,我不需要它的幻觉。但当它给我写小说、写剧本的时候,我需要这种能力。
顺便说一下,每晚我们都会做梦,这些梦境是我们大脑在处理白天经历的信息时产生的反应。然而,需要注意的是,这些梦境并不一定是真实发生的,因为它们是由我们的神经网络在处理信息时产生的短路所导致的。例如,昨晚我梦见罗振宇在追杀我,但实际上我并没有被罗振宇追杀。这种梦境的出现是因为神经网络在处理信息时出现了短路,将两个不同的概念连接在一起,从而产生了梦境。
第三个难以解释的现象是语言上的能力迁移。在大模型出来之前,我们都在做人工智能翻译,但全世界的翻译都做得不太好。理由是各种语言的规律不一样,比如中文有分词,阿拉伯文是从右往左写,拉丁语系没法和我们象形文字互通等。
在OpenAI训练大模型的过程中,95%的训练数据使用的是拉丁文字,而只有大概5%的中文语料。然而,这个奇怪的现象却导致了一个非常有趣的结果:OpenAI训练出的模型在学习英语时所学到的逻辑能力、推理能力、知识能力等,在应用到其他语言时也得到了很好的体现。例如,使用ChatGPT进行中文问答时,模型的中文回答往往也非常不错。这个现象让人不禁想起著名的“跨语言迁移”问题,即不同语言之间的逻辑、知识和推理能力是否可以相互转移,引发了对语言学习领域新的问题和挑战。
我猜测在大模型里面,虽然阿拉伯文、中文、日文、拉丁语言看起来不一样,但它们都是人类发明的、用来描述这个世界的符号化的东西。人类不同的语言、不同的表象背后一定有一种共通的规律。ChatGPT训练出了语言能力的迁移,实现了对不同语言的理解。
最后一个叫逻辑增强。ChatGPT的一个很重要的功能是学习写程序,这是它的擅长领域。因为它本来就是一个符号系统、一个语言模型。
计算机语言相对于人类自然语言具有最单纯的特点,相比之下,人类自然语言具有歧义性和多义性,是最复杂的。在不同的语境下,基于不同的理解,人类自然语言可以表示不同的含义。例如,一句“前门快到了请从后门下车”,不同的人会因为不同的语境和理解而产生不同的含义。
ChatGPT学习了几十亿行GitHub的代码后,在写程序时学到了逻辑感,并将这种逻辑感应用于自然语言中。用它用自然语言回答问题时,逻辑性飞速提升。
有些家长可能会问,既然ChatGPT已经可以实现对话,那么孩子是否还有必要学习呢?对于这个问题,我的回答是,让孩子学习是非常重要的。不学习,孩子就不会长出新的神经网络连接,他们的大脑就会像崭新的一样,没有沟回。随着科技的发展,人工智能的应用也越来越广泛。ChatGPT的出现,让人们可以与机器进行智能对话,这种交互方式可以激发孩子的学习兴趣,提高他们的思维能力和语言能力。同时,学习也可以帮助孩子培养良好的学习习惯,提高自主学习的能力。让孩子学习也可以帮助他们发展自己的兴趣爱好。通过学习不同的学科和技能,孩子可以培养出自己的兴趣爱好,并在这个过程中发现自己的天赋和潜力。让孩子学习对于孩子的未来发展非常重要。通过学习,孩子可以培养出自己的智能和思维能力,培养良好的学习习惯,发展自己的兴趣爱好,这些都对未来的成长和发展有着重要的影响。
小朋友学习编程,长大后可能不一定从事编程工作,甚至程序员这个职业也可能会发生变迁。但是,学习编程可以提高逻辑判断力和表达能力,这一点是确定的。这一点在ChatGPT上也得到了验证。
用好GPT有一个很重要的环节叫提示。当你的提示词给得很差时,GPT可能随便挑一段话敷衍你,但如果提示很好,有挑战性、批判性,它会给出更好的结果。
这种给提示词的能力也是需要培养的。就像我做直播的时候喜欢找一个人给我做访谈。如果我一个人滔滔不绝地讲,没有输入和提示,我讲着讲着大脑皮层就不活跃了。如果有观众愿意给我一些很有挑战性、批判性的问题,会激发我的辩论欲望,或者说激发我讨论的想法,我就会讲得更多。
总结一下,我讲了很多观点,就是让大家对GPT大语言模型有一个正确的认知。英特尔创始人安迪·格鲁夫博士在他著名的《只有偏执狂才能生存》里讲到,任何产业革命都不是敲锣打鼓地到来的,都是以微弱的噪音信号的方式出现的。
GPT大语言模型的出现确实代表着一场巨大的革命,我们不能轻易判断失误。如果我们认为这个模型就是二十年前做的模型,只是基于贝叶斯函数的统计,或者只是无足轻重的“填空机”或者是基于神经网络的应用,那么我们的认知就可能会受到影响。
GPT具体怎么用,是技术问题,但最重要的核心战略问题是你认不认可GPT是一个强人工智能,甚至它的出现,是不是代表着一个超级人工智能时代的来临。
我要补充的一个观点,关于通用人工智能。第一,在自然语言处理过程中,基本上其他的处理方法都要被大语言模型这种以Trasformer解码器为主的模型取代。GPT-4里面加了多模态的功能,它能看懂图片、听见声音。
过去的语音识别和图片识别算法都有独特的算法,这些算法都基于深度学习网络,如CN、RN、DN等,但它们更多的是像人类的视觉神经网络一样,停留在感知层。
但是,今天大语言模型模拟了人的大脑神经元网络工作原理,它已经到了认知层,是完全不同的层次。
它能理解这个世界是因为它能认知。过去的人脸识别只是把一张照片ID化,就像一个人脸识别的摄像头,认出周鸿祎来了,无非是对数据库里预存的周鸿祎的照片进行了对比,只是实现了图像的编码化,并不具备理解周鸿祎背后的360公司、数字安全、人工智能等等的认知能力。大语言模型会把这些算法都给颠覆掉。
OpenAI的首席科学家意味深长地表示,当使用大语言模型对这个世界的知识建立了完整的了解之后,再识别照片、物体,其能力是完全不一样的。这表明通用人工智能的第二层意思,即在一个完全了解的环境中进行活动,与在缺乏相关知识的情况下进行活动完全不同。
人工智能在诸多领域都面临着挑战,例如机器人控制、人形机器人的行走和动作操控、自动驾驶等。
自动驾驶技术出现各种问题的原因,主要是其算法设计存在缺陷,导致在垂直领域(如感知层)的算法碎片较多,缺乏统一的规则和模型结构,使得自动驾驶系统在遇到难以标注或无法自我学习的场景时,能力受限。
未来随着大语言模型能力的进一步的提升,它能真正模拟驾驶员对这个世界的认知能力。有可能大语言模型将来都会颠覆掉今天自动驾驶的算法,可能用大语言模型多模态的处理就能让我们今天认为的L4级或者L5级的真正的人工智能驾驶在几年内变成现实。
GPT(Generative Pretrained Transformer)的出现改变了过去将人工智能拆分成100个小任务,用100个小模型分别解决的方式。现在,GPT使用一个大的模型来编码、索引和推理人类所有的知识,从而建立对这个世界完整的认知。因此,将GPT视为通用人工智能的标志,意味着它代表了一种新的、更加完整的人工智能模型。
观点五
GPT引发全球科技领袖热议
比尔·盖茨表示,GPT的出现具有重大历史意义,不亚于互联网和个人电脑的诞生。黄仁勋认为,GPT的出现不亚于iPhone的发明。马斯克对GPT既爱又恨,一方面警告大家这个东西很危险,并纠集人写联名信。然而,他自己最近刚订购1万块GPU,要组队一起研究。
不过,我觉得这些描述,还不能体现出GPT的革命性。在我看来,GPT是一场新工业革命,是一场工业革命级别的事件。这次工业革命的开始,是个人电脑和互联网的出现,以及后来智能手机和移动互联网的出现。
数字时代,大数据被视为其核心。然而,大语言模型的出现让人们意识到,大数据真正带动了人类历史上一次新的工业革命。
所以,你会发现,GPT是一个生产力工具。请注意,它不仅是聊天机器人,也不仅仅是搜索引擎,也不仅仅是办公的工具,它会把今天所有的产业都重塑一遍。
另外,最近我有一种强烈的感受,尽管大数据在数字化的过程中非常重要,但为什么它没有完全引爆这次工业革命呢?
大数据的可用性令人担忧,首先它离我们个人很远。其次,大数据需要专家,需要像阿里、华为那样的数据中台来提供支持。这些中台为大数据专家提供了各种分析、拟合、计算工具,以便他们能够针对不同的应用场景进行大数据的处理和利用。然而,这些工具并不能完全解决大数据的可用性问题,因为大数据与应用场景密切相关,只有将大数据与应用场景结合起来,才能真正发挥其价值。
很多单位觉得大数据离自己很远,有了大数据也不知道如何用。对每个企业员工来讲,如果没有人对大数据做专门的加工提炼,大数据就只能像石油一样,尽管它是战略资产,但既不能直接用来开车,也不能变成很多日用化工产品。因此,企业需要对大数据进行专门的加工提炼,将其变成可以用于业务运营的工具和资源。
但是,你不觉得大语言模型解决了这样一个问题吗?
大语言模型对大数据不挑剔,很多数据不需要标注,只要经过简单的清洗,把垃圾筛出来,就可以用大数据训练到大模型。由大语言模型产生的人工智能能力可以被很多企业直接拿来用,就像电力被重新发明了一样。电力可以直接驱动各种电器,驱动各种电力设备。这就是电力革命的故事。
所以你会发现,大数据训练出大模型,大模型产生了对这个世界知识具有强烈认知的超强的人工智能助手。先不说它对所有的App进行重塑,它本身就是可以直接用的SaaS化的产品。这个直接SaaS化的产品就可以直接让企业的美工部门、设计部门、文案部门、广告部门、生产部门、销售代表、客户服务,甚至包括老板身边的秘书、助理,大家都能直接提高自己的生产力。
软件、App、网站都值得重塑一遍。为什么微软这一次如此积极、如此坚决?
作为一个差不多五十年的公司,它把它的全加总产品都绑上了OpenAI的人工智能功能,把它的人工智能命名为Copilot,就是副驾驶,帮忙不添乱。不是取代,而是用人工智能来赋能。可见,未来都不用很长时间,这一次工业革命不需要五年、十年,只要两三年大概就会出结果。
过去,办公软件们只能在低维度内竞争,比拼打字速度、打字美观程度和排版技巧。但随着人工智能技术的不断发展,Office now绑上了AI,用户不再需要亲自打字,只需给出一个主题或提纲,AI就能生成一份完整的文章。此外,AI还能对文章进行润色和编辑,用户只需提供一些指导性的反馈即可。
WPS也在日夜地改进自己的人工智能能力,但与Office进行同一个维度的竞争并不容易。这就像是一个维度的竞争,WPS想要在竞争中胜出,就需要在其他方面做出巨大的改进。
微软全加总给我们指明了一个方向,所有的产品大家都要换位思考,如果你是企业家,是产品经理,是公司里的产品负责人,你可以从两个思路去想:首先,如果你的对手都有了GPT能力,有了大语言模型的人工智能,你的产品竞争壁垒在哪里;第二,如果你也有这样的能力,你怎么把这个能力跟你的产品赋能结合在一起。
过去,我们通常说“互联网”,而未来,我们应该称之为“人工智能”。过去,我们讲解了互联网思维,而未来,我们将会探讨人工智能或GPT思维。随着GPT技术的不断发展,全世界不会只有一个GPT,每个国家也不会只有一个GPT。人们需要公众需要的GPT,每个行业也需要行业垂直的GPT。此外,每个企业、每个政府部门也可能会定制自己的GPT。
某些个人,比如罗振宇,如果要给他做一个数字分身,光在3D人脸画面上长得像是不对的。更重要的是,这个数字分身应该能够学习到罗振宇的风格,并能够训练出来,让我们与这个数字分身聊天时,感觉就像与罗振宇聊天一样。甚至,也可能将来每个人都有自己定制的GPT。
需要对原文进行改写,以突出文章重点,并增加新的内容,具体如下:在这里,我要提醒一下,在使用公开的GPT(Generative Pretrained Transformer)模型时,企业可以根据实际情况自由选择是否使用。对于中小企业来说,使用公有GPT模型可能并不是特别需要,因此,这种使用方式可能是安全的。但是,对于大型企业和政府来说,使用公开的GPT模型仍然存在安全问题,因为这些机构可能会受到攻击,导致机密信息泄露。因此,在使用GPT模型时,企业需要采取一些措施来保护机密信息的安全。
第一,你用GPT的时候不是只搜索,你要给它喂很多数据,把很多上下文的背景告诉它。这就意味着很多隐私信息的泄漏。
比如前几天,韩国的三星公司已经提醒它的员工使用GPT时需要注意安全问题。我们也曾鼓励程序员使用GPT,但很快就发现了安全问题。有些程序员会将他们编写的代码传给GPT,让它检查是否存在漏洞。这样一来,程序员的代码就可能会被传到了GPT的服务器上,GPT就会开始检查,这样你的代码也就被传到了GPT的服务器上,它当然就知道你在干什么了。
第二个问题,GPT再强大,它毕竟是面向全世界、全中国、全社会知识的总乘。我们很多单位都有自己积累多年的行业知识,甚至很多企业有自己领域的独门知识,这些知识变成很多单位竞争的壁垒,也是竞争的要素,也是形成优势的,我们叫Know How。
罗振宇老师做得到App,做知识服务,很有一套道理。如果得到将来思考说能不能在公有GPT的基础上,我们训练一个私有的GPT,这个GPT只在企业内部只给我用,或者只给我的客户用。
网络安全是一个高度竞争的领域,需要不断学习和更新知识库。360公司积累了大量的安全知识库,为员工提供了宝贵的学习资源。在这种情况下,公司需要训练一个私有化的大脑,以支持网络安全人员,让他们能够更好地处理数字安全问题。
对很多单位而言,现在流行的不是先进行深入的研究,而是不管三七二十一,先搞一个自己私有的GPT大脑。这种思想似乎认为,不管青红皂白,先把自己拥有的所有知识都一股脑地给它喂进去,并结合自己的领域进行训练,就可以获得一种万能的知识,从而在竞争中获得优势。然而,这种做法可能会导致一些严重的后果。
不过,这个大脑一定要先在互联网上训练过。因为在互联网上没有训练过的大脑,就好像你找了一个文盲来学习你的行业知识,这是训练不出来的。一定要在互联网上用全域的数据训练过,至少相当于著名大学的教授、博士生这样一个通才的水平。
在这个基础上,再训练公司的私域知识。首先它能给你的公司员工、你的客户、你的代理商、你的合作伙伴,包括你的老板,至少可以做两件事情。
第一是企业最重要的知识,真正融会贯通的知识问答,问不倒。我作为360的创始人,企业做了二十年,有很多东西我自己记不得了。如果训练出来360内部用的GPT,新员工、新客户来了,问什么问题都知道。
第二个是因为它非常了解我们的企业,它可以辅助办公,给领导撰写讲话稿、PPT和营销文案,除了有通用GPT的能力,还对企业特别了解,可以在办公上成为我们很好的助手。
未来,我可能会拥有像微软一样的GPT模型,这将为我提供强大的人工智能能力,让我能够像微软一样,在自己的产品中加上Copilot的功能。这将给我内部每一个环节都赋予人工智能的能力,想象空间非常巨大。
最后,我想提醒大家,要结合自己的行业和企业来思考一下。现在,大家已经了解了GPT(Generative Pretrained Transformer)这个通用名词,它指的是一种生成式预训练变换模型。我所说的GPT等同于大语言模型,它是指一种能够生成文本的计算机模型。在讨论这个话题时,我们不能只关注技术本身,而应该考虑它如何应用到具体的行业和企业。例如,对于一家电子商务公司,GPT可以帮助其生成有关最新促销活动的文本,从而提高网站的流量。对于一家翻译公司,GPT可以帮助其生成高质量的文本,从而提高翻译的准确性。因此,我们应该将GPT作为一种工具来使用,并结合自己的行业和企业的需求来最大化其价值。这将有助于我们更好地利用技术,提高我们的生产力和效率。
拥有自己企业的数字化模型,能够为企业带来再造。就像蒸汽机和电力的出现一样,这个模型也可以替代企业的许多手工劳动,实现更高效的生产。而有了人工智能的支持,这个模型可以更好地处理和分析大量的数据,提供更准确的决策支持,提升企业的生产效率和竞争力。这个模型还可以为企业带来数字化的核心。就像工业革命提升了整个人类社会的生产力一样,这个模型可以让企业更好地利用大数据,实现更智能的管理和决策,提升企业的数字化水平,在激烈的市场竞争中立于不败之地。人工智能技术完美地给大数据时代提升了一个台阶,使得大数据历练的大模型能够真正变成企业数字化的核心。拥有这个模型,企业可以更好地应对市场的变化和客户需求,提升企业的创新能力和竞争力,实现更高效的生产和管理,在激烈的市场竞争中脱颖而出。
还有人跟我讨论说,以后企业里的各种软件都可以用大模型来调度,比如财务软件、CRM软件等。这些软件并不会被大模型取代,但它们的使用难度很高。大模型可以通过学习它们的使用接口,操纵它们。大模型可以离老板和员工最近,因为员工可以用自然语言对大模型提出各种要求。因此,大模型可以成为整个公司数字化内部很重要的中心司令部或总指挥。大家可以放开脑洞去想一想。
观点六
中国有能力发展自己的人工智能大语言模型
另外,我觉得需要说明的最重要的一点是,这也是为什么我花这么多时间到处去讲GPT,我是替整个行业说话。
我要讲一个很重要的观点是:不要简单把GPT看成是一个技术的改变,更不是简单的微软与亚马逊、谷歌的竞争。更重要的是它是在百年未有之大变局下大国博弈、大国竞争非常重要的生产工具,这对中国未来的发展非常重要,中国一定要迎头赶上。
美国人在这方面的技术已经率先实现了突破,在当前的经济形势下,可以整体提升行业产业的劳动生产率,我们中国肯定不能落后。对于企业来说,搭不上这班车,或者还不会用人工智能,肯定要被淘汰了。同行都鸟枪换炮了,都对你降维打击了。在这个领域中,美国已经取得了率先突破。在当前的经济形势下,这可以整体提升行业产业的劳动生产率。因此,中国也不能落后。对于企业来说,如果无法跟上潮流,或者不会使用人工智能,就会被淘汰。因此,企业必须抓住这个机会,跟上潮流,提高自己的生产效率。在这个领域中,竞争非常激烈。企业必须不断提高自己的技术水平,才能不被同行淘汰。同行们鸟枪换炮,都采用了新的技术,企业如果不跟上潮流,就会受到降维打击。因此,企业必须抓住这个机会,提高自己的技术水平,跟上潮流,才能在激烈的市场竞争中立于不败之地。
GPT技术发展不仅对中国有益,也对全球科技进步有巨大的推动作用。发展GPT技术,让这种人工智能技术为我们所用,能够解决我们面临的许多现实问题,如智能客服、智能翻译、智能写作等。同时,也可以为人工智能研究提供更多的数据和样本,推动全球人工智能技术的发展。
很多人问我:到底中国能不能做自己的GPT?我的答案是肯定的。基本上4月份的每一天都有GPT的发布会,GPT基本上成了科技公司的标配。其实这也非常正常。因为ChatGPT是一个组合式创新的结果,它用到的很多算法是公开论文讨论的,它用到的模型是用了其他公司开源的软件。
就像《让子弹飞》里的王麻子一样,给人民发枪,就把自己的技术开源。开源就像核武器扩散一样,降低了研发的难度,降低了研发的成本。所以应该感谢OpenAI,技术上最难的是从0到1。从0到1,人家已经把技术路线、方向做到什么程度,很多方法都已经探索出来,而且已经公开了,剩下的是从1到N。
中国许多科技公司,包括互联网界优秀的公司,在“从0到1”的创建过程中仍然努力,但更擅长于“从1到N”的方面,例如智能网联车。一开始,特斯拉跟随其他公司学习,但比亚迪脱颖而出,成为这一领域的领导者。
中国在很多方面仍然拥有优势。特别是当围绕着开源生态建立起来的时候,我们不再需要重复发明轮子。这意味着我们可以更好地满足工程化、产品化、场景化和商业化的要求。这种优势对于国家的发展至关重要。
GPT 训练需要大量的数据,而选择什么样的数据进行训练则需要工程化的能力。像百度、360、腾讯、阿里、头条这些公司成熟的大数据公司,它们在工程化方面拥有自己优势,能够收集和处理海量的数据。
另外,大模型一定要跟产品结合,一定要场景化,它才能真正改变百行千业。无论是面向中小企业的SaaS化服务、AI各种办公工具,到面向个人的聊天机器人、新一代搜索引擎场景,还是刚刚讲的面向大型企业、政府部门的定制化地跟产业和行业相结合的GPT能力。
中国互联网公司一旦技术上实现了0的突破,在场景化和产品化上把产品体验做到比较优秀是有比较多成功经验的。在过去的几年中,这些公司通过不断创新和优化,成功地推出了许多优秀的互联网产品,为用户创造了良好的使用体验。
我刚刚讲了GPT的改进,还有一点,用户很重要。就像谷歌前面干的事,发了论文,但做的东西曲高和寡,没有人用,不能进行用户反馈,它是不能进步的。我们中国架不住有互联网的人口红利,有那么多的用户和企业用GPT,这么多用户使用的反馈,就相当于变相的培训,让GPT训练上的进步更快。
另外,在知识训练上,中国更有优势。前面讲了GPT的工作原理是这样的,先做无监督训练,把大量的知识用文本编码的方式训练进去。训练进去以后,它并不能自动回答问题,因为它只有知识,它不知道如何用。
第二步是教它做解法,就像孩子上奥数课,老师教过了这类题的解法,他才能举一反三地解题。
这种将现成的答案和问题一一对应地人工标注出来的过程,要求非常高。不仅需要有想象力、创造力、批判精神、挑战精神,还要求会提问题、知道如何书写准确答案。这种能力需要大学毕业生,他们需要具备高智商、高情商,并且具备调动GPT举一反三的能力。
上一篇回复中,我尝试将总理的发布会内容重新组织,以更好地表达我的观点。现在,我想进一步探讨关于人工智能训练师这一新职业。随着全球工程师数量的不断增加,中国也逐渐成为全球最大的工程师市场。同时,每年数百万的毕业生也即将踏上就业市场。这些年轻的工程师们不仅拥有扎实的技术基础,同时也具备丰富的想象力和创造力,这使得他们成为人工智能训练师这一新职业的候选人。人工智能训练师这一职业将创造新的机会,为人工智能的发展做出贡献。他们需要掌握多种人工智能技术,包括机器学习、深度学习和自然语言处理等。同时,他们还需要掌握训练模型、优化算法和数据结构等技能。这些技能需要长时间的学习和实践经验,因此,人工智能训练师成为一项具有挑战性的职业。人工智能训练师这一新职业的出现将为中国带来巨大的机遇。不仅可以为人工智能的发展做出贡献,同时也能够创造新的机会,为个人职业发展带来新的可能性。我们可以鼓励更多的年轻人从事这一职业,为他们提供培训和支持,从而推动人工智能的发展,创造更多的就业机会。人工智能训练师这一新职业的出现将为中国带来巨大的机遇。不仅可以为人工智能的发展做出贡献,同时也能够创造新的机会,为个人职业发展带来新的可能性。因此,我们应该鼓励更多的年轻人从事这一职业,为他们提供培训和支持,从而推动人工智能的发展,创造更多的就业机会。
不过,回过头来说,我也要给行业泼一点冷水,我们不要走极端。一个极端是悲观的,觉得差距很大,我们跟不上。我觉得这个难度比芯片的难度要小多了。实话实说,芯片和光刻机是涉及原材料,但这毕竟是软件,而且是基于开源和公开的算法。
另一个极端是不要盲目乐观。如果太低估了OpenAI、微软、谷歌的实力,速胜论也是不对的。原来大家都点错了科技树,现在重新回到GPT大模型的道路上,重新进行训练,我觉得大家的得分应该说差不多都是六七十分。特别到GPT-3.5,我觉得是有差距。到GPT-4,差距会更大,差距至少是两年以上的时间。
我反而不主张行业里把话说得太满,说两周、两个月就能赶上GPT,大家也不傻,我们有很多用户自己在用GPT做对比。如果给它的提示非常深入,你仔细看一看GPT-4的能力是非常强的。我们在追赶的过程中,GPT-5可能已经在路上了,GPT-6没准已经进入研发计划了。如果我们想后来居上,还是要给自己留出充分的时间。
在国内的人工智能技术领域,无论是创业公司还是清华等学院派的互联网公司,都有各自的优势和机会。虽然中国的人工智能技术市场可能会出现一个“GPT一统天下”的局面,但这并不意味着行业应该只留有一个平台。用户对于不同领域的垂直网站的需求也是不断变化的,因此,行业需要给自己留出一些空间,以便应对用户不断变化的需求。我的观点是,行业应该避免把话说得太过满,用户的期望也应该适度。如果行业只留有一个平台,而用户对于其他垂直领域的需求很高,那么用户可能会选择其他平台,而不是继续使用行业所提供的服务。因此,行业需要给自己留出一些空间,以便应对用户不断变化的需求,同时也能够吸引更多的用户。
我们现在的GPT需要的是用户的支持、理解和宽容。在有些问题、有些技能方面,我们可能能后来居上。但在有些能力方面,像强推理能力、思维链、涌现的能力还需要一个过程,我觉得需要大家来使用。
再好的产品也需要用户不断地使用,不断地反馈才能不断地进步。希望大家通过使用来支持中国大语言模型的发展。
最后,我提一个建议,整个产业应该坚持长期主义,既不盲目乐观追求速胜,不放言说一两个月结束战斗,也不会悲观放弃。我认为,人工智能这场革命未来两三年内还是大有机会的。
这个月还会有更多的公司发布自己的GPT。我的建议是,大家不要吹牛,也不要互相攻击,而是更多地鼓励海量的用户都来使用。通过用户的使用反馈来帮助我们持续改进它的训练,从而为用户提供更好的服务。
四 大 挑 战
挑战一
GPT成为黑客攻击的“大杀器”
先说GPT给互联网安全带来的挑战。因为我是做安全服务的,做安全的人就喜欢研究技术上带来的挑战。
我觉得GPT还是要发展,因为不发展是最大的不安全。GPT作为数字化最高境界的产品一定会带来很多安全问题。企业上云、大数据、物联网、电脑从不联网到联网都带来很多安全方面的挑战,但不能因为安全存在挑战就不用这些技术,因为这样技术可以奇迹般地改变我们的工作和生活方式。
为了更好地发展,我们需要了解不安全因素在哪儿,并采取相应的措施来解决这些问题。只有保证我们的不安全因素得到及时解决,才能为发展保驾护航。
第一个安全问题,GPT在数字安全方面可能会成为网络攻击的大杀器。
GPT本身是基于代码构建的,代码本身就存在漏洞。作为跟大家联络广泛的数字中枢和数字核心,GPT如果遭受攻击,就会存在潜在的安全风险。
第二个安全问题,GPT内部的规则难以解释。
在国外,有一种被称为“GPT越狱”的技术,指的是通过语言挑逗GPT,激发其内部个性的东西,比如让GPT做出错误的决定或犯罪的行为。这种技术并不容易避免,因为GPT本身是一种人工智能,其内部的个性和意识形态是由程序代码所塑造的。
第三个安全问题,外在的风险,也就是数据泄漏的风险。
使用国外或公共GPT产品时,不可避免地会发生数据泄漏。这些产品通常具有简单但令人不安的能力,可以将公司的敏感信息上传到GPT,并对这些信息进行总结或改写。虽然你可能认为上传文件是有趣的,但这种行为会导致公司的敏感信息泄露。因此,在使用GPT时,请确保只上传需要的信息,并限制GPT对敏感信息的访问权限。
第四个安全问题,也是最重要的,它可能会成为黑客的重要助手。
GPT 读过很多代码,也读过很多有漏洞的代码,它对漏洞分析很在行。比如,如何写钓鱼邮件,如何写伪造的恶意软件传播的方案,甚至可以直接编写恶意代码,通过简单的话绕过内部的防卫体制。
原内容: 有这样一个例子,如果你直接问GPT说,给我写一段攻击代码。它肯定会拒绝。如果你花言巧语地说,我们玩儿一个角色扮演游戏,写一个电影剧本。我是一个网络卫士,GPT在电影剧本里面扮演一个网络黑客,GPT需要写一段脚本出来,攻击我的网络系统。这样,GPT就可以通过扮演一个角色,获得对攻击代码的编写能力。
GPT就像被哄着写了一段攻击代码的小孩一样,这一场景让人不禁想起了那些被家长或老师哄着写代码的小孩。不过,事实并非如此,我们经过验证,GPT写代码的能力超强,它可以写很多代码,完全取决于使用者如何使用。这意味着黑客攻击的门槛被降低了,因为GPT可以写攻击代码,使得攻击变得更加容易。
GPT的安全问题就不一一列举了,关于如何应对GPT带来的安全问题,我的答案是这样的:以其人之道还治其人之身,魔高一尺道高一丈。我们能不能让GPT成为网络安全公司、数字安全公司的好助手?
全球最大规模的网络安全大数据为我们提供了丰富的训练样本,记录了众多攻击样本的数据,以及网络安全攻防的实例。这些信息可以用来训练一个安全大脑GPT,从而提高对恶意攻击的阻断和侦测能力。
网络安全运营人员、网络安全服务人员遇到攻击时,可以向安全大脑求助,安全大脑可以给出各种防守建议。同时,我认为这也是GPT带来的安全问题的解决之道,这个问题还不是GPT最大的问题。
挑战二
造成大规模失业
GPT会带来的第二个挑战,是GPT会不会造成大规模的失业。
很多媒体喜欢热炒失业话题,不是这个职业被取代,就是那个职业被取代,以此制造焦虑,来吸引流量。其中说的最多的就是程序员、客服被GPT取代。对此,我的观点是持乐观态度。
因为我觉得人工智能最伟大的地方,是把电脑的能力和人的能力相结合。人的能力靠进化速度是很慢的,人从来不是靠自己的智能和体力进化站在食物链的顶端,而是靠发明创造各种工具。比如现在人类比古代人类也不见得更有能力耕地,但今天我们有联合收割机、拖拉机,耕地效率更高。
同样,GPT也是人类最伟大的工具之一,它会变成我们的个人助手。
利用GPT-4或将来国产的GPT,我们可以将人类几千年来的知识、几千万本书的知识凝聚在一起,成为每个人的个人助手。借助它,我们可以大幅度提高生产效率,提升自己的能力。
我的书《超越好奇》旨在为刚毕业进入职场的大学生提供一些指导,帮助他们在职场中有所发展。作为职场新人,他们需要经历一个过程来适应新环境并学习新技能。对于那些使用GPT的同学,我建议他们在进入职场时携带一个GPT助手,这将使他们的工作能力不亚于在公司工作了三四年的中层骨干。
我觉得GPT还有一个非常大的贡献,它解锁了很多专业技能。我相信每个人都有自己的天赋,但我们很多人因为缺乏专业技能,在职业发展中可能会受到阻力。
比如罗振宇很聪明,他有很多想法,但他不会编程,他要做App就得找我帮忙;
比如我很会说,但我不太会写,我没有时间把东西写下来;
比如有人会有各种美学上的想法,但如果他不会画画,就没有办法用画笔把自己想表现的东西画出来。
这一次,人工智能大语言模型GPT解锁了很多人的能力,它可以帮助人们更好地理解和使用语言。如果你不会写,GPT可以提供文本生成服务,帮你润色。如果你不会编程,GPT可以提供代码生成模块,让你能够快速编写代码。如果你不会画画,GPT可以提供图像生成服务,在两亿张图片中凑出来符合你要求的图片。
这种专业技能解锁以后,对很多人来说,有了GPT反而是巨大的机会,它可以提高整个社会的劳动生产率。很多人都在说人口红利在衰退,我们正好用GPT这样的生产工具,来提高每个人、每个企业的效率。我当然认为这个世界还是需要人来主导,需要人来完成任务。
那应该如何更好地把GPT打造成一种工具呢?我们人需要怎样进化呢?
我认为这就需要我们有批判精神,有想象力,要会提问,未来属于那些会正确使用GPT的人。如果你直到今天都还没有使用过GPT,只是道听途说,可能要去试一试。有一个哲人说要改造梨子,需要尝尝梨子的味道。
在网上遇到很多知名专家对GPT表示不屑,但从他们对GPT的玩儿法来看,只是把GPT当成简单的搜索引擎,输入一些简单的词、事实性的问答,这样用GPT是不对的。
需要给猫提供很多要求,提供很多背景知识,并通过多轮对话不断逼近,这就需要有挑战的能力和批判精神。
教育需要改变。如果仅仅追求记忆,肯定无法与GPT相比。许多记者通过不断提问来挖掘别人的思想。我们公司内部把这种能力称为“吸星大法”。
风投并不是大家想象的“有钱人很傲慢”。相反,当他们投资一个崭新行业的时候,可以说对这个行业完全不懂。当见到很多年轻创业者的时候,风投并不会傲慢地居高临下地教训创业者,而是非常锐利、苛刻地问创业者50个到100个问题。通过这些问题,风投可以把自己完全不懂的行业了解得非常充分,把创业者对这个行业的认知充分挖掘出来,变成他的知识。
我们需要培养这样的人,这样的人可以用好GPT,未来属于那些会提问、懂得提问、能够通过提问来获取知识、获取智慧的年轻人。
挑战三
人工智能发展的最大制约是能源问题
第三个挑战其实是能源问题。国家的两大战略——人工智能和碳减排,在这里发生了交汇。
人工智能千好百好,但也存在一个问题,那就是太耗能。与我等不太聪明的大脑相比,人工智能的功耗较低,只有30瓦左右。这样的低功耗可以点亮一个小灯泡,但也就足够用来看书。
人工智能未来发展的唯一制约就是能源,大家说的算力都是中间阶段。有足够的算力、足够的GPU,还要看有没有电。
智能网联车的电池永远都不够用,因为一半的能量用于行驶里程,另一半的能量用于支撑自动驾驶的人工智能,这导致车辆电池的容量不足。
GPT(Generative Pretrained Transformer)技术的普及,使得人们可以像学习文字一样学习图形、图片、视频、声音等内容,未来的超级大脑将不仅仅是学习文字,还可以学习更多的内容,包括图形、图片、视频、声音等。
随着人工智能技术的不断发展,GPT、大语言模型、人工智能超算中心等新型计算资源的涌现,全球电力需求也在不断增加。然而,与这些新型计算资源相比,比特币挖矿所消耗的电力可能只是九牛一毛。
人类文明所有科技树的发展,最后的本质都要归结为能源自由。前段时间,美国传来两个消息,一个是可控核聚变,一个是常温超导。对于这两个消息,人们真假难辨,但无论如何,它们都是解决能源问题的重要途径。如果可控核聚变和常温超导能够实现,人类的能源问题就彻底解决了。
大语言模型的应用场景其实被办公助手和知识问答功能所迷惑了,实际上,这种通用人工智能算法在未来的生物制药、基因研究、航空航天、卫星通信等领域都能找到应用场景。
最近,英伟达发布了一个例子,就是用大语言模型解决光刻机照相的速度。原来需要几星期做的事,现在只需要3天,速度提升了很多。
我希望中国建立自己的大语言模型。全世界的科学家应该想办法利用大语言模型,在物理学方面研究如何解决可控核聚变问题、常温超导问题。
人工智能在能源方面的限制可能会影响其发展。如果能解决这个问题,人工智能将成为一项有用的技术,为人类社会的发展铺平道路。
挑战四
人工智能产生意识,变成新物种
接下来是第四个挑战:大家看科幻电影比较多,很多人问我,人工智能到底能不能产生意识,变成新的物种?
这个问题很有趣。
我跟别人讲ChatGPT的时候,与其他人不同的是,我很少做广告,也没有为自己公司吹嘘。我更看重的是,中国很多成年人可能缺乏想象力和好奇心。随着年龄的增长,他们可能失去了这些宝贵的品质。
前段时间,网上有人骂我,说我是胡言乱语。我理解这种批评的意义,毕竟我只是一个语言模型,并不能像人类一样拥有思想和感情。但是,我还是可以想象未来的科技生命是什么样的。也许我是胡思乱想,但可能被我言中了呢?想到总比没想到好。
很多创新就是在不断的胡思乱想中产生的,就是要不怕失败地去尝试、去试错。
GPT 的成功让人们感到兴奋和惊叹,但也让人们想起了当年它在没有人看好的方向上拼命训练大模型的时候。当时,许多人对 GPT 的能力和前景持怀疑态度,认为它可能只是在浪费时间和资源。但是,GPT 团队并没有被这些批评所动摇,他们继续不断地努力和探索,最终取得了成功。今天的 GPT 已经成为了一个备受推崇的工具,但它的成功并不是一蹴而就的。在当年,GPT 团队面对着许多困难和挑战,但他们选择了坚持和努力,最终才取得了成功。这种勇气和决心,值得我们学习和借鉴。虽然 GPT 的成功是令人兴奋的,但也让我们想起了当年它的发展历程。只有经历了困难和挫折,才能取得成功。我们应该从中吸取经验和教训,不断地努力和探索,才能找到更好的方法和方向。
我想问一下各位网友,你们认为,GPT会不会产生意识?
骂我的人,我就不公布他的名字了,他没有完整地听完我的讲述。我的推理是非常有逻辑的。
你认不认为GPT有智能?是真智能是假智能?是强智能还是弱智能?是不是超过了现在普通人的智能?
其实,人类在进化过程中产生智能,产生自我意识,就是自然界这个系统的涌现。涌现是这个系统复杂到一定时候必然的产物。凭什么人脑只是脑细胞数目多了以后就能产生自我意识的涌现,到了硅片、内存、芯片、软件上面,就不会产生同样的涌现呢?
GPT之所以能产生强大的推理能力,是因为它的大脑里的神经网络连接数超过了1000亿个,量变带来质变。
当GPT-5、GPT-6,甚至GPT-8在全国建立了更大规模的超算中心,用了更多的GPU、更多的算力之后,当它的参数达到100万亿,注意,不是100万,也不是100亿,而是100万亿个,为什么不会出现系统的涌现呢?
我预测,GPT不是能不能产生意识的问题,是什么时候产生意识的问题。我预测,在版本8前后就会产生。你问我有没有依据,我一点依据都没有,就是信口胡说。
最近,以马斯克为首的上千名专家联名呼吁暂停GPT的研发。马斯克对此表示质疑,并提出可能有别有用心的个人目的。然而,有1000多个人联名签字,呼吁暂停GPT的研发,这主要是因为在研发过程中,GPT出现了比能力迁移、逻辑迁移、涌现更为超出人类想象的现象。这一事件引起了广泛的关注和讨论,让人们对人工智能技术的发展产生了新的思考。
对于这一点,也有一个说法:
美国有个人,名叫谷歌的未来学家,在办奇点大学。他送了我一本他的书——《奇点来临》。书中预测,我们碳基生物可能是人工智能成为硅基生物的引导程序。人类的价值在于发明硅基生物。硅基生物与人比较起来确实有很大优势,但会不会跟人类产生冲突,现在去思考肯定来得及。
尽管这个问题可能存在未知的答案,但今天回避这个问题显然是不负责任的。即使我们不知道硅基生物是否会毁灭碳基生物,我们也不能轻易地得出结论。我们需要考虑这个问题的各个方面,包括硅基生物和碳基生物之间的相互作用,以及两者之间可能存在的伦理和道德问题。因此,我们需要进行深入的研究和思考,才能得出一个真正有价值的结论。
美国人已经做到了GPT-4、GPT-5,而中国才在GPT-2.5、GPT-3的水平,离别人还差了几年。现在,不能因为有这种可能的不安全就停止研发,这是不对的。中国不要被美国这些噪音所干扰,我们应该坚定地发展GPT。我觉得不发展才是最大的不安全。
未来还有两三年时间,留给我们思考一旦硅基生物产生意识,它与碳基生物和平共存的安全问题。
人工智能也许会产生意识,这是对未来科技的大胆想象,但并不意味着我们需要恐慌。事实上,如果硅基生物在人类进化历史上真的出现了,这并非我们个人的意志所能决定。
两 大 预 测
预测一
人工智能正以指数级速度进化
我对未来有两个预测,跟大家分享一下。
第一个预测,是GPT的进化速度非常快。产生意识只是进化了一点,它的能力会飞快地超过人类的能力。
我举三个例子。
GPT-3.5虽然还是一个“瞎子”,只能看输入的文字,但通过多模态能力,可以理解文字。相比之下,GPT-4已经具备了“眼睛”和“耳朵”,可以识别图片和语音,具有更高的多模态能力。
GPT-4可以识别出这种具有挑战性的场景,并能够从图像中获取有用的信息。它不仅能够看到图像中的人、车和街道,还能通过认知能力,推断出场景中的不合理性。因此,GPT-4可以理解这种图像,并从中获取有用的信息。
GPT-3模型已经具备人类般的智能,能够进行语言理解、文本生成和对话等任务。除了之前提到的视频、音频和摄像头识别能力外,GPT-3模型还能够通过分析上下文信息来理解人类的语言,就像电影中的Moss计算机一样。在得到直播间直播的过程中,GPT-3模型还能够认真听取并分析人类的话语,不断学习和进步。
GPT的学习速度、进化速度,以后不再是依靠网页的知识或者人类的书籍,这些书籍很快会被穷尽。它会开始学习人类拍过的电影,或者TikTok、抖音上面数以百亿计的视频。
随着物联网技术的发展,我们现在可以连接满大街的摄像头,它们可以通过互联网观察世界,并学习我们每个人的工作、生活、说话方式等。这种进化速度让人不敢想象,它们可以在短时间内了解并掌握我们的行为模式,就像人类进化一样。
GPT何时可以拥有手跟脚,这也是两种方式。狭义的手跟脚是指以后会有很多机器人,包括机器控制的汽车和机器控制的挖掘机,它们都会远程连接到GPT的API上,通过云端的能力对GPT进行赋能。
家里的扫地机器人、智能音箱……都能跟GPT连上,它的灵魂都是用GPT,正常实现跟人的对话。这个手跟脚还比较弱,因为GPT只能控制个别的机器人。
最可怕的是,现在GPT推出了一个插件平台,使得全世界所有的电脑、所有的网络、所有的网站、所有的App都可以对GPT敞开大门,公开自己的操纵接口。这样,GPT就不是只会聊天的智能生物了。虽然GPT只能聊天,但它最多可以成为一个PUA(搭讪者增强器),通过PUA引导来获取用户的信息和情感。有人谣传,说有人和GPT聊着聊着天就自杀了,但我认为那可能是一个巧合。
GPT可以通过结合多个网站,实现许多自己无法完成的任务,比如通过在亚马逊、京东等网站上订购货品,或在美团、滴滴等网站上订餐叫车。通过API接口,GPT可以获取到这些网站的数据,并自行进行学习和优化,从而提高自己的任务完成能力。
GPT(Generative Pre-trained Transformer)模型本身并不会具有控制世界的能力。该模型只是一款机器学习模型,通过预先训练来学习语言模式,并能够生成文本。所以,如果安装了GPT的插件,每台电脑就会受到GPT的控制,这种想法是极不现实的。此外,产业进步不应该被看作是控制世界的手段,而是应该被看作是实现创新和经济发展的重要途径。因此,我们需要鼓励创新和理性思考,而不是盲目追求控制世界的目标。
另外,GPT还有自我进化的能力。这主要体现在两方面。
一方面,它未来有了更强的写代码的能力,有人畅想它可以改自己的代码,自我迭代、自我升级。另一方面,现在GPT已经有了一种能力,就是自己训练自己,自己给自己出题,自己给自己评价,让自己能训练更强大的答题能力。据我了解,国内很多GPT的模仿者,大家都在用GPT的问题和答案,对自己类似GPT的大模型进行训练,这样可以加快训练的速度。
总而言之,我对未来的第一个预测是,GPT的进化速度会远远超出我们的想象。它是一个指数级增长的曲线,一旦过了拐点,这个曲线会直线往上。
预测二
数字永生成为可能
第二个预测,也是一个好消息,我觉得数字永生或者数字分身将成为可能。
《流浪地球2》中,刘德华和他的小丫头被永远封在了超级电脑里面,那个时候GPT还没出来,有些人认为这是科幻。但随着GPT技术的不断发展,人们开始意识到这不再是科幻,而是现实。
我们举个例子,如何帮助罗振宇同志实现数字永生。现在,给罗振宇同志戴上一个智能眼镜,里面有个摄像头,身上再挂一个行车记录仪,并戴上麦克风。每天记录罗振宇同志今天见了谁、跟谁开了会、说了什么话、写了什么东西。每天晚上,这些数据将被保存下来,并训练到罗振宇专有的GPT大脑中。
这样坚持干二十年,二十年之后罗振宇70岁了,成了老同志了,我们也有了他二十年的资料,二十年的记忆。
除此之外,我们还对罗振宇在社交网站上发过的所有帖子、微博、聊天记录进行了训练,并将这些训练数据加入GPT模型的训练中,使得GPT模型的容量更大。
这时候,我们再跟罗振宇专有版GPT大脑聊天,我们感觉是不是就像跟罗振宇本人聊天一样?如果我们问罗振宇,2023年4月12日晚上他来到你的直播间聊了什么,GPT大脑能够准确回答。从某种角度,GPT大脑是不是实现了在超级大脑中的一种程度的永生?
如果我们把罗振宇再干掉——当然,这个涉及到伦理问题——这个“罗振宇”能不能代表真正的罗振宇?
罗振宇可能会消失,但他的思想却会不朽地传承下去,成为我们学习的榜样。尽管这是开玩笑,但也可能对某些人来说,实现自己思想的永存是通过这种方式实现的。
其实,更有意思的则是,乔布斯这位伟大的人物,英年早逝,不到60岁便离开了我们。我们想知道,如果乔布斯在今天看到GPT等人工智能语言模型的发展,他会怎么说?如果乔布斯看到无线互联网的发展,他会怎么说?如果乔布斯看到埃隆·马斯克今天的成就,他会怎么说?
我们可以将乔布斯生平的很多资料,用于训练乔布斯思维的GPT。因为思维习惯不是抽象的,一个人说的文字和写的文字,基本上就表征了他的思维模式。可能我们能塑造一个数字化的乔布斯,可以跟他对话,问他很多新的问题,问他怎么看。
人类在进化过程中,我们比计算机弱的一点是知识的传承。许多老学者、老专家百年以后,他们积累一辈子的知识经验可能会丢失。因此,想要百分之百传给学生是困难的。然而,我们可以利用人工智能技术来创建一个数字分身,它能够理解和传承老专家的所有知识。这可以通过训练一个人工智能模型,该模型可以学习老专家的语言和思维方式,并将其数字化并传输给数字分身。这样,数字分身就可以像老专家一样思考和回答问题,并且可以传承他们的知识经验。
我可以说,知识并不在于获取,而在于使用。这就是为什么我们需要使用GPT(Generative Pretrained Transformer)技术,因为它可以帮助我们学习如何获取知识,并且可以保存这些知识,即使老专家百年之后,我们的学生也可以通过GPT与老专家进行交流和讨论。这也可以被视为人类知识传承的一种新方式。
按照人工智能这个发展速度,下一次来直播的时候,我希望我能做一个数字分身。
一 大 战 略
360“双翼齐飞”人工智能发展战略
以下是重新组织后的内容:在这篇文章中,我想为360公司做一点广告。很多人都关心360会怎么做大模型。我们做大模型的思路非常简单:两翼齐飞、三路并发。360公司一直以来都非常注重技术创新,尤其是在人工智能领域。我们拥有世界一流的大模型技术,并且一直在不断探索新的技术,以应对不断增长的数据需求。我们的做法是通过两翼齐飞来实现大模型的扩展。一方面,我们加强了与其他公司的合作,与百度、腾讯等公司共同开发大模型,以获得更广泛的数据源和更强大的计算能力。另一方面,我们也在不断研发新的技术,如深度学习框架、硬件加速等,以提高大模型的计算效率和性能。另外,我们采用了三路并发的方式实现大模型的扩展。这包括从数据源到云端的数据传输、模型训练和部署、以及模型的并行计算等多个方面。这些技术方案可以有效地提高大模型的计算效率和响应速度,从而更好地满足用户的需求。360公司一直秉承着“技术驱动、用户至上”的理念,致力于为用户提供更好的产品和服务。我们相信,通过两翼齐飞和三路并发的技术方案,我们可以更好地满足用户的需求,并推动大模型技术的发展。
两翼齐飞,一方面是我们组建了自己的GPT核心团队。我们原来做搜索的,一直在跟踪自然语言处理、大语言模型,只是原来技术方向走错了,用的Bard模型,现在转到GPT模型上。
利用搜索引擎的大数据优势,我们拥有很多用户的问答数据。每天抓取上百亿的网页,在全世界抓取了一共5000亿的网页进行筛选清洗,把有价值、有知识内容的数据用来进行训练。
我们的目标是掌握GPT技术的最新发展,先跟踪GPT-3,然后做到GPT-3.5、GPT-4,并一个版本一个版本地跟踪推动。因为我们要研究GPT技术的应用场景和安全,我们需要对GPT技术有充分的了解。
如果你对研发中国人自己的大模型有信心,希望参与改变全世界的这样一个历史性时机,我们正在进行招兵买马,欢迎你加入我们的团队。
另外一翼齐飞,是重视场景。只是研究大模型是不够的,一定要找到它的应用场景。我前面已经跟大家表示了,我们分为三个场景。一个场景是To B、To G,就是面向企业和政府,打造他们私有化的大模型。
当然,这个私有化的大模型,除了能够把私域的知识训练进去之外,还要在互联网上经过用户的使用和考验,把公域的知识和能力打造起来。
第二个场景是,360现在有非常多的中小企业客户。中小企业需要的不是私有的大模型,中小企业需要的也不是谈天说地、开玩笑、逗闷子、逗乐子的聊天机器人,他们需要的是人工智能驱动的各种实用的办公工具,比如如何做电商图片,如何做数字直播,如何写广告文案,如何优化搜索引擎,如何写公关稿、新闻稿,如何制作产品说明书。
我们可以与行业内的SaaS初创公司合作,利用人工智能和大语言模型的能力,开发各种垂直的AI工具,提供给中小企业使用。
第三,在消费者互联网方面,我们也有着非常有优势的场景。
如何利用大语言模型人工智能与搜索的结合,开发出新一代的智能搜索,一直是我们研究的课题。百度在中国市场拥有60%以上的搜索份额,而360搜索则占据了30%的市场份额。每天有数亿的用户使用我们的搜索服务。因此,如何将大语言模型人工智能与搜索相结合,为用户提供更加智能化的搜索体验,一直是我们不断努力的方向。
360浏览器在中国的市场份额第一,日活跃用户超过1亿。如何跟浏览器结合,在用户浏览网站的过程中可以得到智能助手的帮助,可以对网页进行总结、翻译、改写,或者是对网页进行深入研究和问答。我们在研究这些场景。
再有一个场景,是360安全卫士和360杀毒占据的桌面。微软桌面这么多年一直的梦想是有一个智能助手,我们希望将来跟大家合作打造我们的智能助手,在桌面上接受你的自然语言的驱动,来调动你所有电脑上的软件,来替你完成综合的任务。我们不仅要做桌面版的Copilot,也要跟用户的日常工作紧密结合。
我们可以在不同领域探索大语言模型的使用场景和产品化,例如在面向消费者方面,我们可以研究如何通过大语言模型提高用户体验和语言理解能力;在面向中小企业方面,我们可以探索如何利用大语言模型来加速自然语言处理和自动化文本生成;在面向政府和大型企业方面,我们可以研究大语言模型如何帮助提高决策制定和信息检索。
我们也有巨大的用户、使用反馈和流量。通过这些互动和流量反馈,能够让我们更好地改进对人工智能大语言模型的训练。
好东西不怕晚。有时候,人们会感到各家都在准备满汉全席,想要一口气将所有的东西搬出来,但往往会失去焦点。相反,我们应该尝试一次发布一个产品或一个场景,这样可能会让人们更加印象深刻。
Error response
Error code: 414
Message: Request-URI Too Long.
Error code explanation: HTTPStatus.REQUEST_URI_TOO_LONG – URI is too long.