数字中国建设峰会
返回
孙珂在第六届数字中国建设峰会数字生态文明分论坛上的主题演讲
百度智能云技术委员会联席主席
发布时间:2024-07-05 15:36 文章来源:峰会组委会秘书处
大模型时代的人工智能技术
孙珂
百度智能云技术委员会联席主席

尊敬的各位领导、各位嘉宾,大家好!非常荣幸今天有机会来到这样的一个地方,给大家去做一下人工智能有关的一些相关进展的汇报。

1956约翰·麦卡锡等人发起达特茅斯会议,共同讨论“人工智能”并催生了后来的人工智能革命。1986年以符号学为代表的专家系统兴起,美国AI相关软硬件销售高达4.25亿美元。1997年5月,IBM的深蓝(DEEP BLUE)计算机战胜了国际象棋大师Gary Kasparov。2016年3月,AlphaGo在与围棋世界冠军李世石的人机大战中取得胜利。2018年10月,Google发布预训练NLP模型Bert,在11项NLP任务中取得State of the art 成绩,拉开了人工智能“大模型”时代的序幕。2022年11月,OpenAI发布基于“大规模生成式语言模型(LLM)”的ChatGPT,涌现出通用人工智能的特质。

是什么样技术的发展推动了这样的变革?助推这样一个技术的发展,是由这三件能力决定的,大的算力、大的数据和大的模型。数据量实际上在几年之前,我们最经常使用的维基百科是40亿的数据量,到了现在,我们已经有2万多亿的数据来支撑模型的训练了。

百度在3月16日,刚刚四五十天之前,推出了自己的大语言模型。这样的一个模型能够具备一个非常全面的,就像刚才讲到的投用的人工智能的基础能力。总体来说是三大块的能力,理解能力、创作能力、推理能力。这三个叠加到一起,再叠加一些大语言模型非常特有的记忆能力,那么它可以形成新一代的交互式AI技术。

可以知道这样一件事情,实际上它几乎是直接跳过了以前我们所需要做的一系列问题。比如说数据的清理、检索索引的构建,都全部直接跳,直接就面对的是最原始的文本,然后进行理解,然后去解答你的问题,就结束了,这是理解能力的变化。

它还有一个非常强大的能力,叫作推理能力。现在我可以给大家举一个这个例子,我要问大模型一个问题,我有辆车停在那儿没有熄火,丢了一些东西,为什么车上的东西会丢。我跟它的交互就是这点东西,它在整个过程中自己逐渐地分析和推理,并且最后得到一个推测。就是汽车里面的东西被盗,是由于报警人没有锁车造成的。

刚才其实已经讲了三个最基本的基础性能力,除了这种基础性能力以外,实际上结合这三个基础性能力,我们整个系统是可以再进一步扩展,把它变成一个全新的新一代的交互式系统的。

做一个简单的对比,一年之前小度的各种各样对话引擎,都是用这样的结构来做的,包括我们各种各样的客服。所有业务的处理能力都是要由我们的专家一个一个编进去,当你遇见什么样的情况,要往哪个分支走。大家如果打各种各样自动客服的电话,都会遇到这样的东西:请按1、请按2、请按3……一路给他带下。

但是现在这种大模型能够让它做到什么程度?其实很简单,它可以非常极大化地降低我们开发系统的难度了。基本上要通过两步,第一步授予大模型使用工具的权限和规则,第二步接下来大模型会记住这个事情。

我这里面举的一个例子,小明是12岁:第一个问题,五年后他多大了?

第二个问题,他大学毕业了没有?

模型想到的第一个问题是我需要计算他五年后的年纪,接下来它会推演出来两个东西,一个叫作工具,它的输入是多少,接着我们观察它并且调用工具。调用完了之后,我们得到一个答案17岁。到第二个问题,模型继续想这个人这个时候是不是会从大学毕业?这个时候它还要调用另外一个工具,就是搜索工具,找到各种各样的反馈结果。拿到这些结果以后,它会综合地判断,它是不是知道最终答案,如果知道了,没问题,把这个答案输出出来、也就是说它已经基本上具备了自主调用各种各样工具能力接口的能力。

百度公司的一个使命叫作“用科技让复杂的世界更简单”,那么在大模型的时代,在生成式大模型到来的现在这个时间点上,我们觉得这样一句话让我感受到非常深刻,而且事实上有可能通过一个大模型,我们真的可以让世界变得非常简单。未来我们可能只需要通过一个大模型,就可以解决我们生活中所面对的各种各样的问题。

谢谢各位,最后预祝大会圆满成功,谢谢!

(以上内容根据嘉宾发言速记整理)

扫一扫在手机上查看当前页面

附件下载