黄锋在第七届数字中国建设峰会数字生态文明分论坛上的发言
百度智能云工业产品部总经理
发布时间:2025-04-08 10:06 文章来源:峰会组委会秘书处

大模型助力生态环境创新实践

百度智能云工业产品部总经理

黄锋

  各位领导、各位嘉宾,大家下午好!非常高兴有这样一个机会能够分享一下我们对于大模型技术的理解以及大模型技术在生态环境行业的一些创新的实践。

  其实随着2022年年底OpenAI发布了ChatGPT大模型之后,整个大模型技术掀起了一股浪潮,在全球都是一股浪潮。首先这个技术本身在快速迭代,从3.0、3.5到4.0,从原来只能处理文本到开始向Sora可以处理视频到后来开始处理语音,做语音方面的一些多模态的处理,这些是在国际上非常快速地发展。在国内也一样,现在大家讲说有百模大战,我们国内不管是一些互联网的大厂还是创业公司,发布了上百个大模型。对于百度而言,2023年3月16日发布了文心一言大模型,10月升级到文心一言4.0,直到上个月,短短一年时间,我们的文心一言在全国的用户数突破了2亿,每天的调用量也突破了2亿。同时我们大模型应用开发平台有近10家企业客户基于大模型平台开发了自己的一万多个专有大模型。所以我们可以看到,大模型技术不管在国外还是在国内,都有一个非常快速的发展。

  大模型除了面向消费者、面向网民可以提供写诗、作画等偏娱乐的服务之外,实际上我们认为大模型在行业里面的价值释放和应用最终所产生的社会效应是更大的。

  如何理解大模型?或者说它为什么在过去一年多时间里有这么飞速发展?底层还是在算力,芯片算力、推理速度、训练速度远超以往,有了非常大的发展;第二前面也有专家提到,那就是数据的积累。其实还有一个就是参数量规模的快速增长、算法的提升,这三个因素造成大模型涌现等级以及理解记忆推理能力越来越强。

  大模型作为一种新型的生产力,同时它是一种新型的生产工具,这个工具作用于各行各业一定会带来对生产资料特别是生产资料的数据价值带来更大的挖掘和释放,同时一定会改变未来的生产关系。所以,大模型这个技术跟各个行业做融合、做应用,未来一定会给各行各业带来一个非常大的改变。

  有专家提出说,以大模型为代表的人工智能的技术其实是第四次工业革命里面最核心的驱动因素,我们如何理解这件事情呢?其实我们回顾前面三次工业革命,第一次工业革命最核心的技术是蒸汽机,它替代了人的少量的体力劳动;第二次工业革命最核心的技术是电,它更大程度上替代了人的体力劳动;第三次工业革命最核心的是计算机的发明,信息技术的出现替代了人的少量脑力劳动,第四次以人工智能为代表的这一代新的信息技术的发展,未来有可能会替代更多的人的脑力劳动,也可以有很多我们人所掌握的知识固化到模型里面,能够流传下去,释放更多的社会价值。

  具体到生态环境这个领域,它有什么样的作用呢?过去的一年多时间里,我们也跟业内的领导、专家,包括一些客户、伙伴做了一些实践和探索。首先,我们认为AI技术带来的数字化转型,也叫数智化,其实是包括精准治污、科学治污、依法治污以及构建人与自然更和谐共生的生态等方面的,其具备了非常重要的意义。这里面特别像基于视觉的一些分析、识别的技术,包括像遥感识别、某些研判、知识沉淀问答、数据处理调度,在这些方面大模型展现出跟以往的信息技术不一样的新的能力。那么它会为我们的行业,特别在应用层面带来什么样的变化呢?总结下来有四个方面,一是在交互上面有一个新的变化,原来大家操作这些信息系统,可能都通过鼠标点选我们的各种菜单,输入一些文字,然后获取一些信息的查询和反馈,未来有了大模型,我们就可以用更自然的语言,你与系统进行对话,通过对话我们就可以操作这样的应用系统;二是 前面各位专家也提到了数据要素价值的挖掘,实际上大模型也是可以在这里面发挥很重要作用的,因为我们历史上产生了那么大量的数据,有很多数据并没有被挖掘出来,里面蕴含着知识,利用大模型技术,其实可以快速、大量地处理这些文本、结构化数据、视频等。这样我们就可以去理解数据背后互相关联的因素,从而对于这些数据的利用就会变得更高效;三是 特别是对于一些知识类的问答和决策也会带来很大的帮助;四是特别在一些综合调度的场景,它也可以通过大模型作为一个调度的中枢,可以调度不同的系统、不同的数据,来为我们的决策提供一些依据。

  基于我们理解的大模型给生态环境带来的一些变化,我也总结了一个大模型落地的总体架构。这个架构分为三层,最下面一层是基础设施层,我们的智算中心、数据中心,特别是一些AI时代的算力,像GPU这样的一些高性能算力都属于这一层,这是一切的基础。中间这一层是平台层,平台层包含几个方面,一方面是通用大模型,包括开源和闭源,国内通用大模型本身的一些能力的发挥,更重要的是在网上基于通用大模型对各行各业专业知识有一定的理解,但还是需要灌入行业里面专业语料才能具备深度理解行业里面知识的能力。我们需要去构建生态环境数字孪生、生态环境语言大模型、生态环境视觉大模型,基于这三点再往上去围绕生态环境的不同应用场景去真正地实现一些行业的应用。

  其实我觉得最重要的还是最上面两层,最上面这一层应用也很关键,因为大模型其实是一种能力,真正被使用者感知还是通过这样的应用。我认为它会带来四个方面的变化,一是在视觉的识别能力、遥感识别能力上,我们可以监控排污口的水质变化,例如河道里漂浮物识别,也可以通过遥感的方式看河道变化、植被变化,来做全面对物理世界的感知;二是在精准认知,特别是态势研判方面,基于前面全面感知,我们通过风险的识别能够及时预警,为综合的态势研判提供决策支撑;三是在辅助决策层面,我们通过专家经验的沉淀,特别是像我们之前做的工厂里面脱硫脱硝工艺知识和一些设备运维知识,其实可以让污染防治应急预案去决策,也可以让生态资源规划变得更合理;四是 前面也提到了人机交互上面的变化,通过更自然的人机交互,自然语言的就如同人和人之间对话一般,让我们操作这些系统变得更简单。我们通过灌入生态环境相关的语料,首先做一个生态环境的大模型;然后基于一些专有的API、数据、文档的汇聚,在此之上我们去做一些模板、思维链的编排、工作流Agent开发的一些工作;最后,形成我们在生态环境领域的助手应用。

  下面是几个案例,第一个,在文档问答方面的应用,其实这也是大模型当前在各行各业里面落地排在第一的最常见的需求,有点像历史上的搜索系统,只是用了大模型之后,对人的意图的理解,以及它查出来结果的呈现、它的总结能力、文档生成能力会变得更强。这也就是说,不管在政府监管侧还是在一些企业侧,把企业里面的相应的一些文档灌进去,就可以对这些文档进行一些问答的操作,这样很多历史上存在的文档就会被更高效地使用起来。

  第二个场景,问数的需求,因为现在有很多应用系统在开发建设完那一刻呈现出来的报表、大屏就固定了,有了大模型之后,就很方便了,就是直接使用自然语言系统,说我过去一段时间里某些指标有什么变化,帮我们绘制出折线图。

  这个其实就是更自然的表达,就是一个对话框,可以跟它交互,去问他各种的数据,它自动地去数据库里面找到某一张表、某一个字段,把数据汇总起来,以图表的方式呈现出来。

  最后一个案例其实是一个综合调度的场景,这是我们在水环境这个方向做的一个案例。其实这就是在传统数字孪生大屏的基础上叠加了大模型的应用,这样就可以通过跟大屏进行一些交互,我可以查取信息,也可以做决策,或者我可以设置参数,使得应急调度指挥变得更加方便。

  总结下来,其实我觉得大模型技术虽然很强大,但是它要落地到行业里面还是面临着很多要解决的问题,包括专业知识的问题、数据质量问题、隐私和安全问题等。在过往一年多时间当中,我们跟专家、伙伴、政府主管部门不断沟通找到一条落地的路径,其实就是需要在技术层面来保障大模型本身的安全、可靠,在落地过程中需要融合行业里的专业知识,生产出来行业所需的专业应用,通过跟生态里面的各种伙伴一起合作,最终能够让大模型技术真正地为我们行业产生价值。

  百度主要还是在做大模型技术本身的建设以及大模型行业落地的平台能力的建设,我们也希望未来在生态环境部的领导下,在与行业内伙伴的紧密合作下,能够真正让大模型技术落地,真正为数字中国、美丽中国的建设贡献一份AI的力量。

  谢谢大家!

  (以上内容根据嘉宾发言速记整理)

附件下载

扫一扫在手机上查看当前页面