数字中国建设峰会
返回
纪荣嵘在第六届数字中国建设峰会人工智能分论坛上的主题演讲
厦门大学南强特聘教授,人工智能研究院负责人
发布时间:2024-09-02 15:34 文章来源:峰会组委会秘书处

打造高效·低碳人工智能赋能引擎

纪荣嵘

厦门大学南强特聘教授,人工智能研究院负责人

  在数据层面,传统的模式数据规模小、模态单一,现在规模大、模态是多元异构的。在模型层面上,现在除了大规模人工智能之外,还强调多技能的人工智能,就是我们期望一个模型可以解决很多的问题。

  一、人工智能发展和趋势

  可以看到大规模预训练模型正在做加速推进,因为我是做计算机视觉的,在这边看来,在视觉感知的任务里面,也可以看到未来一定会有通用的大的视觉感知模型。前面很多观众都在讲自然语言处理和大语言的模型。

  刚才瑞芯微的老板讲到,我们也需要去做边缘端的计算,所以一方面是要把模型做大,另一方面模型最后一定还要变小。

  有了大模型、有了边缘设备,就要思考云边端计算范式加速的推进。这里面云计算厂商曾经讲他们自己的兴趣点,就是我要把云给做好,像边缘设备厂商一定说我边缘是最重要的,二者之间很难做共性的结合开发,并且有很多的云端厂商彼此之间它们的模型跟数据标准是不互通的。

  二、人工智能现有的瓶颈和挑战

  大家都在谈数据,回头看GPT1、2、3到GPT4的这些模型,它的模型的架构其实没有特别的变化,都是类似的结构。数据收集能力不足,我们在数据获取存储跟处理方面限制量是巨大的,这里的数据量不足,不是指的我们传统获取的图像视频的数据不足,而是指在非常特殊的特定领域,由于数据采集的困难,或者数据获取的困难,我们很难去拿到特定任务里面的正样本的数据,比如说涉及用户的隐私等。

  第一点,我们所看到的大量数据是不平衡的。

  第二点,标注成本极其高。图像标注之外,其实我们在面对一些更复杂标注场景。

  算力不足的另外一个原因在于,现在模型特别多,好像任何一个企业似乎不做模型的话就说不过去,就好像被其他企业所抛弃掉。在这里我举一些例子,包括像视觉领域的,像最近的SAM,就是今年Meta公司发布Segment Anything Model,这个模型叫SAM。它在10亿的mask上进行训练,需要256块A100显卡训练68个小时。

  第三点,就是它的安全性严重不足,不论是算力中心的汇聚、模型的汇聚,甚至是刚才有讲者提到把模型提出来。

  此外一点跟今天的主题相关的就是,我们计算的耗能是极其巨大的。我们需要消耗大量能源,导致能源的浪费跟环境的污染。这里面既有训练能耗,也有数据中心维持模型运行的能耗,也有边缘设备运行里面的模型进行感知、推理的能耗,也有各类应用能耗。

  三、厦门大学的举措和典型的成果

  在过去两年时间里面,厦门大学其实也建了一套对应的科学装置,当然体量没那么大,大概接近5000万的设备当量。可以想象一下像厦门大学这样的多学科交叉性学校,我们的化学、海洋、生命学科的教授希望用人工智能,但是不会写代码。我们希望给他们打造一种所见即所得,把数据扔出去,把模型扔给你的这么一个结构。

  此外,我们也跟鹏城实验室合作,在里面做了一些相关的工作。这是我们在社区开源的NaaS的算法库,叫X-NaaS,跟对应的黑盒优化算法库叫XBBO,这两个项目都被列入启智社区的首页精选。

  怎么样用小算力、前置算力,去替换传统意义上的AI相机,不是城市所有的地方都用得起AI相机,一个AI相机的成本是八千到一万,这是用瑞芯微的339PRO的计算卡,连接公安机关的监控图像,以及四桥一隧的监控信息。我们做高清相机的智能化升级,可以做到用一个计算盒托载四路的高清相机,这个小盒子实际上就放在电线杆的配电箱上,不像其他算力中心的设备那么娇贵。

  在智慧通信领域我们也试图用AI去解决无线通信里面各种各样的抗干扰的检测,特别是包括无人机干扰源的检测和自动干扰器的识别。在智能制造领域,厦门大学跟宁德时代有一个比较大的项目合作,我们帮助宁德时代主要工作是加速已经有的自动化检测的速度,如果检测快那么一点点时间,电池整体的生产时间会下降,产能就会获得提升。

  此外,我们还做智慧信号的处理,比如说在超快速磁共振、自动成像分析,以及光声参数的工业故障诊断里面产生对应的应用,解决一些城市双碳赋能的重要领域。

  四、未来的展望

  建设绿色智能平台可以助力城市、国家行业对应的发展,AI技术用到现在能耗太大。下一个阶段包括东数西算在内,是希望能够赋能传统行业,推动生产生活方式由高能耗、高污染、高排放,向绿色、低碳转型。谁在绿色跟低碳方面,做得更绿色、更低碳一些,就能在AI产品的赋能中获得先机,形成新的竞争合力。

  (以上内容根据嘉宾发言速记整理)

扫一扫在手机上查看当前页面

附件下载