数字中国建设峰会
返回
“狂飙”两年,大语言模型已至拐点?
发布时间:2024-12-19 10:51 文章来源:科技日报

  自两年前聊天生成预训练转换器(ChatGPT)面世以来,生成式人工智能(AI)技术的拥趸们就一直坚信:随着科技巨头不断用海量数据“喂食”AI模型,再加上计算能力飞速提升,生成式AI改进的步伐将呈指数级增长,接近人类智能的通用AI的出现也指日可待。

  然而,在AI快速发展如“烈火烹油”的表面之下,一些专家的隐忧和疑虑也悄然而生。据美国技术雷达网站12月9日报道,谷歌首席执行官桑达尔·皮查伊预测,2025年,AI发展势头将放缓。物理学家组织网稍早时间一篇报道也认为,AI智能的提升速度有所减缓,目前新款大型语言模型的研发似乎已经到了拐点。

  AI模型日益膨胀

  开放人工智能研究中心(OpenAI)的ChatGPT,可以说点燃了科技公司研发大型语言模型的热情。谷歌、亚马逊、元宇宙平台公司,以及OpenAI主要投资者微软公司等,都砸下数十亿美元巨资,纷纷推出各自的生成式AI应用工具。这些大型语言模型各有千秋,能够轻松生成高质量文本、图像和视频,如今也实现了语音对话功能。

  生成式AI的“狂飙”也让OpenAI等公司声名鹊起,赚得盆满钵满。今年10月初,OpenAI公司再次成功融资66亿美元,使其估值达到了惊人的1570亿美元。

  对此,AI行业专家、美国纽约大学神经科学教授加里·马库斯表示,OpenAI之所以获得如此高的估值,很大程度上源于很多业界人士内心深处的一种信念:只要不断给AI模型“喂食”更多数据,提升其计算能力,模型就能变得愈发强大。按照这样的发展趋势,可能很快会出现OpenAI负责人萨姆·奥尔特曼所说的智能可与人类匹敌的“通用AI”。

  智能水平提速放缓

  然而,生成式AI发展的步伐,真会按照人们畅想的“剧本”进行吗?

  马库斯直言,“这只是一个美好的幻象”。美国消费者新闻与商业频道(CNBC)网站也在11月初的报道中指出,谷歌、Anthropic公司和OpenAI等公司研发新大型语言模型似乎已经碰到天花板。

  风险投资企业安德烈森-霍罗威茨公司是OpenAI股东之一。该公司联合创始人本·霍罗威茨最近坦承,尽管他们一直在按照节奏提升算力,但AI模型的智能水平并未因此得到显著提升。

  OpenAI联合创始人伊尔亚·苏茨克维11月15日接受媒体采访时表示,使用大量未标记数据来训练AI模型,以理解语言模式和结构的阶段已经趋于稳定。

  专家们指出,一个根本挑战在于,可用于AI训练的数据目前几乎已被AI模型“蚕食殆尽”。

  专门针对法律事务的生成式AI公司Spellbook也是OpenAI合作商之一。该公司首席执行官斯科特·史蒂文森表示,一些实验室过于注重用更多文本数据“喂食”AI模型,但仅依靠文本数据对AI进行扩展注定会遇到困难。目前很多企业已经缺乏新东西来“喂养”AI模型。因此,这并非知识储量的问题,而是机器要能够理解句子或画面的含义。

  初创公司“抱抱脸”研究员兼AI负责人莎拉·卢乔尼也强调,AI模型开发“以大为美”的路线,最终必然会触碰到其极限。

  亟需一场深刻变革

  萨姆·奥尔特曼11月14日在其社交平台X上发布信息:没有死胡同!不过,现实情况是,OpenAI选择延迟推出GPT-4的接棒模型,因为GPT-4性能的改进程度未达预期。

  作为研发战略转型的一次尝试,今年9月,OpenAI推出了o1模型。这款模型专注于回答复杂问题,尤其是数学问题。它旨在通过提升推理能力,而非单纯增加训练数据量,来提供更准确的答案。史蒂文森认为,OpenAI引导其模型“花更多时间思考而非响应”,这或将引领AI模型研发领域出现一场“深刻变革”。

  AI服务网站Quantilus.com在11月25日的报道中指出,OpenAI、“深度思维”等公司正在探索“高效扩展”技术。该技术旨在让大型语言模型复制类似人类的思维方式,而不仅仅是依赖“蛮力”,即大量消耗计算资源。这些方法的重点在于提高训练数据的质量,并结合来自人类反馈的强化学习。

  史蒂文森将AI技术的发展与火的出现作比较。他表示,业界不应该再通过给AI提供更多数据、提升算力来促进其发展,而是应该打造类似蒸汽机那样的、具有变革性的事物。

  美国斯坦福大学教授沃尔特·德·布劳沃则将先进大型语言模型比作从高中过渡到大学的学生。他表示,目前的AI就像是能做即兴表演的聊天机器人,很容易出错,具有跳跃思维能力的机器即将到来。(记者 刘 霞)

扫一扫在手机上查看当前页面

附件下载