“狂飙”两年，大语言模型已至拐点？_数字快讯

“狂飙”两年，大语言模型已至拐点？

发布时间：2024-12-19 10:51 文章来源：科技日报

　　自两年前聊天生成预训练转换器（ChatGPT）面世以来，生成式人工智能（AI）技术的拥趸们就一直坚信：随着科技巨头不断用海量数据“喂食”AI模型，再加上计算能力飞速提升，生成式AI改进的步伐将呈指数级增长，接近人类智能的通用AI的出现也指日可待。

　　然而，在AI快速发展如“烈火烹油”的表面之下，一些专家的隐忧和疑虑也悄然而生。据美国技术雷达网站12月9日报道，谷歌首席执行官桑达尔·皮查伊预测，2025年，AI发展势头将放缓。物理学家组织网稍早时间一篇报道也认为，AI智能的提升速度有所减缓，目前新款大型语言模型的研发似乎已经到了拐点。

　　AI模型日益膨胀

　　开放人工智能研究中心（OpenAI）的ChatGPT，可以说点燃了科技公司研发大型语言模型的热情。谷歌、亚马逊、元宇宙平台公司，以及OpenAI主要投资者微软公司等，都砸下数十亿美元巨资，纷纷推出各自的生成式AI应用工具。这些大型语言模型各有千秋，能够轻松生成高质量文本、图像和视频，如今也实现了语音对话功能。

　　生成式AI的“狂飙”也让OpenAI等公司声名鹊起，赚得盆满钵满。今年10月初，OpenAI公司再次成功融资66亿美元，使其估值达到了惊人的1570亿美元。

　　对此，AI行业专家、美国纽约大学神经科学教授加里·马库斯表示，OpenAI之所以获得如此高的估值，很大程度上源于很多业界人士内心深处的一种信念：只要不断给AI模型“喂食”更多数据，提升其计算能力，模型就能变得愈发强大。按照这样的发展趋势，可能很快会出现OpenAI负责人萨姆·奥尔特曼所说的智能可与人类匹敌的“通用AI”。

　　智能水平提速放缓

　　然而，生成式AI发展的步伐，真会按照人们畅想的“剧本”进行吗？

　　马库斯直言，“这只是一个美好的幻象”。美国消费者新闻与商业频道（CNBC）网站也在11月初的报道中指出，谷歌、Anthropic公司和OpenAI等公司研发新大型语言模型似乎已经碰到天花板。

　　风险投资企业安德烈森-霍罗威茨公司是OpenAI股东之一。该公司联合创始人本·霍罗威茨最近坦承，尽管他们一直在按照节奏提升算力，但AI模型的智能水平并未因此得到显著提升。

　　OpenAI联合创始人伊尔亚·苏茨克维11月15日接受媒体采访时表示，使用大量未标记数据来训练AI模型，以理解语言模式和结构的阶段已经趋于稳定。

　　专家们指出，一个根本挑战在于，可用于AI训练的数据目前几乎已被AI模型“蚕食殆尽”。

　　专门针对法律事务的生成式AI公司Spellbook也是OpenAI合作商之一。该公司首席执行官斯科特·史蒂文森表示，一些实验室过于注重用更多文本数据“喂食”AI模型，但仅依靠文本数据对AI进行扩展注定会遇到困难。目前很多企业已经缺乏新东西来“喂养”AI模型。因此，这并非知识储量的问题，而是机器要能够理解句子或画面的含义。

　　初创公司“抱抱脸”研究员兼AI负责人莎拉·卢乔尼也强调，AI模型开发“以大为美”的路线，最终必然会触碰到其极限。

　　亟需一场深刻变革

　　萨姆·奥尔特曼11月14日在其社交平台X上发布信息：没有死胡同！不过，现实情况是，OpenAI选择延迟推出GPT-4的接棒模型，因为GPT-4性能的改进程度未达预期。

　　作为研发战略转型的一次尝试，今年9月，OpenAI推出了o1模型。这款模型专注于回答复杂问题，尤其是数学问题。它旨在通过提升推理能力，而非单纯增加训练数据量，来提供更准确的答案。史蒂文森认为，OpenAI引导其模型“花更多时间思考而非响应”，这或将引领AI模型研发领域出现一场“深刻变革”。

　　AI服务网站Quantilus.com在11月25日的报道中指出，OpenAI、“深度思维”等公司正在探索“高效扩展”技术。该技术旨在让大型语言模型复制类似人类的思维方式，而不仅仅是依赖“蛮力”，即大量消耗计算资源。这些方法的重点在于提高训练数据的质量，并结合来自人类反馈的强化学习。

　　史蒂文森将AI技术的发展与火的出现作比较。他表示，业界不应该再通过给AI提供更多数据、提升算力来促进其发展，而是应该打造类似蒸汽机那样的、具有变革性的事物。

　　美国斯坦福大学教授沃尔特·德·布劳沃则将先进大型语言模型比作从高中过渡到大学的学生。他表示，目前的AI就像是能做即兴表演的聊天机器人，很容易出错，具有跳跃思维能力的机器即将到来。（记者刘霞）

扫一扫在手机上查看当前页面

附件下载

峰会主办单位：

峰会承办单位：

峰会联系电话：