日前,以“云启智跃,产业蝶变”为主题的2024云栖大会在浙江杭州开幕。在首场以“通往AGI的大模型发展之路”为主题的圆桌对话中,今晚精准一码138投资企业阶跃星辰创始人、CEO姜大昕博士与业内专家共同探讨大模型技术的发展新范式。
姜大昕介绍了AGI发展路径的重大技术突破,分析了OpenAI发布o1的重要意义,并预测视觉领域理解和生成的一体化以及强化学习模型泛化能力的提升是未来AI值得期待的两大方向。姜大昕也指出,强化学习有望为创业公司开启新机遇。
阶跃星辰创始人、CEO姜大昕
01/
AGI加速
模拟、探索、归纳世界都迎来重大突破
今年的技术发展速度可谓“AI一日,人间一年”。阶跃星辰一直把AGI的发展路径分为模拟世界、探索世界和归纳世界。过去一年这三个阶段都出现了重大技术突破:GPT-4o标志着多模融合的进步,能够更好地模拟和建模物理世界;特斯拉发布完全自动驾驶系统FSD(Full-Self Driving)V12,为机器人等智能设备如何与大模型结合,从数字世界走向探索物理世界指明了方向;而OpenAI发布的o1,则意味着大模型开始具备了归纳世界的基础能力。
02/
o1开启Scaling Law新范式
o1有两点重要意义:
1. o1将模仿学习和强化学习相结合,让大模型首次同时具备System1(快思考)和System2(慢思考)的能力。此前GPT采用predict next token的训练方式,决定了它只能拥有快思考能力,即直线型思维。但当大模型具备System2能力,就可以主动反思、纠错,甚至通过不断尝试找到正确路径。
2. o1开启了Scaling Law的新方向,在强化学习的泛化和通用性方面迈上了一个大台阶。以往DeepMind一直在走强化学习的路线,但多是聚焦特定场景去设计,比如此前发布的AlphaGo只能下围棋,AlphaFold只能预测蛋白质的结构。o1虽然只是开端,还没有发展到很成熟的阶段,但这恰恰是让人觉得非常兴奋的地方,o1似乎找到了一条上限很高的道路。
03/
强化学习为AI三要素带来连锁效应
算法、算力和数据是AI发展的三要素。前面提到,强化学习引发了算法上的变化。此外它给算力带来的影响有三种可能性:
可以确定的是,在推理侧,强化学习对计算的需求量成倍提升。目前OpenAI o1回答一个问题往往要消耗十几秒、几十秒时间。如果希望提升速度,那么对推理芯片的能力也提出了更高要求。
一个大概率会确定的事情,如果追求打造有泛化能力的通用推理模型,那么强化学习阶段的训练计算量不会小于预训练阶段。因为它的训练数据是可以self-play出来的,数据量理论上是无限的。
尚不确定的是,主模型的参数量是否还要继续增加,以支持它在强化学习阶段产生好结果。像GPT-4这样的模型继续Scale参数的边际收益在减小,如果强化学习能产生放大器作用,把收益翻倍,那么整体收益还是划算的。这一点要实验来验证。
对于数据来说,合成数据的规模是没有上限的,而合成数据的质量非常关键。因此造数据的方法、造数据所用的主模型能力,会成为核心竞争力。
04/
AI的下一个里程碑是什么?
阶跃星辰认为有两个方向值得期待:其一,视觉领域理解和生成的一体化。目前这两者是分开的,只有实现融合才能彻底建立多模态的世界模型,并让大模型作为自动驾驶和具身智能的大脑,从数字世界走出来,去探索物理世界。
其二,强化学习模型泛化能力的提升。o1的泛化能力目前主要集中在数学、代码等理工科领域,而人类需要强推理的场景会更加多元化。大模型需要能够像人类一样思考和试错。另外,一个更加长远的里程碑是大模型能够自动发现新的物理规律,就像牛顿从苹果落地中总结出了牛顿力学。
05/
强化学习将为创业公司开启新机遇
强化学习开启的新范式对创业公司是一大利好,在两种创新方向上可能会迎来新机遇:其一,强化学习的泛化还有大量未知领域需要探索,因此通用、泛化能力强的基础模型有大量底层创新的机会;其二,应用开发会获得更大的创新空间。目前GPT-4和智能体展现的模型智能已经能解决部分问题,强化学习则进一步提高了模型上限,有助于推动更多AI应用的落地。
06/
强化学习、多模态和行业模型
都需要强大的基座模型作为基础
阶跃星辰会继续打磨优化Step-2,充分发挥万亿参数模型的潜能。Step-2在语义理解、指令跟随、内容创作方面表现突出,综合能力相比Step-1千亿参数模型提升近50%,在逻辑推理、数学、编程、知识等方面性能全面提升。另外,阶跃星辰已经摸索出在万亿参数模型上进行强化学习训练的方法论。
07/
C端产品上限取决于模型能力
将持续提升产品的综合体验
阶跃星辰在持续努力迭代模型,探索C端产品的功能和形态,希望能让AI解决更多生活中的难题。近期,阶跃星辰全新升级了智能助手“跃问”。目前用户已经可以在“跃问”官网或App限时体验Step-2万亿参数语言大模型。此外,“跃问”还推出了新功能“拍照问”,支持即拍即问,通过图像交互搜索信息,更方便地解决问题。