不知不觉,世界人工智能大会已经来到了第8年。
这8年,我们和读者一起,见证了AI的飞速发展。我们曾感慨“小灵通”漫游的世界来了,可放到今天,这些“科幻”,已经是AI世界里,最基本的操作了。
我们曾遨游元宇宙,也曾疑惑大模型究竟是什么……不管怎样,我们的生活的的确确,因为AI改变着。
再过两年,世界人工智能大会将来到“十周年”的关键节点。2027年,被AI“接管”的世界会是什么模样?AI自身又将走向何方?
在2025世界人工智能大会开幕之际,本报邀请了9家AI领域头部企业的高级管理人、首席科学家、核心研发者,畅谈他们眼中未来两年AI的发展。两年后,我们也会“重启”这份“时间胶囊”,看看大家的预测是大胆的,准确的;还是像曾经我们对AI的想象那样,略显保守。
提起阶跃星辰,业内都说我们是“多模态卷王”。凭借基座模型的扎实功力和多模态领域的特色,阶跃星辰已对外发布了20多款自研基座模型,几乎每个月都能“上新”。即将举行的2025世界人工智能大会上,我们将发布全新旗舰大模型Step3,在性能和效率上再次实现了突破,并且对芯片友好。
技术上,下一步大模型的发展有一个明显趋势:就是多模理解生成一体化,更准确的是视觉领域的理解生成一体化。当前,除了语言模型推理这个大家在争相创新的领域,更值得关注的是,如何把推理引入到多模态领域。这个领域关系到大量产业应用的需求,比如智能终端在真实世界的交互,视觉等多模推理的能力是必须的。
产业上,模型如何能更适合应用,促进大模型产业落地是当前的重要命题。推理时代,大模型不仅仅要追求智能的上线,同时也要兼顾更适合应用的性能和成本,才能促进千行百业对AI大模型的应用。阶跃Step3此次在性能和效率成本上做了创新,从而更适合应用,已经收到了很多产业生态的正反馈。
今年,大家还比较关心智能终端与大模型结合的趋势。近年来,人工智能大模型行业不仅要攀登技术领先,更要深入产业。在大模型应用的趋势上,我们认为软硬结合是能更好地理解用户的需求,完成用户的任务。今年以来,阶跃星辰在行业内率先落地智能终端Agent,将多模态大模型的技术优势在汽车、手机、IoT和机器人产业上应用。
以具身智能机器人为例,机器人模型分两个部分,基础大模型如同“大脑”,它能看会听,可以理解开放世界,并产生推理和交互;具身智能动作模型如同“小脑”,它把大脑的理解转化为动作,最终完成某项任务的执行。未来的机器人必须与多模态大模型结合来建立“大脑”能力,给人们带来能说会道高情商、有开放场景价值的产品,才能泛化应用。
此外,未来具身机器人特别需要端到端认知大脑的模型,也就是我们强调的泛化性比较强的多模态模型。“大小脑结合”是未来的发展方向,谁能在产品里率先产业落地,完成数据和商业应用上的闭环,将会形成这个赛道将来重要的竞争力。
立足上海,阶跃在技术探索的人才储备是很雄厚的,在算法和系统核心能力上也都有行业顶尖的团队;同时,阶跃智能终端等战略合作生态,对多模态大模型所需的高质量交互数据带来重要意义。
作者:阶跃星辰副总裁 李璟
原标题:《给未来AI的时间胶囊|李璟:下一步大模型的发展在技术和产业上有两大趋势》
栏目编辑:郜阳 文字编辑:郜阳 新民晚报 制图
作者:李璟