北京商报讯(记者 岳品瑜 董晗萱)7月26日至28日,2025年世界人工智能大会(WAIC)在上海举行,大模型在专业领域的应用成为业界关注的焦点之一。
在“从通用智力到专业生产力:高阶程序引领的AI应用新范式”论坛上,蚂蚁集团副总裁、蚂蚁密算董事长韦韬表示,大模型作为通用智能的里程碑,实现了泛化适应、归纳内化知识等能力,在聊天、写代码、客服、翻译等多领域均有尝试且进展显著。然而,其可靠性问题突出,处理任务时可能出现错误,如混淆手指数量、编程时“删库”等,且任务规模和复杂度上升会导致出错概率急剧增加。
在专业领域,对大模型的可靠性要求极高,可控、可靠和可预期成为亟待解决的问题。
韦韬指出,要突破大模型在专业化应用中的可靠性困境,技术上不应当只依赖于大模型“十全十美”不犯错,而是通过智能体系和工程体系的结合,实现专业应用可靠性的保障。正如每个人作为个体,是容易犯错、容易有幻觉的,但人类几千年以来不断在工程体系上的进步,能够在易错的个体之上构建庞大而可靠的工程体系,完成诸如登月、探访火星等巨型任务。他提出,通过全新的程序表达、场景知识嵌入和闭环核验反馈机制,可以将大模型不确定的智力输出转化为可信的专业生产力。
对此,蚂蚁密算正在探索高阶程序(High-Order Program)大模型可信应用技术框架,核心组件包括业务逻辑的程序化表达、场景知识图谱和受控工具链,在全流程中贯穿核验机制,对关键执行结果进行及时、有效地核验和处理。该框架借鉴了人类在工程管理体系中的成功经验,如通过标准作业程序(SOP)和检查清单等机制,构建一个能够有效复用、验证、扩展和派生的机制,使大模型在应用过程中即使出现幻觉问题,也能保证大模型达到专业领域所需的精确性和可靠性。
高阶程序(HOP)同时具备编程语言的精确性、可扩展性与自然语言的知识语义与语境适配等优势,承载了专业领域的关键知识和实践,通过任务细化拆解与核验,确保大模型实现专业应用的可靠性,通过知识概念匹配实现从专业知识到场景应用的派生适配,从而实现在众多原本需要人工处理的场景下高可靠、高自动化应用。目前,高阶程序技术框架已经在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景中初步应用,在可靠性和时效性上有显著提升。
以金融联合风控为例,在传统金融风控体系下,从数据探查、处理到模型构建与调优的全链路操作,高度依赖人工干预,导致流程冗长、响应缓慢,并且容易受人员主观因素影响,制约了金融风控联合建模的效率与一致性。在应用HOP技术框架后,将复杂的SOP转化为可执行的流程和代码,实现风控全链路的智能化编排与自动化执行。相较于传统建模人员手动进行数据分析和代码开发,大模型结合HOP能够在确保高精度的同时缩短建模周期,并显著减少了重复性数据处理和流程执行等繁琐的基础工作。这不但能降低处理成本,还能够缓解专业人才紧缺的局面。
韦韬表示,高阶程序可以与大模型强互补,将大模型这样的通用智力引擎,可靠地应用于众多专业场景。“大模型可靠性的解法,不在于大模型本身,而在于工程化和智能化的融合。我们开源HOP,希望与行业一起把大模型从人类助手正在变成规模化专业生产力。我们也相信,解决了可靠性问题,大模型即将涌现新的Killer App(杀手级应用)。”
展望未来,韦韬认为,细粒度场景、后台数据和产品交互至关重要,行业应用的变革在于验证环节的突破,未来3—5年可能实现大模型基本自主处理任务。同时,小模型在生产领域或有调整,专业知识沉淀价值巨大,需注重数据保护。