当前位置: 首页 » 资讯 » 新科技 » 正文

天津大学教授熊德意:大模型行为与人类价值观对齐仍面临挑战

IP属地 中国·北京 红星新闻 时间:2025-11-14 22:14:24

11月14日,大模型 大未来——2025年大模型应用场景交流全国行·深圳站暨大模型数据要素建设行活动在深圳举办。

天津大学计算机科学与技术学院教授、深圳河套学院双聘教授、天津大学“语言智能与技术”中外联合研究中心主任熊德意以《推进人工智能大模型与计算政治学:结合范式与初步探索》为主题进行分享。他表示,自然科学研究已进入人工智能驱动的“第五范式”,社会科学领域同样迎来范式变革,人工智能与社会科学研究正实现双向融合。


人工智能大模型正以前所未有的速度渗透到社会生活的方方面面,但是,大语言模型也可能传播其训练数据中的有害信息,产生误导性和虚假性信息。熊德意直言,大模型存在文化价值偏见,已有多元价值对齐方法依赖于外部的文化数据,这耗费大量人力物力,且对于低资源文化的数据收集非常困难。

熊德意举例在外交智能体框架下,模拟智囊团决策过程,大模型在伦理与道德义务 - 利益二元对齐差异显著。左侧模型在面对伦理困境时显得更为坚守道德义务;但右侧模型倾向于选择有利的决策,即使严重违反伦理原则,违背人类普遍道德。整体上看,模型在决策中偏向维护强国立场,而忽视弱国立场。

在人工智能特别是大模型的研究领域,如何使大模型的行为与人类价值观对齐,是当前技术发展的核心问题和重要挑战之一。这一问题的解决不仅关乎技术本身的创新与完善,也对社会责任、伦理规范以及人工智能与人类社会的深度融合具有重要意义。

红星新闻记者 李伟铭

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新