当前位置: 首页 » 资讯 » 新科技 » 正文

创新发展 | 赋能工程监理数智升级,上海建科咨询集团首发工程监理行业大模型测评集

IP属地 中国·北京 编辑:唐云泽 时间:2026-01-21 22:12:29

近日,上海建科咨询集团首发工程监理行业大模型测评集Norma-MESBench 1.0。

Norma-MESBench 1.0是上海建科咨询集团打造的国内首个监理行业万题规模的大语言模型测评基准——它填补了监理领域专属AI大模型测评基准的空白,能用科学、量化的方式帮企业判断AI大模型在监理各专业的知识掌握程度,既是上海建科咨询集团人工智能技术落地的关键成果,更是行业放心用AI、选对AI的实用指南。

该测评集项目从监理行业的角度拆分了含专业技术、通用综合、特色场景三大板块和多个层级的“全维度测评框架”,采用“人工+大模型辅助”的混合模式构建了超万条测评数据,再经格式标准化、去重算法和多轮人工复核等流程进行题目质量控制。为确保测评过程的便捷性、科学性与鲁棒性,项目采用了“多层级加权评分” “裁判模型评审组”等算法实现全流程自动化、标准化,为行业提供了统一、规范、可用的大模型监理专业能力测评框架。

该测评集目前完成了17款主流通用大模型在监理工作场景的能力测评和分析,为相关企业和从业人员提供了专业、精准的大模型在工程监理领域的能力评估,助力企业科学选择适用的AI大模型。

为构建开放和可持续的行业AI生态,上海建科咨询集团已将该项关键成果进行了开源发布。期待与更多企业和科研机构携手,进一步推动监理行业人工智能技术的健康、快速发展。

该测评集不仅是工程监理行业大模型测评体系关键技术成果的首次发布,更是深化“人工智能+”战略在工程建设领域落地的关键一环。随着人工智能技术的广泛应用,工程监理行业将迎来更高质量、更可信赖的智能化转型新阶段。

上海建科咨询集团

编辑:刘塘仪

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。