当前位置：首页 » 资讯 » 新科技 » 正文

文心4.0在SuperBench评测中表现亮眼，多项指标领先

IP属地山东济南 编辑：大力头部财经 时间：2024-04-23 12:17:22

4月23日消息，清华大学基础模型研究中心最近公布了2024年3月版的《SuperBench大模型综合能力评测报告》，该报告全面评估了14个在海内外具有影响力的模型。
在这份报告中，文心4.0的卓越表现引起了广泛关注。其整体性能已经接近了国际顶级模型，且正逐步缩小与全球领先模型的差距，显然已经成为了国内领先的模型。在人类对齐能力的评测中，文心4.0展现了出色的实力，毫无争议地位居国内首位。同时，在中文推理和中文语言能力的评测中，文心4.0也是一骑绝尘，与其他模型相比，其优势十分明显。特别在中文理解的评测环节，文心4.0的得分比第二名的GLM-4高出了0.41分，显示了其在中文处理上的深厚功底。
此外，在语义理解的数学能力评测中，文心4.0与Claude-3模型并列全球首位，而知名的的GPT-4系列模型则紧随其后，位列第四和第五。其他模型的得分大多集中在55分左右，与领先群体存在显著的差距。在阅读理解能力的评测中，文心4.0同样大放异彩。它不仅超越了GPT-4 Turbo和Claude-3，还超越了GLM-4，斩获了最高分。
报告还提到，自去年3月16日文心一言首次公开亮相以来，其在短短的时间内就实现了用户数量的突破，目前已经超过了2亿用户。同时，每天的API调用量也异常活跃，已经超过了2亿次。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

苹果Vision标准版将于2024年10月定型

OpenAI下周或发布ChatGPT搜索引擎，挑战谷歌

AI明星科学家李飞飞首次创业，方向是“空间智能”

沃伦·巴菲特谈减持苹果：税收因素驱动，但长期看好不变

香飘飘日本超市讽核污水

富友支付向港交所递交上市申请, 2023收入15.06亿元

银行理财市场洗牌：农银理财业绩承压，净利润下滑

太酷了！苹果新专利曝光：iPhone、iPad MacBook 硬件屏幕可折叠

贾跃亭：没有为孩子设立信托，可能是被造谣最多的中国企业家

销量下滑，马斯克解雇两名高管

顺丰控股财报：一季度营收突破653亿，同比增长7.03%

AMD财报：营收54.73亿美元，利润大幅增长，市场反应却出现分歧

小度添添推出首款基于文心大模型定制版闺蜜机

英伟达CEO黄仁勋：AI不会完全取代人类工作

2023年上海咖啡门店数达9553家，外资咖啡企业数领跑中国

全站最新

特斯拉之后，大众也将裁员：员工提前离职可额外领取38.8万奖励

苹果Vision标准版将于2024年10月定型

OpenAI下周或发布ChatGPT搜索引擎，挑战谷歌

AI明星科学家李飞飞首次创业，方向是“空间智能”

沃伦·巴菲特谈减持苹果：税收因素驱动，但长期看好不变

香飘飘日本超市讽核污水

热门推荐

微软发布首份AI透明度报告：2023 年创建30个负责任的AI工具

针对空包事件，茶百道、华莱士、蜜雪冰城等多个品牌致歉

苏姿丰：AMD 今年数据中心 GPU 收入预估超过 40 亿美元

TikTok与环球音乐达成新授权协议

去年Q4全球代工厂市占率：台积电61%，三星14%，中芯国际5%

iPhone销售额大跌10%，大中华区业绩下滑8%

王石放弃千万退休金，田朴珺：没事，老王，我养你

极氪汽车计划在美IPO筹集至多3.68亿美元，估值51亿美元

iPhone16机模再曝光，或改善无线充电功能

苹果Vision标准版将于2024年10月定型

OpenAI下周或发布ChatGPT搜索引擎，挑战谷歌

AI明星科学家李飞飞首次创业，方向是“空间智能”

沃伦·巴菲特谈减持苹果：税收因素驱动，但长期看好不变

香飘飘日本超市讽核污水

2024年巴菲特股东大会问答要点一览！

首页

资讯

财经号

智能车

专题

电商资讯

上市公司

人物资讯

首页

快讯

新科技

新金融

新零售

智能车

房地产

文心4.0在SuperBench评测中表现亮眼，多项指标领先