头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • 降低大模型幻觉、让企业AI输出更靠谱,亚马逊云科技掏出10年家底

    09/16
  • 刚刚!阿里发新模型,幻觉率爆降70%

    FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。 有监督预训练则在编码器-解码器架构(AED)下进行,使编码器能够从大规模…

    09/16
  • 刚刚!阿里发新模型,幻觉率爆降70%

    FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。智东西在实测中体验了FunAudio-ASR在嘈杂场景的识别能力。 有监…

    09/16
  • 刚刚!阿里发新模型,幻觉率爆降70%

    09/16
  • 研究发现:主流AI聊天机器人传播虚假信息的概率较去年翻倍

    研究发现:主流AI聊天机器人传播虚假信息的概率较去年翻倍

    09/15
  • AI大模型幻觉之困:是人类训练方式之过,还是模型发展必经之路?

    OpenAI的研究人员对比了旗下两款模型的表现:老模型o4-mini在测试中正确率虽比GPT-5高2个百分点,但代价是四分之三的问题答错,仅1%的题目会承认“不知道”;而GPT-5则更倾向于直接表示“无法回…

    09/12
  • 大模型产生幻觉,全怪人类PUA吗?

    模型的创造力和幻觉,其实是一个相辅相成的两面

    09/12
  • 大模型产生幻觉,全怪人类 PUA 。。。吗?

    09/12
  • OpenAI新幻觉论文惹争议!GPT-5拉胯是测试基准有问题??

    09/09
  • ChatGPT爱“胡说”?OpenAI揭秘:评估机制在“奖励”猜测致幻觉频发

    OpenAI的研究指出,这种评估方式实质上在“鼓励”模型进行不负责任的猜测,而非追求真实性与可靠性。在医疗或金融咨询场景中,用户更需要的是可靠的信息,而非一个听起来自信但可能错误的答案。 针对这一困境,Ope…

    09/09
  • 程实:老龄化的债务幻觉

    09/08
  • OpenAI重组GPT-5“灵魂”团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首

    一次组织重组+评测范式重构,也许正在改写AI的能力边界与产品形态。

    09/07
  • OpenAI研究人员:破解大语言模型“幻觉”需从评估指标入手,避免奖励猜测

    研究指出,当前模型训练过程中,评估标准更倾向于奖励“自信回答”,即使答案错误也能获得较高分数。这种机制导致模型被优化为“考试型选手”,在面对不确定问题时倾向于猜测而非承认“不知道”。研究团队呼吁行业建立更符…

    09/07
  • 参数量1T,阿里官方介绍“通义最强语言模型”Qwen3-Max-Preview

    在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强。

    09/07
  • OpenAI研究人员:破解大语言模型“幻觉”难题,关键在调整评估标准

    研究团队在最新论文中指出,现有训练机制导致模型倾向于"假装知情"。这种设计源于评估体系对"完整回答"的过度奖励,使得模型在信息不足时仍会强行输出内容。这种机制迫使系统将复杂现实简化为非此即彼的判断,而忽略了…...

    09/07
  • OpenAI称破解大语言模型“幻觉”难题,根源在评估标准,需重新设计

    近日,据海外科技媒体《商业内幕》报道,OpenAI研究团队在解决大语言模型核心缺陷方面取得突破性进展——通过重构评估体系,成功缓解了困扰行业的“幻觉”问题。这种倾向源于评估体系对猜测行为的过度奖励——模型若拒…

    09/06
  • OpenAI研究人员宣称已破解模型“幻觉”:重新设计评估指标即可

    09/06
  • OpenAI研究人员宣称已破解模型“幻觉”:重新设计评估指标即可

    研究人员指出:“人类会在现实生活的挫折中学会表达不确定性的价值,而大语言模型的评估主要依赖考试,这些考试却惩罚了不确定的回答。”“问题的根源是评估指标没有对齐,必须调整主要的评分方式,避免在模型不确定时因拒…

    09/06
  • OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首

    AI一本正经地胡说八道,原来是我们教的。

    09/06
  • OpenAI研究人员宣称已破解模型“幻觉”:重新设计评估指标即可

    模型被训练成“装作知道”,而不是坦率地说“我不确定”。

    09/06
  • OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首

    09/06
  • Qwen3-Max-Preview上线,官方称系通义千问系列最强大的语言模型

    该模型支持超过100种语言,具有更强的翻译和常识推理能力。

    09/06
  • 企业IT资产AI化改造解决方案,模型幻觉问题解决率达100% | 创新场景

    09/05
  • Vibe Coding,一场幻觉和焦虑催生的行业狂欢

    09/05
  • DeepSeek的AI智能体计划,你需要知道这些

    AI Agent已经不再是实验性项目,而是已经成为大模型的一个核心主赛道

    09/05
  • Vibe Coding,一场幻觉和焦虑催生的行业狂欢

    09/05
  • 李飞飞的答案:大模型之后,Agent向何处去?

    Agent AI的核心:一个全新的只能体认知架构

    09/04
  • 全球首例“AI谋杀案”,56岁IT精英弑母后自杀!ChatGPT成教唆元凶,聊天曝光

    全球首例“AI谋杀案”,56岁IT精英弑母后自杀!ChatGPT成教唆元凶,聊天曝光

    09/03
  • 摩根大通开发AI幻觉"疫苗":让大语言模型不再胡说八道的神奇药方

    09/02
  • 当AI遇上规章制度,彩智科技帮你排除幻觉|“抓住下一个Z一鸣”速访

    09/02
  •  «上一页   1   2   …   3   4   5   …   6   7   下一页»   共203条/7页 
    全部热门
  • 灵光APP上线3天扩容8轮 冲上App Store中国区免

    11/24 16:08

  • 华为助力机械导盲犬问世:实时规划路径、语音

    11/24 16:08

  • 任正非:坚决要把“夹心阶层”消灭掉

    11/24 16:08

  • 特斯拉FSD正式登陆韩国,全球落地国家增至七个

    11/24 16:08

  • 田渊栋、卡帕西力荐Nano Banana新玩法:论文变

    11/24 16:07

  • 工信部公示人形机器人标准化技术委员会委员名

    11/24 16:07

  • 农发行湖北省分行被罚150万,涉违反金融统计管

    10/31 16:58

  • 浙江平湖农商行被罚450万,涉关联交易管理不审

    10/31 16:58

  • 老铺黄金距离奢侈品牌有多远?

    10/31 16:56

  • 文华东方300亿元赎身,“老钱”找新路子了

    10/31 16:56

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号