幻觉-资讯搜索-头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

百川最强医疗大模型M2 Plus发布，幻觉率降到DeepSeek三成，超越美国爆火医疗AI产品

医疗AI进入“循证增强”新阶段

10/24

百川最强医疗大模型M2 Plus发布，幻觉率降到DeepSeek三成，超越美国爆火医疗AI产品

10/23

百川推出创新医疗大模型 M2Plus，降低医疗幻觉率显著

10/22

医疗幻觉率比DeepSeek低3倍，百川循证增强大模型横扫全球医学考试！

10/22

百川发布循证增强大模型M2 Plus，号称“医生版 ChatGPT”

百川发布循证增强大模型M2 Plus，号称“医生版 ChatGPT”

10/22

AI总一本正经胡说八道？金融科技资深专家教你三招破解AI幻觉

09/18

降低大模型幻觉、让企业AI输出更靠谱，亚马逊云科技掏出10年家底

概率推理方法是通过为结果分配概率来处理不确定性，而自动推理检查功能做到将AI输出转化为逻辑可验证的命题，帮企业把数学严谨性嵌入到AI应用的防护中。这一示例表明，自动推理检查功能能够把日常业务规则转化为可验证…

09/16

降低大模型幻觉、让企业AI输出更靠谱，亚马逊云科技掏出10年家底

09/16

刚刚！阿里发新模型，幻觉率爆降70%

FunAudio-ASR使用了数千万小时的音频数据，融合了大语言模型的语义理解能力，从而提升语音识别的上下文一致性与跨语言切换能力。有监督预训练则在编码器-解码器架构（AED）下进行，使编码器能够从大规模…

09/16

刚刚！阿里发新模型，幻觉率爆降70%

FunAudio-ASR使用了数千万小时的音频数据，融合了大语言模型的语义理解能力，从而提升语音识别的上下文一致性与跨语言切换能力。智东西在实测中体验了FunAudio-ASR在嘈杂场景的识别能力。有监…

09/16

刚刚！阿里发新模型，幻觉率爆降70%

09/16

研究发现：主流AI聊天机器人传播虚假信息的概率较去年翻倍

研究发现：主流AI聊天机器人传播虚假信息的概率较去年翻倍

09/15

AI大模型幻觉之困：是人类训练方式之过，还是模型发展必经之路？

OpenAI的研究人员对比了旗下两款模型的表现：老模型o4-mini在测试中正确率虽比GPT-5高2个百分点，但代价是四分之三的问题答错，仅1%的题目会承认“不知道”；而GPT-5则更倾向于直接表示“无法回…

09/12

大模型产生幻觉，全怪人类PUA吗？

模型的创造力和幻觉，其实是一个相辅相成的两面

09/12

大模型产生幻觉，全怪人类 PUA 。。。吗？

09/12

OpenAI新幻觉论文惹争议！GPT-5拉胯是测试基准有问题？？

09/09

ChatGPT爱“胡说”？OpenAI揭秘：评估机制在“奖励”猜测致幻觉频发

OpenAI的研究指出，这种评估方式实质上在“鼓励”模型进行不负责任的猜测，而非追求真实性与可靠性。在医疗或金融咨询场景中，用户更需要的是可靠的信息，而非一个听起来自信但可能错误的答案。针对这一困境，Ope…

09/09

程实：老龄化的债务幻觉

09/08

OpenAI重组GPT-5“灵魂”团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

一次组织重组+评测范式重构，也许正在改写AI的能力边界与产品形态。

09/07

OpenAI研究人员：破解大语言模型“幻觉”需从评估指标入手，避免奖励猜测

研究指出，当前模型训练过程中，评估标准更倾向于奖励“自信回答”，即使答案错误也能获得较高分数。这种机制导致模型被优化为“考试型选手”，在面对不确定问题时倾向于猜测而非承认“不知道”。研究团队呼吁行业建立更符…

09/07

参数量1T，阿里官方介绍“通义最强语言模型”Qwen3-Max-Preview

在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强。

09/07

OpenAI研究人员：破解大语言模型“幻觉”难题，关键在调整评估标准

研究团队在最新论文中指出，现有训练机制导致模型倾向于"假装知情"。这种设计源于评估体系对"完整回答"的过度奖励，使得模型在信息不足时仍会强行输出内容。这种机制迫使系统将复杂现实简化为非此即彼的判断，而忽略了…...

09/07

OpenAI称破解大语言模型“幻觉”难题，根源在评估标准，需重新设计

近日，据海外科技媒体《商业内幕》报道，OpenAI研究团队在解决大语言模型核心缺陷方面取得突破性进展——通过重构评估体系，成功缓解了困扰行业的“幻觉”问题。这种倾向源于评估体系对猜测行为的过度奖励——模型若拒…

09/06

OpenAI研究人员宣称已破解模型“幻觉”：重新设计评估指标即可

09/06

OpenAI研究人员宣称已破解模型“幻觉”：重新设计评估指标即可

研究人员指出：“人类会在现实生活的挫折中学会表达不确定性的价值，而大语言模型的评估主要依赖考试，这些考试却惩罚了不确定的回答。”“问题的根源是评估指标没有对齐，必须调整主要的评分方式，避免在模型不确定时因拒…

09/06

OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首

AI一本正经地胡说八道，原来是我们教的。

09/06

OpenAI研究人员宣称已破解模型“幻觉”：重新设计评估指标即可

模型被训练成“装作知道”，而不是坦率地说“我不确定”。

09/06

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

09/06

Qwen3-Max-Preview上线，官方称系通义千问系列最强大的语言模型

该模型支持超过100种语言，具有更强的翻译和常识推理能力。

09/06

企业IT资产AI化改造解决方案，模型幻觉问题解决率达100% | 创新场景

09/05

«上一页 1 2 … 3 4 … 5 6 下一页» 共180条/6页

全部热门