头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • 如何让大模型更“聪明”?科学家揭示大模型逻辑推理的关键缺陷

    09/09
  • 百度发布文心大模型X1.1深度思考模型 事实性、指令遵循等能力均有提升

    百度发布文心大模型X1.1深度思考模型 事实性、指令遵循等能力均有提升

    09/09
  • 微软研究院突破:AI逻辑推理能力提升125%

    像DeepSeek-R1这样的模型已经展现出了令人印象深刻的推理能力,但其训练方法和数据集并未公开,这为研究界带来了巨大困扰。更令人惊喜的是,模型在这个过程中自发发展出了多种复杂的推理行为。 研究团队对强化…

    08/23
  • OpenAI AI系统在2025国际信息学奥赛中夺金,逻辑推理能力超98%人类选手

    在科技界引发轰动的一则消息中,OpenAI的研究员Sheryl Hsu宣布了一项里程碑式的成就:其内部研发的AI推理系统在国际信息学奥林匹克竞赛(IOI)中荣获金牌,这是2025年的赛事中首次有AI达到这一高…

    08/13
  • 消息称百度计划8月底前发布AI推理新模型,未来几个月推文心5.0

    文心大模型4.5是百度首个原生多模态大模型,多项测试表现优于GPT4.5

    08/07
  • 字节跳动推出豆包大模型1.6 逻辑推理全面升级

    开源扣子核心能力,开放模型微调框架等技术模块以降低开发门槛

    07/30
  • 通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

    目前,该模型已在魔搭社区和HuggingFace平台全面开源。

    07/30
  • 阿里云更新Qwen3模型 涵盖文本理解、科学等多个关键领域

    Qwen3新模型已在魔搭社区和HuggingFace上开源更新。

    07/22
  • “嫉妒”AI原住民的黄仁勋,建议年轻人继续学逻辑推理

    07/17
  • 中兴努比亚宣布接入百度文心4.5开源大模型

    百度已于6月30日开源了文心大模型4.5系列。

    07/10
  • 谷歌DeepMind、普林斯顿大学推出新AI模型,可精准预测人类行为

    目前,Psych-101数据集和Centaur模型已全部开放。

    07/07
  • MIT新研究指出AI不懂“no”,逻辑推理缺陷导致否定词成“盲区”

    研究表明,AI 已快速发展,具备诊断疾病、创作诗歌甚至驾驶汽车等多项实用技能,但对“no”和“not”等否定词,却束手无策。Katanforoosh 警告,AI 对否定的误解不仅是一项技术缺陷,更可能在法…

    05/22
  • MIT 新研究指出AI不懂“no”,逻辑推理缺陷导致否定词成“盲区”

    5 月 22日消息,麻省理工学院(MIT)最新研究表明,人工智能(AI)在理解“no”和“not”等否定词方面仍存在明显缺陷,在医疗等关键领域可能引发严重风险。Katanforoosh 警告,A…

    05/22
  • 昆仑万维“天工大模型4.0”o1版启动邀测,具备中文逻辑推理能力

    据介绍,Skywork o1 是由昆仑万维集团发布的具有“慢思考推理能力”的系列模型,是国内第一款具备中文逻辑推理能力的 o1模型。不同于现有的复现 OpenAI o1 模型的工作,Skywork o1 …

    11/27
  • 昆仑万维“天工大模型4.0”o1版启动邀测,具备中文逻辑推理能力

    据介绍,Skywork o1 是由昆仑万维集团发布的具有“慢思考推理能力”的系列模型,是国内第一款具备中文逻辑推理能力的 o1模型。不同于现有的复现 OpenAI o1 模型的工作,Skywork o1 …

    11/27
  • 昆仑万维发布国内首款具备中文逻辑推理能力o1模型——“天工大模型4.0 O1版”邀测即将启动

    近日,昆仑万维宣布,其研发的国内首款具备中文逻辑推理能力的o1模型——“天工大模型4.0 O1版”(英文名:SkyworkO1)将于11月27日正式启动邀请测试。 天工大模型4.0 O1版的逻辑推理能力是其…

    11/19
  • 苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理

    尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也会急剧下降。在论文中,研究人员通过一个简单的数学问题证明了这一点。 但是,一…

    10/13
  • 分不清9.11和9.9大小暴露大模型逻辑推理短板

    于2002年8月由博客教父方兴东创立。作为中国博客发源地,汇聚国内众多具新锐思想的意见领袖,是中国最具影响力的博客平台。“每天5分钟,给思想加油”是我们的宗旨!

    07/18
    全部热门
  • 灵光APP上线3天扩容8轮 冲上App Store中国区免

    11/24 16:08

  • 华为助力机械导盲犬问世:实时规划路径、语音

    11/24 16:08

  • 任正非:坚决要把“夹心阶层”消灭掉

    11/24 16:08

  • 特斯拉FSD正式登陆韩国,全球落地国家增至七个

    11/24 16:08

  • 田渊栋、卡帕西力荐Nano Banana新玩法:论文变

    11/24 16:07

  • 工信部公示人形机器人标准化技术委员会委员名

    11/24 16:07

  • 农发行湖北省分行被罚150万,涉违反金融统计管

    10/31 16:58

  • 浙江平湖农商行被罚450万,涉关联交易管理不审

    10/31 16:58

  • 老铺黄金距离奢侈品牌有多远?

    10/31 16:56

  • 文华东方300亿元赎身,“老钱”找新路子了

    10/31 16:56

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号