头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • OpenAI高管自爆:Scaling不死,GPT-5“双轴训练”撕开智能天花板

    GPT-5实现自动推理,健康与企业应用大升级,AGI仍在路上。

    08/20
  • 英特尔12核Panther Lake处理器现身:无超线程,基础频率3.0 GHz

    该处理器具有12个物理核心

    08/19
  • 英伟达开源9B参数小模型,比Qwen3快6倍

    英伟达开源9B参数小模型,比Qwen3快6倍

    08/19
  • 联发科天玑9500现身基准测试:采用“1+3+4”CPU架构,频率达4.21GHz

    08/16
  • 刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o

    智东西8月15日消息,今日晚间,阿里宣布推出首个开源多模态深度研究智能体(Deep Research Agent)——WebWatcher。WebWatcher的核心创新点在于配备了增强的视觉语言推理能力,…

    08/16
  • 刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o

    08/15
  • 全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek

    2025年8月12日,字节跳动Seed团队正式发布WideSearch并首次系统评估AI搜索助手在复杂信息收集任务中的真实能力,发现即使是最先进的AI系统成功率也仅有5%,远低于人类协作团队的近100%成功…

    08/13
  • GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

    08/12
  • GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

    GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

    08/12
  • GPT-5能让普通人变成博士,但魔法依旧没有

    网民已经在问“GPT-6什么时候到来?”

    08/08
  • 基准测试得分与前代模型差距不大,GPT-5幻觉率有所下降

    08/08
  • GPT-5王者降临,免费博士级AI全面屠榜!百万程序员不眠之夜,7亿人沸腾

    GPT-5是通往AGI的又一里程碑

    08/08
  • 奥特曼发布GPT-5!人人免费用博士级智能,基准图错误遭全网吐槽

    08/08
  • 像第一代视网膜iPhone、堪比博士,OpenAI发布最强模型GPT-5

    GPT-5在SWE-bench Verified中得分74.9%,在Aider Polyglot得分88%。

    08/08
  • 风云A9L上市品鉴会,定义旗舰新基准

    千年长安,古韵与新潮交辉。2025年8月6日,“鉴真章 风云A9L上市品鉴会”在西安圆满落幕。作为奇瑞品牌深耕高端市场的重磅力作,全球真C级旗舰——风云A9L的璀璨登场,不仅展现了奇瑞在技术研发与豪华制造领域的深厚积淀,更以一场融合高端质感与科技魅力的盛宴,为这座古都注入了全新的豪华出行活力,彰显了奇瑞“以用户为中心”的品牌理念...

    08/07
  • 风云A9L上市品鉴会,定义旗舰新基准

    千年长安,古韵与新潮交辉。2025年8月6日,“鉴真章 风云A9L上市品鉴会”在西安圆满落幕。作为奇瑞品牌深耕高端市场的重磅力作,全球真C级旗舰——风云A9L的璀璨登场,不仅展现了奇瑞在技术研发与豪华制造领域的深厚积淀,更以一场融合高端质感与科技魅力的盛宴,为这座古都注入了全新的豪华出行活力,彰显了奇瑞“以用户为中心”的品牌理念...

    08/07
  • Claude 4.1 发布:更强的Agent、代码和推理

    Claude 4.1 发布:更强的Agent、代码和推理

    08/06
  • 奥特曼深夜官宣:OpenAI重回开源!两大推理模型追平o4-mini,号称世界最强

    奥特曼深夜官宣:OpenAI重回开源!两大推理模型追平o4-mini,号称世界最强

    08/06
  • 面向6G环境感知通信!西电开源3Dx3D无线电地图数据集与生成式基准框架

    08/05
  • 通义千问首个文生图模型开源:破解AI图像生成“写字”难题,复杂中英文渲染效果惊艳

    目前,该模型已在魔搭社区与Hugging Face开源。

    08/05
  • MLLM集体翻车,缺乏婴儿级常识!业界首个核心认知基准发布,LeCun转赞

    08/04
  • GPU的替代者,LPU是什么?

    LPU,专为推理而设计的硬件。

    08/03
  • 大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

    在Video-TT出现之前,视频理解领域已有相应的评测标准,但这些标准普遍存在一定局限性,导致AI的真实能力无法被准确衡量。在这种情况下,一些顶尖模型的表现接近甚至达到了人类水平(上图左侧),这容易给人一种…

    08/01
  • 港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

    08/01
  • 清华汪玉团队提出VS-Bench测试基准,能评估VLM多项能力

    07/31
  • 通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

    目前,该模型已在魔搭社区和HuggingFace平台全面开源。

    07/30
  • GPT-5基准测试泄露,被曝两天后发布?打Minecraft震撼开挂网友直呼封神

    07/29
  • 被OpenAI点名后,智谱刚刚发布新开源模型:国产最全能,一句话造出搜索引擎

    被OpenAI点名后,智谱刚刚发布新开源模型:国产最全能,一句话造出搜索引擎

    07/29
  • 蚂蚁数科联合多家机构发布Finova大模型金融应用评测基准

    为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理…

    07/28
  • 蚂蚁数科联合多家机构发布Finova大模型金融应用评测基准

    07/28
  •  «上一页   1   2   …   3   4   5   …   6   7   下一页»   共196条/7页 
    全部热门
  • 从大模型到Agent:百度GenFlow2.0,定义新赛点

    08/20 10:25

  • 搜索引擎可能完蛋,但谷歌的广告费一分不少。

    08/20 10:25

  • 网友吐槽总打断李想说话,罗永浩:感谢提醒

    08/20 10:24

  • 马云时隔六年再访蚂蚁森林:和树比高

    08/20 10:24

  • 社保基金最新持仓披露 重仓89股 青睐基础化工

    08/20 10:23

  • 炎热的夏天,火热的牛市,能否持续?

    08/20 10:23

  • 奥美森:自称无具体产能数据陷“罗生门” 产品

    08/20 10:23

  • 吸引力增强 外资看多做多中国股市

    08/20 10:22

  • 暴增103%!赣州“前首富”,即将翻身

    08/20 10:22

  • 中国OTA「分野」:为什么大众旅游更有含金量?

    08/20 10:22

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号