头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • 奥特曼深夜官宣:OpenAI重回开源!两大推理模型追平o4-mini,号称世界最强

    奥特曼深夜官宣:OpenAI重回开源!两大推理模型追平o4-mini,号称世界最强

    08/06
  • 面向6G环境感知通信!西电开源3Dx3D无线电地图数据集与生成式基准框架

    08/05
  • 通义千问首个文生图模型开源:破解AI图像生成“写字”难题,复杂中英文渲染效果惊艳

    目前,该模型已在魔搭社区与Hugging Face开源。

    08/05
  • MLLM集体翻车,缺乏婴儿级常识!业界首个核心认知基准发布,LeCun转赞

    08/04
  • GPU的替代者,LPU是什么?

    LPU,专为推理而设计的硬件。

    08/03
  • 大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

    在Video-TT出现之前,视频理解领域已有相应的评测标准,但这些标准普遍存在一定局限性,导致AI的真实能力无法被准确衡量。在这种情况下,一些顶尖模型的表现接近甚至达到了人类水平(上图左侧),这容易给人一种…

    08/01
  • 港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

    08/01
  • 清华汪玉团队提出VS-Bench测试基准,能评估VLM多项能力

    07/31
  • 通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

    目前,该模型已在魔搭社区和HuggingFace平台全面开源。

    07/30
  • GPT-5基准测试泄露,被曝两天后发布?打Minecraft震撼开挂网友直呼封神

    07/29
  • 被OpenAI点名后,智谱刚刚发布新开源模型:国产最全能,一句话造出搜索引擎

    被OpenAI点名后,智谱刚刚发布新开源模型:国产最全能,一句话造出搜索引擎

    07/29
  • 蚂蚁数科联合多家机构发布Finova大模型金融应用评测基准

    为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理…

    07/28
  • 蚂蚁数科联合多家机构发布Finova大模型金融应用评测基准

    07/28
  • 字节推出中英同传新模型:模拟音色 延迟近专业同传译员水平

    支持零样本声音复刻,提升沟通自然度。

    07/24
  • 鱼跃医疗:评估基准日后标的子公司现疑云,实控人之子减持供应商或套现超亿元

    07/24
  • 字节跳动正式发布端到端同声传译模型:准确率接近真人 3秒延迟

    在多人会议等复杂场景中英双向翻译准确率超70%。

    07/24
  • 3年跑输基准,却狂收12亿管理费,富国朱少醒的20年口碑崩了?

    07/23
  • 首个统一「图像/视频」自适应语义分割框架来了!QuadMix刷榜多项基准

    07/23
  • 指数增强基金能否“锚定基准”又力争超越?

    07/23
  • 鱼跃医疗:评估基准日后标的子公司现疑云 实控人之子减持供应商或套现超亿元

    07/23
  • 字节跳动发布通用机器人模型GR-3:配套设计ByteMini机器人,支持高泛化、长程任务、柔性物体双臂操作

    GR-3 操作物体的成功率从不到60%提升到超过80%。

    07/22
  • OpenAI神秘新模型斩获IMO 2025金牌,攻克奥数巅峰

    OpenAI宣布,创造历史的模型,并非传闻中的GPT-5,而是一个全新的、实验性的模型。

    07/20
  • 指数增强基金能否“锚定基准”又力争超越?

    07/19
  • 「0污染」LLM理解基准来了!20000道题14个学科全覆盖,来自微软

    07/18
  • 「0污染」LLM理解基准来了!20000道题14个学科全覆盖,来自微软

    为了提供更为准确、公平的评估,微软亚洲研究院推出了MMLU-CF,它是基于公开数据源,经过去污染设计的大语言模型理解基准,并已在Huggingface上开放。 对于MMLU-CF,研究人员在数据收集时应用了…

    07/18
  • 大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

    07/18
  • 大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

    【新智元导读】首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。 DrafterBench以图纸修改为核心任务,在20个真实项目中收集并设计了1920个…

    07/18
  • OpenAI史上最强ChatGPT智能体发布:逛网站、做PPT样样精通

    ChatGPT智能体模型在Humanity's Last Exam(pass@1)中得分率为41.6%

    07/18
  • 刚刚,OpenAI发布ChatGPT版Manus!奥特曼:感受AGI时刻

    OpenAI交出了Agent的答案。

    07/18
  • OpenAI的“Manus时刻”来了:ChatGPT Agent正式发布

    OpenAI的“Manus时刻”来了:ChatGPT Agent正式发布

    07/18
  •  «上一页   1   2   …  3   4   5   …   6   7   下一页»   共209条/7页 
    全部热门
  • 农发行湖北省分行被罚150万,涉违反金融统计管

    10/31 16:58

  • 浙江平湖农商行被罚450万,涉关联交易管理不审

    10/31 16:58

  • 老铺黄金距离奢侈品牌有多远?

    10/31 16:56

  • 文华东方300亿元赎身,“老钱”找新路子了

    10/31 16:56

  • 思妍丽入局,美丽田园能否完成“二次蜕变”

    10/31 16:56

  • 预售比现货贵背刺“所有女生”,李佳琦们黄金

    10/31 16:56

  • 张一鸣死磕游戏,字节海外再出平台

    10/31 16:56

  • 鸣鸣很忙冲刺港股:半年营收281亿,门店16783

    10/31 16:55

  • 苹果季绩沸腾,港股“果链”表现分化

    10/31 16:55

  • AI重构之下的双11

    10/31 16:55

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号