头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

  • 全部
  • 快讯
  • 新科技
  • 新金融
  • 新零售
  • 智能车
  • 房地产
  • 电商资讯
  • 教育资讯
  • 上市公司
  • 人物资讯
  • 科技探索
  • 人工智能
  • 网络游戏
  • 复旦&通义万相提出ProMoE,显式路由引导打破DiT MoE scaling瓶颈

    03/31
  • 跳过88%专家,保住97%性能!MoE推理的正确玩法| CVPR’26

    03/05
  • 宣称从0构建,印度AI实验室Sarvam发布两款MoE架构LLM

    02/21
  • 无问芯穹FUSCO以「空中变阵」突破MoE通信瓶颈,专为Agent爆发设计

    01/04
  • QwenLong-L1.5发布:让30B MoE模型长文本推理能力媲美GPT-5

    12/29
  • Mamba作者团队SonicMoE:一个Token舍入,让MoE训练速度提升近2倍

    12/19
  • OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

    12/14
  • OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

    也就是Circuit Sparsity技术的开源实现

    12/14
  • 华为放出「准万亿级MoE推理」大招,两大杀手级优化技术直接开源

    11/28
  • 全球首个“纯AMD”训练MoE大模型ZAYA1 发布:14T tokens+CCA注意力,性能对标Qwen3

    11/25
  • 不用英伟达,Gemini 3是如何训练的?

    不用英伟达,Gemini 3是如何训练的?

    11/25
  • DeepSeek开源MoE新利器LPLB:基于线性规划,专攻训练动态负载不平衡

    11/20
  • EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!

    11/18
  • 科大讯飞发布星火X1.5,率先在全国产算力平台攻克MoE模型全链路训练效率

    11/06
  • 全新Hybrid-MoE架构用于增强通用大模型低资源代码能力

    10/30
  • Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE

    10/30
  • 蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K,混合注意力+MoE架构重塑长文本编程效率

    10/28
  • 清华&巨人网络首创MoE多方言TTS框架,数据代码方法全开源

    10/15
  • 6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0

    09/17
  • 扩散语言模型也有MoE版本!蚂蚁&人大从头训练LLaDA-MoE,即将开源

    09/12
  • 蚂蚁联手人大,发布MoE扩散模型

    09/12
  • 蚂蚁、中国人民大学发布行业首个原生MoE扩散语言模型

    09/12
  • 全新MoE架构!阿里开源Qwen3-Next,训练成本直降9成

    基于 Qwen3-Next 的模型结构,通义团队训练了 Qwen3-Next-80B-A3B-Base 模型,该模型拥有 800亿参数(仅激活 30 亿参数),实现了与 Qwen3-32B dense 模…

    09/12
  • 2025外滩大会:蚂蚁、人大发布首个原生MoE扩散语言模型

    09/12
  • 阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列

    阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列

    09/12
  • Cursor为Blackwell构建MXFP8内核,MoE层提速3.5倍,端到端1.5倍

    08/22
  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    在此背景下,中国科学技术大学人工智能与数据科学学院执行院长张燕咏率领团队,在中国科学技术大学 鲲鹏昇腾科教创新卓越中心的算力支持下,成功研发出了基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。…

    08/21
  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    在此背景下,中国科学技术大学人工智能与数据科学学院执行院长张燕咏率领团队,在中国科学技术大学 鲲鹏昇腾科教创新卓越中心的算力支持下,成功研发出了基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。…

    08/20
  • 昆仑万维上线AI音乐模型Mureka V7.5 并推出MoE-TTS语音模型

    08/15
  • 香港中文大学:Grove MoE架构优化大模型资源调度

    在传统的人工智能架构中,专家系统就像一群能力相同的员工,每当有任务来临时,总是固定地选择其中几个人来处理,无论任务简单还是复杂。研究团队通过Grove MoE证明了一个重要观点:在追求人工智能性能突破的道…

    08/14
  •  «上一页   1   2   下一页»   共59条/2页 
    全部热门
  • 又一家手机公司要做AI眼镜了,前一加联合创始

    04/01 16:41

  • 首款天玑9500s风冷手机来了!OPPO K15 Pro系列

    04/01 16:41

  • 微软在干嘛:Linux打游戏反超Windows!没有原

    04/01 16:41

  • 雷军:5小时,直播拆一台新SU7

    04/01 16:41

  • 中国联通提出新框架MeanCache,刷新多模态生成

    04/01 16:41

  • 环球音乐集团与网易云音乐宣布达成多年期授权

    01/20 14:04

  • X平台正式开源推荐算法,马斯克称没有其他社交

    01/20 14:04

  • 黑芝麻智能(02533.HK)1月19日耗资600.02万港元

    01/20 13:53

  • 南戈壁(01878.HK)因购股权获行使发行5万股

    01/20 13:53

  • 中国中免(01880.HK)拟收购DFS大中华区零售业务

    01/20 13:53

关于我们| 商业合作| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
© 2025 头部财经 TOP168.COM 洞悉时代脉搏,领航财富未来!All Rights Reserved 鲁ICP备2025162390号-1 京公网安备 11011402013531号