moe-资讯搜索-头部财经

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

全新Hybrid-MoE架构用于增强通用大模型低资源代码能力

10/30

Cursor发布首个编程大模型！代码生成250tokens/秒，强化学习+MoE

10/30

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

10/28

清华&巨人网络首创MoE多方言TTS框架，数据代码方法全开源

10/15

6.1B打平40B Dense模型，蚂蚁开源最新MoE模型Ling-flash-2.0

09/17

扩散语言模型也有MoE版本!蚂蚁&人大从头训练LLaDA-MoE,即将开源

09/12

蚂蚁联手人大，发布MoE扩散模型

09/12

蚂蚁、中国人民大学发布行业首个原生MoE扩散语言模型

09/12

全新MoE架构！阿里开源Qwen3-Next，训练成本直降9成

基于 Qwen3-Next 的模型结构，通义团队训练了 Qwen3-Next-80B-A3B-Base 模型，该模型拥有 800亿参数（仅激活 30 亿参数），实现了与 Qwen3-32B dense 模…

09/12

2025外滩大会：蚂蚁、人大发布首个原生MoE扩散语言模型

09/12

阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列

阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列

09/12

Cursor为Blackwell构建MXFP8内核，MoE层提速3.5倍，端到端1.5倍

08/22

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

在此背景下，中国科学技术大学人工智能与数据科学学院执行院长张燕咏率领团队，在中国科学技术大学鲲鹏昇腾科教创新卓越中心的算力支持下，成功研发出了基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。…

08/21

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

在此背景下，中国科学技术大学人工智能与数据科学学院执行院长张燕咏率领团队，在中国科学技术大学鲲鹏昇腾科教创新卓越中心的算力支持下，成功研发出了基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。…

08/20

昆仑万维上线AI音乐模型Mureka V7.5 并推出MoE-TTS语音模型

08/15

香港中文大学：Grove MoE架构优化大模型资源调度

在传统的人工智能架构中，专家系统就像一群能力相同的员工，每当有任务来临时，总是固定地选择其中几个人来处理，无论任务简单还是复杂。研究团队通过Grove MoE证明了一个重要观点：在追求人工智能性能突破的道…

08/14

OpenAI重磅开源！GPT-OSS模型泄露，116亿参数MoE架构震撼曝光，AI新纪元来袭？

08/04

阿里又开源了！电影级视频模型，业界首用MoE架构，通义App已上线

07/29

通义万相2.2正式开源：首个使用MoE架构的视频生成模型

同时，Wan2.2还首创了「电影美学控制系统」

07/28

苹果AI报告：端侧内存占用减少37.5%，云端创新PT-MoE架构

07/22

深挖苹果 AI 报告：端侧内存占用少 37.5%、云端创新 PT-MoE 架构

07/22

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

07/16

iPhone 17灵动岛或将彻底隐身！MOE是什么鬼？

本周二，美国专利商标局正式授予苹果一项专利，显示苹果正在研究一种基于「超表面光学元件（MOEs）」的新型 Face ID系统，这项技术可能彻底改写 iPhone 正面光学模组的结构。这种设计虽然在过去几年…

05/30

新壹科技亮相2025中关村论坛 MoE架构引领AI应用新浪潮

作为国内人工智能领域的领军企业,新壹科技携多项AIGC(生成式人工智能)创新成果亮相展会,其最新推出的混合专家模型(Mixture ofExperts, MoE)架构解决方案成为全场焦点,展现了AI技术在多…

03/28

新壹科技发布MoE架构金融解决方案:AI风控合规效能提升超60%

该方案通过动态路由技术、多模态数据处理能力及分布式部署优势,显著提升了金融机构在AI风控、智能内审、合规营销、客户服务等核心业务场景的效率与安全性,为行业智慧化转型树立新标杆。实时风险拦截:通过MoE架构整…

03/26

小白读懂DeepSeek：从MoE到MLA，国产AI改变世界

不过随着DeepSeek-R1及相关训练技术的开源，不少AI大厂都已经在尝试引入相关机制来训练模型，并在他们原有的强化学习架构上根据DeepSeek的经验进行优化，或许我们很快就会迎来一次新的AI性能暴涨。…

03/11

字节跳动豆包团队开源MoE架构优化技术：可将大模型训练效率提升1.7倍

该技术已在字节跳动的万卡集群训练中得到实际应用。对于此次开源的决定，豆包大模型团队希望通过分享这一技术，推动整个AI社区在模型训练效率方面的共同进步。开源不仅有助于加速行业技术发展，还能为更多研究者和开发…

03/10

DeepSeek开源进度2/5：用于MoE模型训练和推理的EP通信库DeepEP

支持节点内外通信，兼容 NVLink 和 RDMA 技术为了与 DeepSeek-V3 论文中提出的组限制门控算法兼容，DeepEP提供了一些针对不对称带宽转发优化的内核，比如将数据从 NVLink…

02/25

豆包提出全新稀疏模型架构UltraMem，推理成本较MoE最高可降83%

实验结果表明，在参数和激活条件相同的情况下，UltraMem 在模型效果上超越了 MoE，并将推理速度提升了 2-6 倍。尽管 MoE架构已经成功将计算和参数解耦，但在推理时，较小的 batch size…

02/12

国产大模型 DeepSeek-V3 开源：6710 亿参数自研 MoE

12 月 27 日消息，“深度求索”官方公众号昨日（12 月 26 日）发布博文，宣布上线并同步开源 DeepSeek-V3模型，用户可以登录官网 chat.deepseek.com，与最新版 V…

12/27

«上一页 1 2 下一页» 共45条/2页

全部热门