当前位置：首页 » 资讯 » 新科技 » 正文

高通发布AI200/AI250数据中心AI加速卡：最早2026年商用，主打机架级推理

IP属地中国·北京 编辑：陈阳凤凰网科技 时间：2025-10-28 22:05:22

10月28日，高通技术公司今日发布两款面向数据中心市场的AI推理芯片解决方案——Qualcomm AI200与AI250。这两款产品以加速卡和机架系统形式提供,专门针对大语言模型和多模态模型的推理场景进行优化。
据了解，Qualcomm AI200的单张加速卡可支持768GB LPDDR内存，采用机架级设计架构。该方案通过提升内存容量并降低成本,试图在AI推理的扩展性与灵活性上寻求平衡点。而Qualcomm AI250则引入了近存计算(Near-Memory Computing)技术，官方数据显示,这一架构能够使有效内存带宽提升超过10倍，同时降低功耗表现。
从散热与扩展能力来看，两款机架方案均支持直接液冷技术，并具备PCIe纵向扩展与以太网横向扩展能力。整机架功耗控制在160千瓦，同时配备机密计算功能以保障数据中心工作负载的安全性需求。
高通技术公司高级副总裁兼技术规划、边缘解决方案和数据中心业务总经理马德嘉(Durga Malladi)在发布时表示，这两款产品重新定义了机架级AI推理的能力边界，软件层面覆盖从应用层到系统软件层的完整技术栈，并兼容主流机器学习框架和推理引擎。开发者可通过高通的高效Transformer库以及Qualcomm AI Inference Suite实现模型快速接入，支持Hugging Face模型的一键部署流程。
值得注意的是,AI250方案中提到的解耦式AI推理架构,旨在提升硬件资源的利用效率,这也是当前数据中心AI部署中较为关注的技术方向之一。
从商用时间表来看，Qualcomm AI200预计于2026年实现商用，AI250则计划在2027年推向市场。高通方面透露，未来将以年度迭代节奏推进数据中心产品线，持续在AI推理性能、能效和总体拥有成本方面进行技术演进。

标签：机架 ai 内存 内存容量 高通 数据中心 成本

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

高效训练新标杆！华人开源原生VLM-NEO，以少数据追平顶级模型

AR行业2~3年内出现“iPhone时刻”？智能眼镜龙头加速布局上海

从“百模大战”到“百镜大战”，AI眼镜成新焦点丨一克商评

欧摩威展示单雷达AEB方案！已获国内头部主机厂定点，明年将量产

苹果公司总市值首次升破4万亿美元

华为路由 12 月升级 HarmonyOS 6 系统，支持 AI 绿色上网 2.0

全站最新

高效训练新标杆！华人开源原生VLM-NEO，以少数据追平顶级模型

AR行业2~3年内出现“iPhone时刻”？智能眼镜龙头加速布局上海

从“百模大战”到“百镜大战”，AI眼镜成新焦点丨一克商评

欧摩威展示单雷达AEB方案！已获国内头部主机厂定点，明年将量产

热门推荐

百万鸿蒙智行里独占四分之一！问界M9累计交付超25万台

高效训练新标杆！华人开源原生VLM-NEO，以少数据追平顶级模型

AR行业2~3年内出现“iPhone时刻”？智能眼镜龙头加速布局上海

29.98万-32.98万元，腾势N8L正式上市

从“百模大战”到“百镜大战”，AI眼镜成新焦点丨一克商评

欧摩威展示单雷达AEB方案！已获国内头部主机厂定点，明年将量产

苹果公司总市值首次升破4万亿美元

“未来之声”唱响“未来之城”

华为路由 12 月升级 HarmonyOS 6 系统，支持 AI 绿色上网 2.0

豪掷近5000万买豪宅，曾被马云看重的男人身家68亿

刚刚！利好突袭，直线爆拉！

BIO-FORUM 2025 蓄势待发｜聚焦生物医药前沿技术，共建全球创新合作生态

Nature｜尺寸与光电转换效率创世界纪录，上海科学家团队携手龙头企业突破大尺寸钙钛矿光伏模组产业化关键技术

高通发布AI200和AI250 赋能高速生成式AI推理

XREAL启用上海浦东全球总部，明年推出首款Android XR系统AR眼镜