当前位置：首页 » 资讯 » 新科技 » 正文

英伟达 GPU 用量削减 82%！阿里云用 213 张卡干 1192 张卡的活

IP属地中国·北京 编辑：郑佳 IT之家 时间：2025-10-18 18:04:14

IT之家 10 月 18 日消息，南华早报今天（10 月 18 日）发布博文，报道称在韩国首尔举办的第 31 届操作系统原理研讨会（SOSP）上，阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选，可解决 AI 模型服务中普遍存在的 GPU 资源浪费问题。
IT之家查询公开资料，SOSP 是计算机操作系统领域的顶尖会议，相当于计算机操作系统界的“奥斯卡”，其录取率控制非常严格，平均每年收录的论文数量仅有数十篇，入选论文代表了操作系统和软件领域最具代表的研究成果。
博文称云服务商当前在提供 AI 模型服务时，面临着严重的资源效率低下问题。平台需要同时托管数千个 AI 模型以处理海量并发 API 调用，但用户请求往往高度集中在少数几个热门模型上，例如阿里巴巴的 Qwen 系列模型。
研究人员发现，这种“长尾效应”导致了严重的资源闲置：在阿里云的模型市场中，竟有 17.7% 的 GPU 算力仅被用于处理 1.35% 的请求，造成了巨大的成本浪费。
为解决这一痛点，Aegaeon 系统应运而生。它通过创新的 GPU 资源池化技术，允许单个 GPU 动态服务于多个不同的 AI 模型，打破了以往 GPU 与特定模型绑定的低效模式。
在阿里云模型市场进行的为期超过三个月的 Beta 测试中，Aegaeon 系统展现了卓越的效能。测试数据显示，服务数十个参数量高达 720 亿的大模型，所需的英伟达 H20 GPU 数量从 1192 个成功减少至 213 个，数量削减高达 82%。
这项由北京大学与阿里云合作的研究成果，被认为是“首个揭示并解决市场上并发大语言模型服务存在过高成本”的公开工作，为行业提供了全新的优化思路。
值得一提的是，阿里云首席技术官周靖人也是该论文的作者之一。周靖人是国际电气与电子工程师协会会士（IEEE Fellow），国际计算机协会会士（ACM Fellow），阿里巴巴集团副总裁，阿里云智能 CTO、达摩院副院长。

标签：模型 阿里云 ai gpu 论文 研究成果 aegaeon 计算机 资源 录取率

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

无需再引流！马斯克旗下X平台推出站内创作者变现功能

「死了么」回来了！爆火后争议缠身，这次要好好做？

林俊旸可别拿阿里的钱

你的手机信号正在变聪明：三件事看懂通信服务的未来

真我暂停新机研发上热搜！OPPO回应称产品研发工作正常进行中

刚上春晚，公司创始人被传离职，最新公告

全站最新

无需再引流！马斯克旗下X平台推出站内创作者变现功能

「死了么」回来了！爆火后争议缠身，这次要好好做？

林俊旸可别拿阿里的钱

你的手机信号正在变聪明：三件事看懂通信服务的未来

热门推荐

无需再引流！马斯克旗下X平台推出站内创作者变现功能

「死了么」回来了！爆火后争议缠身，这次要好好做？

林俊旸可别拿阿里的钱

你的手机信号正在变聪明：三件事看懂通信服务的未来

挤爆腾讯！为了 “养虾”，近千人 “鹅厂” 门口排长队，小学生、大爷都来了！

真我暂停新机研发上热搜！OPPO回应称产品研发工作正常进行中

刚上春晚，公司创始人被传离职，最新公告

又一重磅临床转化平台落地外高桥，中国药科大学“加盟”浦东，让创新不再“卡在路上”

两会现场速递|“希望机器人‘徒弟’超越我”

大厂抢人才：字节启动最大规模转正实习生招聘，腾讯放话招1万人

阿里辟谣大模型团队集体离职：团队稳定服务正常

全国人大代表雷军：未来几年会有更多人形机器人进厂干活

百亿智能体时代，中小企业怎么办？全国政协委员周鸿祎：不要盲目追求部署数量

京东曹鹏：AI效能优先倒逼行业转向“重实效”

加密货币全线下跌比特币跌超5%