当前位置：首页 » 资讯 » 新科技 » 正文

趋境开源框架 KTransformers 成主流大模型首选，Qwen、Kimi、智谱 AI 推荐，单卡跑万亿模型

IP属地中国·北京 雷峰网 时间：2025-11-21 02:07:41

全球头部开源模型方的共同选择，印证了一款底层框架的硬实力。趋境科技与清华共同开源的KTransformers，已成为Qwen、Kimi、智谱AI等多个主流大模型发布首日的推荐推理引擎，其工程实践与兼容性也被多家一体机产品线采纳，成为被开发者、厂商与开源社区广泛复用的共建式底层框架。
技术与生态双认可：成功入选 “计算机系统领域奥斯卡” SOSP 2025
KTransformers 是一个高性能异构推理框架，专注于高效利用底层 GPU、CPU、内存等多样化算力，让大模型在更低算力、更灵活的硬件架构上高效运行。其论文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》成功入选 “计算机系统领域奥斯卡” SOSP 2025，该顶会过去几十年间见证了虚拟化、分布式文件系统等无数里程碑式技术成果的首次亮相，此次入选标志着 KTransformers 的技术实力获得全球顶尖认可。
11月6日，月之暗面发布Kimi-K2-Thinking 模型后，KTransformers迅速完成全面适配，支持用户在单卡环境下完成推理任务，2卡环境下完成LoRA微调任务，大幅降低部署与定制化门槛。同时，趋境科技也已完成该模型在昇腾NPU上的全面适配，提供完善的全国产化推理解决方案，进一步拓宽其应用场景。
推理与微调双高效：KTransformers+SGLang实现高性能推理部署
在推理部署层面，KTransformers与主流推理框架SGLang于10月达成合作，双方架构合入同一分支。在Kimi-K2-1TB的模型推理任务中，用户仅需简单安装SGLang与KTransformers CPU内核，下载官方模型及量化权重，即可通过一条命令启动服务，且仅需单张消费级 GPU+CPU。这一合作融合了GPU+CPU异构推理创新模式与全GPU传统推理模式，推动大模型推理向更高性能、更低成本演进，迈向更广泛的产业落地。

在微调部署层面，KTransformers与LLaMA-Factory深度集成，支持LoRA等轻量级微调方法，仅占用约41 GB显存+2T内存，就能实现46.55 token/s的微调吞吐量。传统上，LoRA 微调千亿模型成本高达数百万，而趋境的异构微调能力将资源需求降低到单个消费级 GPU（如 RTX 4090）起，让高校、中小型实验室、初创公司甚至个人开发者都能参与大模型定制。该方案在 DeepSeek-14B 模型上展现了超过传统方案 1.8 倍的吞吐、显存占用降低 82%，是消费级显卡上微调超大参数 MoE 模型的唯一可行方案。
对趋境科技而言，KTransformers承载的是 “普惠顶尖AI智能与隐私” 的价值理念。大模型时代需要更广谱的推理基础设施路线，趋境已与多个国产 CPU、GPU硬件平台合作，推进全国产高性价比方案；为数十家行业开发伙伴提供算力底座，让更多团队用得起、调得动大模型。今天的KTransformers，已让大模型推理脱离高端算力垄断；未来，趋境将继续推动 AI 能力普惠，让大模型真正融入各类业务场景。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

逮虾户注意！神秘模型点名OpenClaw，疑似是OpenAI

美团CEO王兴呼吁“减少登味”：不要喊我“兴哥”，登味太重了

数智融合绘就“十五五”新画卷

【315专辑】新型消费陷阱：利用AI仿冒明星代言

【315专辑】新型金融案件应对提速：虚拟货币纠纷的规则供给与挑战

【315专辑】网购三无食品维权难？可信时间戳助力消费者固定证据获法院支持

全站最新

逮虾户注意！神秘模型点名OpenClaw，疑似是OpenAI

美团CEO王兴呼吁“减少登味”：不要喊我“兴哥”，登味太重了

数智融合绘就“十五五”新画卷

【315专辑】新型消费陷阱：利用AI仿冒明星代言

热门推荐

逮虾户注意！神秘模型点名OpenClaw，疑似是OpenAI

美团CEO王兴呼吁“减少登味”：不要喊我“兴哥”，登味太重了

不亲自尝试不能知道OpenClaw的好，专家：养虾需要时间|讲堂视频

不亲自尝试不能知道OpenClaw的好，专家：养虾需要时间

数智融合绘就“十五五”新画卷

【315专辑】新型消费陷阱：利用AI仿冒明星代言

【315专辑】新型金融案件应对提速：虚拟货币纠纷的规则供给与挑战

【315专辑】网购三无食品维权难？可信时间戳助力消费者固定证据获法院支持

【315专辑】利用AI换脸技术仿冒名人带货，消费者如何维权？

华为FreeClip 2耳夹耳机全世界卖爆！余承东：国内外供不应求很多厂家想拷贝

央视曝光报废车黑色产业链；腾讯“龙虾”开启全国巡装

联想上线OpenClaw免费部署服务

第一批被反噬的“养虾人”已出现：IP、姓名、单位等信息被“龙虾”曝光在3000人群里

从极客工具到大众产品，“龙虾”还要进化多久？

AI真能代替人干活吗？B站联合6位UP主用OpenClaw直播做了一次社会实验