今年英伟达CEO黄仁勋已访华两次,早在今年1月,黄仁勋就先后到访深圳、中国台湾、北京和上海等城市,4月17日黄仁勋再度飞抵北京,此时距离美国宣布限制H20芯片对华出口仅过去一天。
现在又有新消息传来,黄仁勋将在7月开启今年来的第三次访华进京,本次将在7月16日到访中国举行媒体吹风会,旨在强化英伟达在中国市场的战略布局。
据了解,英伟达将于9月上市的中国特供版Blackwell AI芯片RTX Pro 6000。
该芯片基于现有架构,但剥离了高带宽内存和NVlink高速互联技术,以符合美国出口管制政策。
尽管性能较原版有所下降,但凭借英伟达CUDA生态的兼容性优势,仍将被国内大厂视为关键采购选项,不少大厂都在等英伟达的特供芯片发布。
与此同时,网上还流出了一张黄仁勋与雷军的合影,恰逢英伟达CEO即将开启年内第三次中国之行之际出现这样一张看似普通的照片,或许是在暗指小米与英伟达之间会有新的联系。
其实从照片穿着看,雷军和黄仁勋穿的都不是当季服装,这说明照片拍摄于往期黄仁勋访华行程。
英伟达官方也回应称“非公司发布”,知情人士透露此为路人拍摄的客户拜访场景。
其实早在2013年的小米3的发布会上,黄仁勋就曾和雷军同台,黄仁勋亲自登台介绍NVIDIA的Tegra芯片,甚至还在现场称自己是“米粉”。
而雷军与黄仁勋上一次深度接触,或许是因为正处于小米YU7全系搭载英伟达Thor芯片,正值量产关键期,双方才有更深层的碰面。
此外AI大模型被小米视为下一个增长引擎,小米AI大模型也需要大量芯片赋能,而早在去年年底就有媒体报道称,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。
在算力规模上,小米万卡集群由超过1万张高性能GPU组成,可支撑千亿参数大模型的训练与推理该计划已筹备数月,由雷军亲自领导,可见非常重视。
媒体指出,小米大模型团队在成立时已有6500张GPU资源,意味着还有几千张GPU的缺口,雷军和黄仁勋碰面,极有可能就是为了GPU芯片。
小米AI大模型在技术路线上,也展现出其独特的思考,与一些完全依赖第三方大模型的公司不同,小米选择了自研与合作并行的策略。
在全球AI大模型竞赛中,科技巨头们普遍采取两种路径,要么像OpenAI、Google DeepMind这样完全自研,要么深度依赖第三方API。
而小米却选择了一条独特的中间路线,就是自研与合作并行,既坚持底层技术创新,又灵活整合行业资源,试图在AI时代复刻硬件领域的性价比+生态协同模式。
4月底,小米开源首个推理专用大模型Xiaomi MiMo,仅7B参数却在数学推理(AIME 24-25)和代码生成(LiveCodeBench v5)任务中超越OpenAI的o1-mini和阿里Qwen-32B。
小米虽然计划建设万卡GPU集群,但相比华为、阿里的规模仍有显著差距,好在小米在算力、数据、人才均不占优的情况下,却有自己的破局策略。
不同于市面上的通用大模型,小米将资源集中于智能终端、汽车、IoT设备等核心业务。
比如Q-frame技术(动态视频帧选择)应用于汽车哨兵模式,精准识别危险行为,Any-SSR框架解决大模型“灾难性遗忘”,已用于新零售AI客服,支持商品知识动态更新等。
小米还具备极致的效率导向,MiMo从立项到开源仅用6个月,远快于行业平均周期,依赖25T tokens训练数据的高效利用,通过合成数据和渐进式训练降低算力需求,避免参数军备竞赛。
相信随着雷军和黄仁勋进一步接触,小米在GPU这块也能够获取一些资源。
按照小米的计划,2025-2026年将完成万卡集群建设,端侧模型覆盖80%小米设备;2027-2028年实现L4级自动驾驶,开放AI能力给开发者;2030年将构建“端-边-云”一体化架构,对标苹果AI生态。
在巨头林立的AI战场中,小米选择了自研与合作并行这条路,不做最强大的模型,而是做最适配业务的大模型。相信在这条路上,小米依旧能够走出自己的赛道!