技术报告中,研究人员提到K2 Think背后有六大技术创新协同,研究人员通过监督微调扩展基础模型的思维链能力,然后通过可验证奖励强化学习(RLVR)增强推理性能、利用推理时间技术增强模型,最后在部署K2-T…
Kimi K2宣布更新:上下文长度扩展至256K,带来更快的API
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
在 InfoQ 举办的 QCon 全球软件开发大会上,月之暗面系统工程师黄维啸分享了“Kimi 稳定高效的 LLM 基础设施构建之道”,他介绍了月之暗面在训推混部集群中的实践经验,重点探讨如何快速定位并隔离…
【环球网科技综合报道】8月20日消息,据美国CNBC(美国消费者新闻与商业频道)报道,OpenAI创始人山姆·奥尔特曼日前接受采访时表示,美国低估了中国下一代人工智能的威胁,单靠芯片管制不是一个有效的解决方案…
据QuestMobile数据显示,Kimi 7月MAU已滑落至1408万,国内排名第九,距离2024年12月高点蒸发近三分之一。 算力上,美国高端GPU禁售后,国产替代性能折损30%—50%;Kimi需外采…
技术可以复制,颠覆太难模仿。 想重走DeepSeek之路,一切没那么简单
日前,北京月之暗面科技有限公司发布的开源大模型Kimi-K2,上线一周后便接棒DeepSeek,登顶国际权威大模型排行榜LMArena全球开源模型榜单,并在开闭源总榜上排名第五。2024年,月之暗面因推出了…
围绕Deep Research,四小强集体开大。
对此,杜羽伦反思认为Kimi1.5的反响不如deeps-R1热烈,一部分原因是Kimi方面没有进行开源,另外参数规模比较小,技术上也没有强调计算效率,“接下来我们并没有‘一拍脑袋’把强化学习干到底,反而更加注…
08/20 10:25
08/20 10:24
08/20 10:23
08/20 10:22