技术可以复制,颠覆太难模仿。 想重走DeepSeek之路,一切没那么简单
日前,北京月之暗面科技有限公司发布的开源大模型Kimi-K2,上线一周后便接棒DeepSeek,登顶国际权威大模型排行榜LMArena全球开源模型榜单,并在开闭源总榜上排名第五。2024年,月之暗面因推出了…
对此,杜羽伦反思认为Kimi1.5的反响不如deeps-R1热烈,一部分原因是Kimi方面没有进行开源,另外参数规模比较小,技术上也没有强调计算效率,“接下来我们并没有‘一拍脑袋’把强化学习干到底,反而更加注…
在基准测试中,Qwen3-Coder在编程和智能体任务上拥有不错的性能,于Agentic Coding(智能体编程)、AgenticBrowser-Use(智能体浏览器使用)和Agentic Tool-U…
Kimi K2 不仅抢了开源第一,还抢了自家论文署名:我“夸”我自己
7月21日消息,阿里通义千问更新了旗舰版Qwen3模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-…
K2很香,Perplexity都说好。
她说“我们的模型叫Kimi,但公司名叫Moonshot——灵感来自PinkFloyd的专辑《月之暗面》。 与过往靠投放来放大产品上的声量相比,回归到一个预训练模型竞技场里,硬碰硬和最主流模型竞争,然后把自己的…
06/10 22:33
06/10 22:02
06/10 21:30
06/10 19:33
06/10 17:02
06/10 17:01
06/09 17:34
06/09 17:33