当前位置: 首页 » 资讯 » 新科技 » 正文

日本最强大模型,把日本网友搞破防了

IP属地 中国·北京 编辑:陈丽 观察者网 时间:2026-03-18 22:42:38

中国一开源,日本就自研。

3月17日,日本互联网巨头乐天集团正式发布了Rakuten AI 3.0,号称日本国内最大规模的高性能AI模型,乐天介绍其有约7000亿参数,作为一款日语特化模型在多项日语基准超越GPT-4o,还拿了日本经产省和NEDO的GENIAC项目补助。

然后发布当天,这款日本最强大模型就“翻车”了。

有日本网友测试发现,在钓鱼岛事件上,该模型在阐述日本立场时,也明确表示了中国大陆和中国台湾对钓鱼岛的主权主张,而在抗日战争的定性上,该模型则直接列举了包括731部队等日军行径,并称东京审判已经定性了日本负有战争罪行。

这些回答引发了部分日本网友的质疑,认为该模型可能由中国开发。后来更是有日本网友查看了该模型的配置文件后发现,日本国内最大规模的高性能AI模型,是DeepSeek V3。

而更为离谱的是,乐天一开始就没有放入DeepSeek的MIT许可证文件,被指出之后,才默默以NOTICE为文件名补了上去,提交说明写的是Add the permission notice,里面的版权声明:Copyright (c) 2023 DeepSeek。

截至目前,乐天集团没有任何公开回应。

“最强日本国产大模型”

根据乐天的官方新闻稿,Rakuten AI 3.0是基于开源社区最优秀的模型,结合乐天独自的高品质双语数据、技术力和研究成果开发的,对Deepseek只字未提。

乐天还特别强调,这个模型是GENIAC第三期的成果,学习费用部分由GENIAC提供的计算资源补助支持。

GENIAC是经济产业省与新能源产业技术综合开发机构(NEDO)主导的项目,为日本的AI开发企业提供GPU利用方面的助力。说白了就是国家出钱、企业出力,目标是建立日本的自主AI能力。

值得注意的是,扒开该模型底裤没有任何门槛。

该模型权重上传到Hugging Face之后,任何人点进去,切到Files and versions标签页,打开config.json就能看到。用户发现模型的config.json文件中包含model_type: deepseek_v3这样的条目。architectures写着DeepseekV3ForCausalLM,不是参考,不是借鉴,是直接声明了模型类别。

而继续看模型信息就可以发现,hidden_size是7168,intermediate_size是18432,num_hidden_layers是61,n_routed_experts是256,vocab_size是129280。和DeepSeek V3的原版配置一模一样。

所以楽天号称参数量约7000亿,因为DeepSeek V3的参数量就是6710亿。四舍五入约等于7000亿,这个约字用得精髓。

有日本网友无奈的表示:DeepSeek现在都更新到V3.2了,乐天拿个旧版出来包装,套壳都不挑个新的。

翻车不是因为抄

DeepSeek V3是开源模型,许可证允许商业使用和二次开发,在开源模型基础上做微调是行业通行做法,乐天为何会翻车?

严格来说,乐天在法律上确实没有违规。但这件事被冲,不是因为用了开源模型,而是因为几件事叠在一起。

第一,乐天在所有对外宣传中刻意回避了DeepSeek的名字。之前乐天发布RakutenAI-7B的时候,老老实实写了基于Mistral-7B开发。这次突然改成基于开源社区最优秀的模型这种含糊说法,明显是故意的。

日本AI研究者うみゆき在X上吐槽:上次老实交代了,这次怎么就故意写得含含糊糊了?

第二,许可证这个操作太难看了。你用了别人的开源成果,连许可证都没放进去,被发现了才补回来。这已经不是透明度的问题了,是态度问题。

第三,也是最致命的——这个项目花的是日本纳税人的钱。GENIAC项目的初衷是扶持日本自主AI能力,结果楽天拿到补助之后,下载了中国的开源模型,做了一层日语微调,然后号称日本国内最大规模的高性能AI模型。

有日本博主表示:真正可耻的不是用了别人的模型,而是把这件事说得含含糊糊。如果楽天一开始就说日本目前还没有从零构建基础模型的条件,所以我们基于DeepSeek做日语优化,这不但不会炎上(指引发大量负面新闻),反而会被视为务实的开发策略。

可惜乐天选择了装。

这个事情放在日本社会的语境下,刺痛感会被放大好几倍。

2025年1月底,DeepSeek在全球爆火。中国AI企业DeepSeek低成本发布了高性能的生成AI模型,其iPhone应用在免费应用排行榜上压过ChatGPT登顶第一,引发了美国股市科技股暴跌的DeepSeek冲击。最具冲击力的是AI芯片巨头英伟达股价单日暴跌17%,一天之内市值蒸发近6000亿美元(约合91万亿日元),相当于两个丰田汽车的市值,刷新了单一股票单日市值跌幅的历史纪录。

日本媒体给DeepSeek起了个名字,叫AI界的黑船来航。

1853年,美国海军东印度舰队司令长官佩里率领包括两艘蒸汽船在内的四艘军舰来到日本,舰队停泊在江户湾入口的浦贺冲,这就是黑船来航。旗舰萨斯奎哈纳号(USS Susquehanna)排水量约2450吨,而当时日本最大的和船不过200吨左右,完全不是一个量级。

喷吐黑烟的蒸汽船的威容,对从未见过这种东西的人来说就是赤裸裸的威胁。据传佐久间象山和吉田松阴站在浦贺用望远镜眺望黑船,两人看到那压倒性的军事力量之后痛感:以日本现在的实力,完全没有任何胜算。

黒船来航被视为日本近代的开端。它终结了持续约250年的江户幕府统治,从那以后,各藩的藩士和藩主掀起了攘夷论的狂潮,最终导致了倒幕。

所以在日语里,黑船早已不只是指佩里的那几艘军舰了。它变成了一个固定的文化符号,专门用来形容外来力量对日本造成的不可抗拒的巨大冲击——你挡不住、躲不掉、也无法假装它不存在。当日本媒体把DeepSeek称为AI界的黑船的时候,潜台词是:这东西的冲击力等级,和172年前那几艘炮舰是一样的。

日本政府的反应也确实像被黑船吓到了一样快。

2025年2月6日,日本政府向各省厅发出呼吁,要求各政府机关在使用DeepSeek等生成式AI进行业务时,必须充分认识风险,并向内阁网络安全中心(NISC)和数字厅寻求建议。日本个人信息保护委员会特别指出:DeepSeek获取的包含个人信息的数据被保存在中国境内的服务器上,适用中华人民共和国的法令。

企业层面动作更直接。丰田汽车、三菱重工业、软银等日本大型企业已全面禁止员工在公司内部使用DeepSeek。丰田明确表示出于信息安全的考虑,禁止使用;三菱重工即便员工提交申请也不会获批;软银则限制了公司内部访问,禁止在业务设备上下载和使用。不只是这三家,有大型素材厂商表示与业务中使用的微软生成AI不同,判断风险较高;有大型住宅厂商称考虑到信息泄露和数据被用于AI学习的风险而决定禁用。很多企业的做法是只允许使用美国企业等特定服务,其他AI一律禁止。

不只是日本。意大利因涉嫌违反GDPR启动调查并要求删除应用;台湾以国家安全为由全面禁止政府机关使用;美国的国防部、NASA、海军均已屏蔽访问,众议院向全体议员发出了使用限制通知;澳大利亚和韩国也采取了类似措施。

从政府到企业,从日本到全球,DeepSeek在相当一部分国家和机构眼里,就是一个碰都不能碰的东西。

结果现在,日本企业拿着国家补助,用的就是这个碰都不能碰的东西,换了个名字,告诉你这是日本国产最强AI。

有日本网友在X平台发帖自嘲:算了别生气了,日本AI已经周回遅れ(落后一圈),现在唯一的路就是把海外开源模型进口过来追加训练,然后ハイ国産です~(哈,国产的哟~),搞産地偽造国籍ロンダリング(产地伪造+国籍洗白)。

还有人去乐天的AI聊天官网实际测试,发现代码能力太好了,而且居然支持图像输入——但DeepSeek V3本身不支持图像,Rakuten AI 3.0也没有加图像编码器。这位博主的结论是:乐天AI官网上跑的大概率根本不是自家的Rakuten AI 3.0,而是Claude或GPT系列。自己发布的日本最强AI,自己的官网都不用。

回过头来看,黑船来航之后,佐久间象山提出了以夷之术制夷——引进西方的技术来增强国力,以此对抗西方。

172年后的2025年,乐天确实引进了中国的技术,但没有用来增强国力,而是用来增强PPT。

标签: 模型 ai 日本 钓鱼岛 日本政府 美国股市 微软 象山 731部队 东京审判

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。