9月12日,阿里通义发布下一代基础模型架构Qwen3-Next和基于新架构的模型Qwen3-Next-80B-A3B,包含两个版本:更擅长理解和执行指令的指令(Insctruct)模型,以及更擅长多步推理和…
基于 Qwen3-Next 的模型结构,通义团队训练了 Qwen3-Next-80B-A3B-Base 模型,该模型拥有 800亿参数(仅激活 30 亿参数),实现了与 Qwen3-32B dense 模…
微软豪掷重金自研AI芯片集群,谋求技术自主能力
阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列
在大会开幕式上,中国工程院院士、之江实验室主任、阿里云创始人王坚发表主题演讲,提出了一个重要观点:在AI时代,开源的内涵正在发生“革命性变化”——从以往“源代码的开放”逐渐转向“资源的开放”。模型权重的开放本…
王坚谈道,大模型权重的开放,本质上是数据资源和计算资源的开放,“因为有了模型开放以后,你再也不需要自己花那么多计算资源重新做有人替你做过的事情”。“到了今天,只是开放源代码,其实不解决过去在软件时代解决的问题…
腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”
从SSAE(StructuredSemanticAlignmentEvaluation)的评估结果上看,腾讯混元图像模型2.1在语义对齐上目前达到了开源模型上最优的效果,并且非常接近闭源商业模型(GPT-I…
经过两个阶段环环相扣的“课程学习”,openPangu-Embedded-7B-v1.1完成了从外部信号驱动的显式切换到内部能力驱动的隐式切换的蜕变,大幅提升了模型在复杂推理任务中的灵活性与自主性。 与此同…
技术报告中,研究人员提到K2 Think背后有六大技术创新协同,研究人员通过监督微调扩展基础模型的思维链能力,然后通过可验证奖励强化学习(RLVR)增强推理性能、利用推理时间技术增强模型,最后在部署K2-T…
从 SSAE(Structured Semantic Alignment Evaluation)的评估结果上看,腾讯混元图像模型2.1在语义对齐上目前达到了开源模型上最优的效果,并且非常接近闭源商业模型 …
公开资料显示,今年6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。 当日,百…
08/20 10:25
08/20 10:24
08/20 10:23
08/20 10:22