M1支持目前业内最高的100万上下文的输入,是DeepSeek R1的8倍。
MiniMax深夜开源!首个推理模型,4560亿参数、百万上下文、价格低至0.8元
炸裂!Claude以第一作者写论文反驳苹果“推理模型根本没有推理能力”:苹果有三大错误
欧洲有了自己的推理模型,即 Mistral 的 Magistral,分为两个版本:中型和24B,不过这个模型性能远远不及DeepSeekR1-0528,他们用的对比模型还是DeepSeek R1,Magis…
在几周前,Mistral 还发布了多个专注于编程的模型,并推出了 Le ChatEnterprise,这是一款面向企业的聊天服务,提供人工智能代理构建器等工具,并将 Mistral 的模型与 Gmail 和…
6月10日,法国科技公司Mistral AI表示,该公司推出首个AI推理模型Magistral,将以开放版和企业版两种形式发布。Mistral AI称,该模型通过逻辑推理生成响应,同时融合跨专业领域的专业知识…
6 月 11 日消息,OpenAI 正以迅猛的节奏不断更新新一代生成式 AI 模型。继 4 月在 ChatGPT 平台上线 o3 和o4-mini 后,OpenAI 的最强模型 o3-pro 已于…
微软支持的法国人工智能公司Mistral AI首席执行官Arthur Mensch表示,公司将推出其首个推理模型Magistral。Mensch表示,该模型在数学和编程方面表现出色,其与竞争对手的不同之处在于…
6月9日消息,阿里巴巴在4月29日开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能则在各项测评中创下国产模型新高。 数据显示,阿里通义千问3大…
苹果近期发布了一篇研究论文,指出当前主流的推理模型其实并不具备真正的思考能力。 此外,虽然论文揭示了当前模型在推理能力上的局限性,但也有人认为其意图并非单纯否定现有成果,而是希望引起业界对更有效推理机制与评…
5 月 14 日消息,非营利 AI 研究机构 Epoch AI 最新发布报告,指出 AI企业难以从推理模型中,持续榨取巨大性能收益,最快在一年内,推理模型的进步将放缓。 而这些推理模型通过增加计算…
Phi-4-reasoning 是一款拥有 140 亿参数的开源推理模型,通过监督微调(SupervisedFine-Tuning,SFT)Phi-4,结合 OpenAI o3-mini 的高质量推理演示…
而这些推理模型通过增加计算资源来解决问题,从而提升性能,不过作为代价,这些推理模型需要更多计算来处理复杂任务,因此比传统模型耗时更长。 IT之家注:推理模型的训练过程先是基于海量数据训练一个常规模型,然后应…
科大讯飞2025年第一季度经营活动产生的现金流量净额较上年同期增长48.54%,公司经营基本面保持健康发展态势。 截至2025年3月31日,中移动持有讯飞10.03%股权,刘庆峰持股为5.55%,中科大资产…
今年2月份,由部分OpenAI前员工创办的Anthropic在全球范围内率先发布了名为Claude 3.7Sonnet的混合推理模型,被视为融合了DeepSeek V3(适于通用任务)与R1(适于推理任务…
4 月 3 日消息,科技媒体 Windows Latest 昨日(4 月 2 日)发布博文,报道称 Windows10、Windows 11 新版 Copilot 应用已摘掉 Beta 帽子,已向…
理想汽车基于海量车载场景数据,以及通用推理模型深度思考训练数据,量身打造了自主决策推理模型,在保证模型效果的同时还大幅提升响应速度。基于大量用户需求,理想汽车优化了跨屏点播功能,优化了视频应用的语音交互体验。…
在数学问题、生活常识、编程代码、艺术创作等场景,该模型可以看懂图片和视频里的内容,还能结合这些信息进行分析、推理,并给出解决方案。 其次是数学推理,这道难题需要模型从图片中找问题和答案,QVQ-Max通过分…
【快讯】3月28日,阿里巴巴宣布推出新一代视觉推理模型QVQ-Max,该模型在图像和视频内容理解、分析及推理方面展现出卓越能力。 据官方介绍,QVQ-Max具备强大的图片解析能力,能够迅速识别复杂图…
据官方介绍,QVQ-Max 不仅能够理解图片和视频内容,还能为上述信息提供分析并推理。 QVQ-Max 对图片的解析能力非常强,无论是复杂的图表还是日常生活中随手拍的照片,它都能快速识别出关键元素。在一道几…
3月28日,阿里通义千问团队宣布推出视觉推理模型QVQ-Max。据介绍,新模型针对传统AI在视觉信息处理上的不足进行了优化,增强了从视觉感知到认知推理的能力。 QVQ-Max支持图像、视频与文本的联合推理,…
此外,Mureka不仅是全球首批开放API服务的AI音乐生成平台,还同步开放基于MurekaV6的模型微调服务,成为全球首个开放模型微调功能的AI音乐生成平台。 近期,昆仑万维董事长兼CEO方汉详细阐述了M…
这一改变使得用户能够更清晰地看到和理解星火X1内部的思考过程,从而增强了模型的可解释性和透明度。依托讯飞医疗多年来积累的亿级权威精品医学知识库和亿级高质量脱敏诊疗数据,医疗大模型X1在医疗专业知识增强、医生的…
和推理能力强相关的科学和数学能力,在 GPQA、AIME 2025 等主流基础测试中,Gemini 2.5 Pro也是遥遥领先,具体成绩如下: 这回 Gemini 2.5 Pro 的思考时间长了一点,但是…
Gemini 2.5传承了该系列模型的核心优势——原生多模态支持与超长上下文窗口。目前发布的2.5 Pro版本已具备100万token的上下文窗口(即将升级至200万),这使得它在处理复杂任务时能够更加游刃…
Gemini 2.5 Pro 作为一个全新的思考型模型,大幅提升了逻辑推理、编码生成、复杂任务处理能力,目前支持 100 万tokens上下文识别,未来还将扩展至 200 万tokens,这让他在生成报告…
混元T1通过大规模强化学习技术,结合数学、逻辑推理、科学知识以及代码优化等专项训练,显著提升了其推理能力。混合Mamba架构经过专项优化,采用高效的计算方式,在确保长文本信息捕捉能力的同时,大幅降低了资源消…
3月22日,腾讯正式发布了自主研发的深度思考模型——混元T1正式版。 在常见的推理模型基础能力评估基准测试中,例如大语言模型评估增强数据集MMLU-PRO中,混元T1取得了87.2分的好成绩,排名仅次于另一…
06/10 22:33
06/10 22:02
06/10 21:30
06/10 19:33
06/10 17:02
06/10 17:01
06/09 17:34
06/09 17:33