4 月 30 日消息,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为DeepSeek-Prover-V2-671B的新模型。 DeepSeek-Prover-V…
在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大…
4 月 30 日消息,Meta 在首届 LlamaCon 开发者大会上宣布,其“开源”人工智能模型家族 Llama 的下载量已达到12 亿次,这一数字较 2024 年 12 月初的 6.5 亿次下…
5月16日消息,据外媒报道,翻译服务提供商DeepL近日宣布对其应用程序编程接口(API)进行重要更新,新增自主研发的人工智能(AI)语言模型,并引入写作助手DeepL Write,进一步提升翻译与写作辅助能…
人工智能让师生在与嵌入生成式人工智能的各类技术的高体验性互动过程中,“无感”留下各种教育情境下不同维度的真实交互数据,后期通过跨平台的数据存储、融合与多维分析技术支持,绘制出具有多模态特性的师生综合“画像”…
在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用7B 的参数规模,超越了OpenAI 的闭源推理模型o1-mini 和阿里 Qwen 更大规模的…
4 月 30日消息,万兴科技集团股份有限公司(下称“万兴科技”)与华为云计算技术有限公司(下称“华为云”)昨日在深圳签订战略合作协议。根据协议,双方将结合万兴科技在音视频大模型、AI 应用、数字…
月 14 日消息,据《科创板日报》报道,阿里巴巴正式开源通义万相 Wan2.1-VACE,这是一款支持视频生成与编辑的模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以…
在实际测试中,GPT-4.1 比 GPT-4o 更注重效率,不再过度聊天,这让它在专业场景中更可靠。 与旧版 GPT-4o相比,GPT-4.1 带来了更全面的提升。这不仅体现在任务执行的精确性上,还包括更…
在RAG场景下,向量数据库作为大模型的“海马体”,存储了游戏中的最新信息(如玩家的实时交互数据、新添加的游戏元素等),与混元大模型搭配,突破了传统大模型在时间和空间上的限制,使得游戏中的AI应用,能够更加灵活…
同期在动脉网"2025未来医疗100强"评选中,医渡AI中台作为国内首个支持医生自建智能助手的医疗级AI引擎,荣膺"最佳数字技术创新产品"奖,凸显技术赋能医疗的实践价值。报告以医渡科技为例,再次提到了其为行业…
此外,六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和 Qwen3-0.6B,均在 Apache 2.0 许可下开源…
而这些推理模型通过增加计算资源来解决问题,从而提升性能,不过作为代价,这些推理模型需要更多计算来处理复杂任务,因此比传统模型耗时更长。 IT之家注:推理模型的训练过程先是基于海量数据训练一个常规模型,然后应…
在一个沙漠场景中,Matrix-Game 能够根据用户输入的任意控制指令(IT之家注:如键盘的 W / A / S / D 方向键、Space键用于跳跃、Attack 键用于攻击,以及鼠标用于视角移动),生…
此次发布的模型中,Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B 以参数规模直接命名,分别对应 40 亿、17 亿和 6亿参数。 Qwen3-30B-A3B-Base 为 MoE 架构基…
直播流视频理解的挑战与需求传统视频大语言模型擅长处理静态视频,但无法适应机器人技术和自动驾驶等需要实时感知的场景,在这些场景下,要求模型能快速理解直播视频流内容,并做出反应。 现有的模型面临两大难题:一是…
金山云星流训推平台部署Xiaomi MiMo系列模型及Qwen3系列模型流程: b. 选择XiaomiMiMo系列模型或Qwen3系列模型,用户可自主配置服务副本数 Qwen3是阿里巴巴通义千问团队推出的…
卓世科技的Agent智能体开发平台和生成式对话智能体(GCA)产品,作为其在智能体领域的明星产品,在医疗康养、政务、企服、文旅、出版传媒等多个行业中得到了广泛而深入的应用,并取得了显著的成效,成为了驱动各行…
近日,声网凭借在对话式 AI 领域的技术创新能力以及推动 AI 应用落地的实践经验,先后入选量子位2025中国 AIGC应用全景图谱以及数据猿2025中国 AI 大模型产业图谱。 作为全球领先的对话式 AI…
4 月 27 日消息,今日,字节跳动 Seed 正式启动 2026 届 Top Seed 大模型顶尖人才校招计划。 此前 3 月Top Seed 开放了研究型实习生招聘,今日起正式启动 2026 …
国内首个光子芯片专用大模型OptoChat AI正式发布,这一创新成果将推动我国光子芯片研发进入智能化新阶段。OptoChat AI的出现彻底改变了这一状况,实现了从"人找知识"到"知识找人"的研发模式转变。…
总结一下,通过用马斯克贴出的这道引发热议的数学算式题,测试了 7 款大模型面对这一问题的思考和解答,总体来说,讯飞星火 X1深度推理大模型和 OpenAI o3 的表现最为让人满意,无论是思考的…
4 月 27 日消息,芯驰科技本月 23 日在 2025 上海车展上发布了其新一代 AI 座舱芯片 X10。这一 SoC 采用 4nm先进制程,支持 7B 参数多模态大模型的端侧部署。 规格方面,…
4 月 26 日消息,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)昨日(4 月 25 日)在 X平台发布推文,表示升级 GPT-4o 模型,重点提升了智力和个性。OpenAI 于…
近日,全球领先的AI数据服务提供商澳鹏Appen(中国)正式发布其在法律、医疗、代码、金融、数学、音乐、多语言、TTS、文学等9大垂类领域的全链路数据服务能力,为行业提供从数据采集/标注、数据集到模型评估等一…
4 月 25 日消息,Adobe 昨日(4 月 24 日)发布博文,推出 Firefly Image Model 4 和Firefly Image Model 4 Ultra 两款文本生成图像 A…
援引博文介绍,英伟达针对这一难题,推出了 OpenMath-Nemotron-32B 和OpenMath-Nemotron-14B-Kaggle两款模型,基于 Qwen 系列 transforme…
4 月 25 日消息,在今日的百度 Create 开发者大会上,百度创始人李彦宏发布了文心大模型 4.5 Turbo,其相比文心4.5 速度更快、价格下降 80%,每百万 token 的输入价格仅…
4 月 25 日消息,科技媒体 bleepingcomputer 昨日(4 月 24日)发布博文,报道称微软通过改进其机器学习(ML)模型,已修复 Exchange Online 错误将 Adob…
4 月 24 日消息,由两名韩国研究者组建的 Nari Labs 工作室于前天在 GitHub 和 Hugging Face开源了拥有 16 亿参数的文字转语音 AI 模型 Dia,目前相应模型已…
03/31 18:21
03/31 18:02
03/31 18:00