当前位置：首页 » 资讯 » 新科技 » 正文

微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型

IP属地中国·北京 编辑：苏婉清 IT之家 时间：2025-07-11 12:22:42

IT之家 7 月 11 日消息，科技媒体 NeoWin 昨日（7 月 10 日）发布博文，报道称微软推出 Phi-4-mini-flash-reasoning 小语言模型，重点提升端侧 AI 模型的数学和逻辑推理能力。
Phi-4-mini-flash-reasoning 的主要优势在于，它能够在边缘设备、移动应用和嵌入式系统等资源不足的场景下，引入先进的推理功能。

在架构方面，Phi-4-mini-flash-reasoning 创新引入了 SambaY 架构，而该架构的一大亮点，就是名为 Gated Memory Unit（GMU）的组件，它能够高效地在模型的内部之间共享信息，从而提高模型的效率。
这些改进让模型能够更快地生成答案和完成任务，即使面对非常长的输入也能应对自如，Phi 模型还能处理大量数据，理解非常长的文本或对话。

在性能方面，相比较其它 Phi 模型，Phi-4-mini-flash-reasoning 的吞吐量最高提升 10 倍，这意味着在给定的时间内，Phi-4-mini-flash-reasoning 可以完成更多的工作。
它可以在相同的时间内处理 10 倍多的请求或生成 10 倍多的文本，这对于实际应用来说是一个巨大的改进，此外，延迟也降低至其它 Phi 模型的 1/2~1/3。IT之家附上相关性能数据如下：

Phi-4-mini-flash-reasoning 新型模型已在 Azure AI Foundry、NVIDIA API Catalog 和 Hugging Face 上线。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

掏十四万请卧底进家门，你可能还得给它洗衣服？

王腾称将离开手机行业

英伟达推 Blackwell 机器人处理器 IGX Thor，AI 算力 5581 TFLOP

研究称全美近一成报纸文章有 AI 参与撰写，且通常未告知读者

美的具身智能路线图曝光，未来家庭机器人可能将会折叠衣服

国科大发明直接芳香胺脱氨转化方法，传统重氮脱氨方法迎来挑战者

全站最新

掏十四万请卧底进家门，你可能还得给它洗衣服？

王腾称将离开手机行业

英伟达推 Blackwell 机器人处理器 IGX Thor，AI 算力 5581 TFLOP

研究称全美近一成报纸文章有 AI 参与撰写，且通常未告知读者

热门推荐

掏十四万请卧底进家门，你可能还得给它洗衣服？

王腾称将离开手机行业

英伟达推 Blackwell 机器人处理器 IGX Thor，AI 算力 5581 TFLOP

清华院士师徒抢攻固态电池，下一个“宁王”？

第一批加盟传统品牌连锁的小业主，现在悄悄改回单体酒店了

被抢到断货的千元羽绒服，究竟是谁在买？

研究称全美近一成报纸文章有 AI 参与撰写，且通常未告知读者

美的具身智能路线图曝光，未来家庭机器人可能将会折叠衣服

国科大发明直接芳香胺脱氨转化方法，传统重氮脱氨方法迎来挑战者

特来电押注“网时代” 向新能源生态运营商转型

时空分辨率突破：双模态显微镜助力激光制造精准调控

马斯克畅想未来手机：只显示影音、不会内置OS或App的AI超级终端

双11品牌官方旗舰店销量涨300%，美团闪购：大促首日近800个品牌、300类商品销量翻倍

预热 2026 FIFA 足球世界杯，闪迪推出多款授权设计存储产品

绘见童年梦想：闪迪首发 Crayola 绘儿乐联名蜡笔主题 USB 闪存盘