当前位置：首页 » 资讯 » 新科技 » 正文

苹果FastVLM视觉语言模型开放试用：视频字幕生成速度可提升85倍

IP属地中国·北京 编辑：冯璃月环球网资讯 时间：2025-09-02 12:26:24

环球网
9月2日消息，据外媒9to5Mac报道，苹果此前发布了视觉语言模型FastVLM，现在用户已可以在Hugging Face平台上找到该项目。

据悉，FastVLM能够提供近乎即时的高分辨率图像处理，可将视频字幕生成速度提高 85 倍，同时体积比同类模型小 3 倍以上。
外媒称，现在在 Hugging Face 上，用户可以直接在浏览器内加载更轻量级的 FastVLM-0.5B 版本。根据9to5Mac实测，其在16GB M2 Pro MacBook Pro 上加载需要几分钟，加载完成后，模型就开始准确地描述用户的外貌、身后的房间、周围物体等。
外媒表示，因为它在浏览器本地运行，这意味着数据永远不会离开设备，甚至可以离线运行。这会在可穿戴设备和辅助技术场景展现潜力，因为轻便性和低延迟对于上述应用场景至关重要。（思瀚）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

飞书的“养虾”生意经

想买买不到：调查显示四成美国消费者支持中国汽车进入美国市场

在太空建“大数据中心”，上海落子天基计算未来产业培育路径

苹果筹备iPhone史上最大升级：首款折叠屏+20周年版齐登场

虎嗅【作·嗅之星】周榜第305～306期

算力海啸之下，鲲鹏如何为企业龙虾打造坚实底座？

全站最新

飞书的“养虾”生意经

想买买不到：调查显示四成美国消费者支持中国汽车进入美国市场

在太空建“大数据中心”，上海落子天基计算未来产业培育路径

苹果筹备iPhone史上最大升级：首款折叠屏+20周年版齐登场

热门推荐

飞书的“养虾”生意经

想买买不到：调查显示四成美国消费者支持中国汽车进入美国市场

在太空建“大数据中心”，上海落子天基计算未来产业培育路径

苹果筹备iPhone史上最大升级：首款折叠屏+20周年版齐登场

马斯克大手笔自建全球最大芯片厂，要把80%算力送上太空

虎嗅【作·嗅之星】周榜第305～306期

算力海啸之下，鲲鹏如何为企业龙虾打造坚实底座？

896线激光雷达版智界发布即交付

制造业与其养“龙虾”，不如造一把“AK47”

高盛评Meta裁员、压开支、推迟模型发布：这不是“过冬砍预算”，而是“腾笼换鸟”

涨价100元！华为发布千元机搭载“麒麟”芯片，称手机实现全面回归

“低空新规”落地，上海农用无人机迎来规范发展新阶段，如何“管住”安全又“放出”活力

南方电网：中老500千伏联网调度协议正式签订

华为官宣：鸿蒙终端设备数量破5000万！惊现千元手机！

从餐桌到机翼！国内首个SAF全流程商业化项目在蓉启动