当前位置：首页 » 资讯 » 新零售 » 正文

Meta 发布 Llama API，携手打造最快 AI 推理解决方案

IP属地中国·北京 编辑：沈如风 IT之家 时间：2025-05-16 19:08:59

4 月 30 日消息，在首届 LlamaCon 大会上，meta 公司在推出独立 AI 应用之外，还发布了 Llama API，目前以免费预览形式向开发者开放。
援引博文，Llama API 支持开发者测试包括 Llama 4 Scout 和 Llama 4 Maverick 在内的最新模型，提供一键 API 密钥创建以及轻量级的 Type 和 Python SDK。
开发者可通过一键创建 API 密钥，快速上手使用，同时 API 还提供轻量级的 Type 和 Python SDK。为了方便开发者从 OpenAI 平台迁移应用，Llama API 完全兼容 OpenAI SDK。
meta 还联手 Cerebras 和 Groq，进一步优化 Llama API 的性能。Cerebras 宣称，其 Llama 4 Cerebras 模型的 tokens 生成速度高达 2600 tokens / s，比 NVIDIA 等传统 GPU 解决方案快 18 倍。
根据 Artificial Analysis 基准测试数据，这一速度远超 ChatGPT 的 130 tokens / s 和 DeepSeek 的 25 tokens / s。
Cerebras CEO 兼联合创始人 Andrew Feldman 表示：“我们很自豪能让 Llama API 成为全球最快的推理 API。开发者在构建实时应用时需要极致速度，Cerebras 的加入让 AI 系统性能达到 GPU 云无法企及的高度。”
此外，Groq 提供的 Llama 4 Scout 模型速度为 460 tokens / s，虽不及 Cerebras，但仍比其他 GPU 方案快 4 倍。在 Groq 上，Llama 4 Scout 每百万 tokens 输入费用为 0.11 美元，每百万 tokens 输出费用为 0.34 美元；Llama 4 Maverick 每百万 tokens 输入费用为 0.50 美元，每百万 tokens 输出费用为 0.77 美元。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

全站最新

广汽风洞实验室跻身国家认可实验室行列

古尔曼：苹果基本已放弃了Mac Pro，M4 Ultra芯片也已被砍

微软打造自家最大量子研究机构，加码投资丹麦Lyngby设施

观察｜“好看第一位”和“安全是基础”冲突吗？雷军连发三博能否回答外界质疑？

热门推荐

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

南城香创始人汪国玉：平台消费券激发消费热情，门店收入利润均提升

通信企业：“推销热售后冷”消磨用户信任

盛银消金 25% 股权再被冻结！新董事长年初刚上任

伊利出席第八届中澳工商界首席执行官圆桌会助力中澳经贸合作提速升级

商查平台企业信息查询新范式：水滴信用企业查询MCP

从“闪购”到“观望”：Prime Day被拉长的背后，是消费者与平台的“双重博弈”

澎湃漫评｜通信企业为何“推销热售后冷”

“电商西进”助力豫企破浪：一枚鱼油的3000公里“暖心”之旅

京东外卖取消超时免单，改为“准时宝”服务