Llama副总裁Ahmad AI-Dahle于今年4月6日在社交媒体平台X发布了一张测试图片,并配文“截至今天,Llama4 Maverick提供了一流的性能与成本比,其实验性聊天版本在LMArena上的E…
虽然LeCun本人并不直接领导Llama团队的建模与工程,但作为MetaAI的首席科学家和FAIR实验室的领导者,他在方向设定、资源分配、技术路线等方面有重要影响。 而对Scale AI的投资和事实上的掌…
比起Llama的成功,扎克伯格更热衷于Meta挑起的竞争。
Meta 近日推出了一款名为 LlamaRL 的强化学习框架,该框架采用全异步分布式架构设计,在处理 4050亿参数模型时,成功将强化学习步骤的耗时从原来的 635.8 秒减少到 59.5 秒,整体效率提…
6 月 11 日消息,科技媒体 marktechpost 昨日(6 月 10 日)发布博文,报道称 Meta 公司推出 LlamaRL框架,采用全异步分布式设计,在 405B 参数模型上,Llam…
Llama Nemotron Nano VL 基于 Llama 3.1 架构,融合了 CRadioV2-H 视觉编码器和 Llama 3.18B 指令微调语言模型,能同时处理多页文档中的视觉和文本元素,支…
5 月 27 日消息,科技媒体 Business Insider 昨日(5 月 26 日)发布博文,报道称 Meta 正面临严重的AI 人才流失危机,其开源 AI 项目 Llama 的 14 名初…
这个项目由 YouTube 用户 Rootkid 创作,其核心是将一个大型语言模型(LLM)故意放置在一个内存不足的单板计算机(SBC)中。在项目启动时,Rootkid 向 LLM 发出了这样的初始提示词:…
入选的成员每月可获得高达 6,000 美元的资金支持,最长可达六个月,以帮助其抵消构建和增强生成式 AI 解决方案的成本。2024 年,Meta的“生成式 AI”(GenAI)预算超过 9 亿美元,而今年可…
Ollama 团队成员在 Hacker News 上澄清,Ollama 使用 golang 独立开发,未直接借鉴 llama.cpp 的C++ 实现,并感谢社区反馈改进技术。 因此 Ollama 推出全新…
Ollama 团队成员在 Hacker News 上澄清,Ollama 使用 golang 独立开发,未直接借鉴 llama.cpp的 C++实现,并感谢社区反馈改进技术。Ollama 还联合 NVIDI…
5 月 9 日消息,Meta AI 公司最新推出 LlamaFirewall,应对 AI 智能体不断演变的威胁格局,为生产环境中的AI 智能体提供系统级安全保护。Meta AI 针对提示注入攻击、…
援引博文,Llama API 支持开发者测试包括 Llama 4 Scout 和 Llama 4 Maverick在内的最新模型,提供一键 API 密钥创建以及轻量级的 Type 和 Python…
4 月 30 日消息,Meta 在首届 LlamaCon 开发者大会上宣布,其“开源”人工智能模型家族 Llama 的下载量已达到12 亿次,这一数字较 2024 年 12 月初的 6.5 亿次下…
Llama 4有望在更多领域展现其潜力,推动人工智能技术的普及与应用,为未来更高效、更智能的AI系统奠定了基础。另外,微美全息借力行业开源大模型生态,在应用场景研发上,既有自研,也接入了DeepSeek、开源…
IT之家援引博文介绍,Nemotron Ultra采用仅解码器的密集Transformer结构,通过神经架构搜索(NAS)算法优化,其创新之处在于采用跳跃注意力机制,在部分层中省略注意力模块或替换为简单线性…
08/20 10:25
08/20 10:24
08/20 10:23
08/20 10:22