当前位置: 首页 » 资讯 » 新科技 » 正文

Meta 发布 Llama 3.1 大语言模型:128K 上下文、全新 405B 版

IP属地 北京 编辑:孙明 IT之家 时间:2024-07-24 08:17:59

7 月 23 日消息,meta 今晚正式发布Llama 3.1开源大语言模型,提供 8B、70B 及405B 参数版本。

据介绍,Llama 3.1 系列改进了推理能力及多语言支持,上下文长度提升至 128K,首次推出 405B 参数的旗舰模型。

meta 称 4050 亿参数的Llama 3.1-405B 在常识、可引导性、数学、工具使用和多语言翻译等一系列任务中,可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。

此外,8B 与 70B 参数的 Llama 3.1 模型与其他参数量相似的闭源和开源模型相比,也同样具有竞争力。

注:Llama 3.1 现已于 meta 官网和 Hugging Face 开放下载,包括 AWS、英伟达、戴尔、Azure 和 Google Cloud 在内的超过 25 个合作伙伴也已经准备就绪。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新