Cohere 近日发布了其全新的语言模型 Command A Reasoning,旨在满足商业环境中对高难度推理任务的严苛需求。该模型在处理代理工作流、构建端到端系统和分析大型文档方面表现出色。
据Cohere介绍,Command A Reasoning在多项行业基准测试中表现卓越,其性能超越了其他私有模型,包括 BFCL-v3、Tau-bench 和 DeepResearch Bench。
该模型具有强大的技术能力,能够在一个 H100或 A100GPU上运行,支持高达 128,000个令牌的上下文窗口;在多GPU配置下,上下文窗口可扩展至 256,000个令牌。企业可以灵活设置令牌预算,以有效控制成本和资源使用,实现不同工作负载的并行处理,而无需切换模型。
Command A Reasoning特别擅长处理复杂的研究任务。它可以驱动一个分层多智能体系统,将复杂的请求分解为子任务,进行并行研究,并最终生成结构化的报告。在相关基准测试中,该系统在指令遵循和内容深度方面均获得了最高分。
在模型可用性方面,Command A Reasoning目前以研究版本形式提供,其权重已开放,并遵循 CC-BY-NC-4.0许可证,可供非商业用途免费使用。对于商业部署,企业需要联系Cohere销售团队。
Cohere在开发过程中高度重视模型安全性,通过内部评估框架在严格的滥用预防(涵盖儿童虐待、自残、暴力、性内容和阴谋论等)和避免对合法请求的过度拒绝之间寻求平衡。Cohere表示,相较于竞争对手,Command A Reasoning在安全性和实用性方面实现了最佳平衡。
目前,Command A Reasoning已正式上线 Cohere 平台和 Hugging Face。