9月1日,美团宣布LongCat-Flash-Chat正式发布,在Github、Hugging Face 平台开源,并同步上线官网https://longcat.ai/ 。
据悉,LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数560B,激活参数18.6B-31.3B(平均 27B),实现计算效率与性能的双重优化。根据多项基准测试综合评估,作为一款非思考型基础模型,LongCat-Flash-Chat在仅激活少量参数的前提下,性能比肩当下领先的主流模型,尤其在智能体任务中具备突出优势。此外,因为面向推理效率的设计和创新,LongCat-Flash-Chat具有明显更快的推理速度,更适合于耗时较长的复杂智能体应用。(澎湃新闻记者 范佳来)