科大讯飞宣布其基于全国产算力训练的深度推理大模型——讯飞星火X1升级版正式上线。此次升级是一次全面的跃升,不仅在综合能力上对标OpenAI的o3等国内外一流大模型最新版本效果保持领先,还在幻觉治理、多语言能力、语音同传等多个方面取得了显著进步,为用户提供了一个更智能、更可靠、更高效的AI助手。
讯飞星火X1升级版在翻译、推理、文本生成、数学等方面的能力大幅提升,特别是在幻觉治理方面取得了显著进步。幻觉问题是大模型落地应用的关键难题之一,而星火X1在事实性幻觉治理和忠实性幻觉治理两方面均取得了明显进步,显著提高了大模型行业落地应用的可靠性。此外,星火X1的多语言能力也得到了极大拓展,现已覆盖130多种语种,为用户提供无障碍跨语言交流的能力。
基于星火X1底座的语音同传大模型在翻译效果、实时响应、语音听感、专业精深等方面实现了大幅跃升。新版本的翻译综合质量得分超过90分,中英同传的首字响应时间从首发版本的5秒缩短到最快2秒,达到了人类高阶同传的行业标准。此外,该模型还具备语种免切换能力,能够自动识别中英文混合发言并实时切换翻译方向,有效避免了因语言切换操作而造成的交流中断。
在核心技术方面,星火X1的升级得益于三大技术突破:强化学习技术、数据反写技术和幻觉治理技术。这些技术的改进有效降低了数学答题等任务的训练难度,解决了奖励稀疏痛点,同时缓解了SFT高质量数据获取困难的问题,并在大模型思考过程及回复生成阶段实现了与标准答案的深度强对齐,大幅减少了幻觉率。
讯飞星火X1升级版的发布,不仅提升了模型的综合能力,还为教育、医疗、企业应用、代码、科研等行业大模型和智能体带来了新的进步。在教育领域,星火X1助力个性化教与学全场景,显著提升了作业批改、个性化推荐、答疑辅学等各项能力。在医疗领域,星火X1在全科辅助诊断、体检报告解读、健康咨询等方面持续保持业界领先。在企业应用方面,星火X1通过多模态知识零采编系统和星火行业大师产品,显著提升了企业知识应用和行业深度分析的能力。
此外,讯飞星火X1升级版还为个人用户带来了更好的体验。讯飞星火(APP及PC版)已上线全新的星火X1推理模型,优化了文本创作、数学解题、视频制作等核心功能。同时,讯飞星火X1API也已同步上线讯飞开放平台,为开发者提供了全球一流的大模型服务。
讯飞星火X1PC版体验地址
https://xinghuo.xfyun.cn/desk
讯飞星火X1API体验地址
https://xinghuo.xfyun.cn/sparkapi