PG新闻
News
记者从位于天津港保税区的科大讯飞获悉,4月20日,科大讯飞深度推理大模型讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。
据了解,星火X1除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力。在重点行业如教育、医疗、司法等进一步扩大了领先优势。
升级后的星火X1在多个任务上效果继续突破,展现出优异的性能。根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。
此外,其长思维链能力支持图像输入,可以对输入的图像进行关联思考,对于图像中的多种复杂元素,探究可能的含义和目的,进行更深层次的信息整合和推理。
本次星火X1升级不仅提升了通用能力,也同步增强了面向行业的解决方案能力,助力产PG电子业智能化转型。由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力。在重点行业,如教育、医疗、司法等进一步扩大了领先优势。以司法行业为例,对于行业专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。
此次全面升级,不仅展示了中国人工智能技术在国产算力平台上的创新突破,也为各行各业数字化转型提供了新的可能,其背后是一系列独特的技术创新与理念突破。
首先,提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。
其次,统一模型下的快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用。
此外,实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。
“坚定自主可控算法创新和系统工程创新,使得基于国产算力的星火大模型能够快速迭代进步,在实际应用场景取得显著效能优势,在当前国际形势下也更具战略韧性。”相关负责人表示,作为基于国产算力训练的大模型代表作,其表现证明,在技术自主可控的道路上,中国AI已具备与国际顶尖模型同台竞技的实力。(记者 岳珊)