人工智能正处于迅猛发展的爆发阶段,越是处于浪潮涌动之时,越易于凝聚起剧烈的变化,生成式AI取得快速进步,还给旷日持久的科技竞赛划出了一条全新的跑道。
在产业升级与科技自主的环境下,中国人工智能迎来了阶段性检验时期。国产算力替代已筹备许久,国产大模型发展正步入良好态势,一场势不可挡的AI生态重塑正在展开。
这场重塑,突破了“卡脖子”难题,算力实现了追赶,算法进行了创新,技术取得了进步,产业应用也共同发展起来。
五军之战:中国不只有Deepseek
Deepseek突然出现,破除了AI的算法焦虑,还引起了世界的关注。
一个季度已经过去,中国AI厂商正呈现出“五军之战”的竞争态势,其中包括DeepSeek、字节豆包、阿里通义、腾讯混元、讯飞星火 。
最新的进展是,4月20日,科大讯飞推出了最新升级版的深度推理大模型,即讯飞星火X1,它有着独一无二的身位,是“目前为止,唯一基于全国产算力训练的深度推理模型”。
《南华早报》在报道里,用大写加粗的字体写下了“无需英伟达” 。
《南华早报》称,科大讯飞发布了推理模型,该模型是使用华为AI芯片训练的,且无需英伟达 。
这表明,中国AI除了在算法创新方面有所进展,还再次克服了算力方面的限制,达成了全栈自主可控的目标。
“国产算力”取得突破不是偶然的,也不能全部归结于地缘环境,其根本原因是:人工智能的竞争发生了变化,从算法与模型性能的好坏,转变成了算力、算法、应用综合能力的检验。
若把算力视作拳击手强健的肌肉,没有精妙战术与之配合,哪怕是瘦子使出一记扫堂腿,就能使拳击手败下阵来。算法是战术,它可让拳击手的每一处肌肉(即算力)都发挥出应有的攻击力量 。
目前,中国算力面临一些难点,其中包括英伟达禁售令,还有国产芯片存在技术差距,以及算力基建存在供需平衡问题。
中国AI企业的答卷各有不同,有的遵循“大力出奇迹”的路线,凭借实力与资本开拓道路,像字节豆包、阿里通义、腾讯混元等;有的以小博大,借助算法创新,从国民级C端应用入手,成效令人惊艳,例如DeepSeek;还有的破釜沉舟,运用全国产化算力、算法以及数据,达成全栈自主可控,比如讯飞星火。
最引人注目的是后两条路线。
Deepseek用算法创新,颠覆了行业惯性思维。
知名半导体研究机构SemiAnalysis指出,随着算法取得进步,大模型要实现相同功能,所需的计算量会减少,并且每年会减少四倍[2]。
科大讯飞的路线更为陡峭,通过全国产化算力取得突破,凭借算法实现创新,进而研发出全栈自主可控的全国产化大模型。
早在2023年10月24日,科大讯飞宣布,首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用 。
科大讯飞与华为合作,运用算子融合、混合并行策略等创新技术,实现了昇腾910B算力的适配与优化,大幅提升了训练效率,训练效率从相比英伟达A100的55%提升到了85%,讯飞星火大模型是在“飞星一号”平台上训练出来的。
2025年1月15日,科大讯飞发布了一个大模型,它是国内首个基于全国产算力训练的,具备深度思考和推理能力,这个大模型就是讯飞星火X1 。
10天前,讯飞研究院宣布,联合团队采用多种优化手段,提升了“飞星一号”平台上MoE模型集群推理的性能上限,实现了大规模专家并行集群推理性能翻番。之后,讯飞星火X1迎来全新升级,在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上,效果有了显著提升。在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAIo1和DeepSeek R1。这再次证明了,基于国产算力训练的全栈自主可控大模型,具备登顶业界最高水平的实力,以及持续创新的潜力。
讯飞星火X1最值得关注之处,不只是其模型本身能力与国内外先进水平相当,更在于在“自主可控”背景下,为处于地缘阴云笼罩下的产业界提供了一条破局途径。这对中国AI行业而言,是一次具有里程碑意义的技术飞跃,也是对当下自主可控迫切需求的有力回应。
科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造了中国国产超大规模智算平台“飞星二号”,“飞星二号”将于今年交付首批算力。
应用为王:找到客户需求的最大公约数
“全栈自主可控”,不仅在技术研发上,更在产业应用上。
产业应用存在难点,这一难点体现在“既要且要还要”上,不仅要求模型具备应对客户和用户不同层面需求的能力,还得考虑终端运行时的功耗限制问题,以及搭载模型的成本问题,还有响应时间等问题。
当人们开始冷静审视大模型到底能给自己的工作和生活带来怎样的效用时,模型厂商就需要跳出“参数为王、算力制霸”的视角,要通过算法创新,还要通过解决方案创新,以此为上述需求找到最大公约数。
当前业内公认两个事实,其一,好的解决方案可带来部署成本大幅下降,其二,提高推理能力能为客户提供性价比高的模型规模。这背后是工程能力与技术能力两手抓且两手都要硬。
科大讯飞借助“通专结合、端云联动与软硬一体”的方式,也就是通用大模型与专业大模型相结合、端侧大模型与云端大模型相联动、软硬件一体化,来达成部署成本与用户体验的平衡,打通商业化的通道,还提出“建算力、理数据、训模型,到落场景、保安全、精运营”的全链路方法,从场景出发,为客户提供人工智能的解决方案 。
在工具层面,科大讯飞对模型定制优化工具链做了进一步升级,它支持监督微调与强化学习这两种模型定制优化方案,还进一步简化了定制步骤,降低了定制成本。
在推理性能方面,讯飞星火X1有最新升级,它通过三大核心技术创新来保障基于国产算力的高效长稳训练,这三大核心技术创新分别是大规模多阶段强化学习训练方法,基于快慢思考的统一训练方法,工程技术系统创新。其满血版推出“快思考、慢思考统一模型”,参数量为70B大小,由一个模型同时支持两种思考模式,模型部署仅需4张卡(华为910B),整体效果就能对标OpenAI o1和DeepSeek-R1 。
讯飞星火X1融入了更多行业场景的复杂类型数据,除了常见的通用任务,其泛化性得到很大提升,在多个行业任务上也展现出业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。
目前,星火X1 API已经在讯飞开放平台同步上线,它面向广大开发者开放服务,也面向广大企业开放服务。
当人工智能的竞争焦点转向以技术能力、市场洞察、解决方案为代表的综合能力的比拼之时,“姜还是老的辣”这句俗语的含金量仍在提升。
AI应用2.0时代:科大讯飞很难被复制
在2025上海车展正在举行期间,科大讯飞对讯飞星火大模型在智能座舱领域的最新成果进行了集中展示,对其在智慧声场领域的最新成果进行了集中展示,对其在车企数智化等领域的最新成果进行了集中展示,这些成果受到了消费者的广泛关注,也受到了行业客户的广泛关注。据介绍,讯飞星火大模型已应用于奇瑞的量产车型,已应用于广汽的量产车型,已应用于长城的量产车型,已应用于长安的量产车型,已应用于大众的量产车型,已应用于江淮的量产车型,已应用于一汽的量产车型,已应用于日产的量产车型,共计16款量产车型,“大模型上车”正步入密集量产阶段。
业界有这样的看法,2024年被视作大模型应用的起始年份,今年则有可能成为大模型应用大规模兴起的年份。
中国的AI产业生态发展得很快。要是讲大模型应用1.0阶段的特征是Demo产品、具备通用功能、可充当日常助手,那么它正迈入2.0的更深层次阶段:实现规模化、体现个性化、呈现场景化。
上海车展上亮相的星火汽车智能体平台,具备深度融合智能交互能力,可助力客户迅速打造智能体应用,进而构建差异化竞争力,当前,科大讯飞已依托智能体平台搭建了赛事、影音、新闻、美食、出行等示范智能体。与此同时,讯飞能够提供丰富的开源大模型能力,还能提供知识库能力,并且提供汽车领域专属生态以及工具,这些可以支持车企进行组合定制,进而打造出个性化的座舱场景。
以市场风向标央国企领域为例,根据IDC报告,科大讯飞因算力和模型一体化优势,在2024年央国企大模型解决方案市场份额中位居第一,领先于百度、阿里。今年,央国企的大模型部署又向前迈进了一步。
中国石油去年和中国移动、华为、科大讯飞共同建立了昆仑大模型,该模型发布了涵盖43个专业应用和通用应用的创新场景。今年,昆仑大模型完成了新一轮的模型能力迭代,完成了应用场景的迭代与新增,还对外发布了“行业大家”,其面向能源化工领域,致力于打造综合性知识服务与信息检索平台。
中海油于去年十月与科大讯飞合作推出“海能”人工智能模型,科大讯飞依据行业特性,针对性地推出多个通用场景模型,这些模型针对招标采办、员工健康、辅助办公等需求。今年,专业场景模型的建设正在进行研发,其涵盖海上油田稳产增产、安全钻井、海工制造等领域。
在智慧城市领域,科大讯飞把城市智算中心的建设和大模型应用结合起来,借助“算力+数据+算法+场景+生态”五维体系,助力城市打造AI产业底座,提高城市算力中心的利用率,推动传统产业智能化升级。在湖北利川武陵山(利川)人工智能计算中心项目里,科大讯飞助力打造了全国首个县域文旅大模型,还构建起了覆盖游客的服务体系,构建起了覆盖商户的服务体系,构建起了覆盖政府的服务体系。
在科研领域,科大讯飞与中科院大连化学物理研究所合作研发“化工大模型”,该模型已具备化工知识问答能力,目前正在研发融合知识溯源能力、深度推理能力、多模态能力的新版本……
目前,科大讯飞“通用 + 专业”大模型模式已和20多家头部企业展开合作,其覆盖范围达到300多个场景 。产业化深水区是综合能力的较量,这对模型厂商的两大能力提出了要求 。其中一个能力是模型泛化能力 ,另一个能力是应用行业的专业能力 。
模型泛化能力,是指机器学习模型在未见过的数据上有良好表现的能力,也就是从训练数据中学到的规律能够有效迁移到新数据中的能力。简单来说,就是能不能用标准化的模型,以更低的部署门槛,去满足不同客户或用户的个性化需求。
如果说模型泛化能力考验的是厂商的技术硬实力,那么应用行业的专业能力考察的是厂商的商业化思维,考察的是厂商在行业的积累,考察的是厂商对技术链接人类福祉的深刻理解。
科大讯飞不是大模型时代刚入局的新手,而是中国人工智能产业最早一批的探索者 。26年来 ,它在智能语音技术领域有所发展 。之后又在认知智能领域取得进展 ,这里面包括机器翻译 、机器阅读理解 、OCR等技术 。到如今 ,科大讯飞在大模型技术方面也有成果 。总之 ,“人工智能 +”的每一步它都走得很稳健 。
技术体系或许能够追赶,然而深耕行业的专业程度,丰富的软硬件产品矩阵,完善的服务支持能力,长期积累的产业化思维与经验,却难以被继承以及复制。这是新老巨头重新拉开距离的分界点,也是科大讯飞的优势之处。
近日,科大讯飞公布了2024年年报,年报表明,公司全年达成营业收入233.43亿元,与去年相比增长了18.79%,经过两年时间再次回到双位数增长状态,同一时期归母净利润是5.6亿元。另外,科大讯飞现金流达到了历史最高水平,到2024年末时,公司全年经营性现金流净流入24.95亿元,与去年同期相比增长超过6倍。
尾声
一个事实很明显,国产大模型以DeepSeek、科大讯飞等为代表,正在迅速缩小与国际顶尖大模型的差距,推动本土生成式AI生态走向可持续循环,走向更强劲的发展轨道。
斯坦福大学以人为本人工智能研究所于4月初发布了《2025年人工智能指数报告》,该报告指出,依据MMLU和Humaneval等主要基准测试结果,中美大模型性能差距在2023年时为两位数,到了2024年已接近持平[5] 。
与此同时,对于“产品和服务采用AI技术好处大于坏处”这一问题,中国的认同比率达到83%,在中国参与调查的国家里排名第一,而大模型实力被公认为最强的美国,这个数字仅为39%[4] 。
在过去几次科技浪潮中,中国经历了漫长的追赶过程,而在生成式AI的赛道上,中国从跟跑状态发展到与其他国家持平,仅仅用了两年时间。
更值得一提的是,中国人工智能在政府、科研机构、行业、企业、开发者等多方共同努力下,正走向应用与产业生态的繁荣 。科大讯飞作为“人工智能国家队” ,在算力自主、算法创新基础上 ,不断拉长工程能力和行业专业能力的长板 。在当下风险与机会并存的大势下 ,它挺身而出 ,率先走出了自己的破局之道 。
参考资料
不需要英伟达,科大讯飞吹捧完全用华为人工智能芯片训练的推理模型,《南华早报》
DeepSeek辩论:关于成本、真实训练成本、封闭模型利润率影响的中国领导力,半分析
关于深度搜索和出口管制,达里奥·阿莫代伊
《2025年人工智能指数报告》,斯坦福人文人工智能实验室