编辑部 发自 凹非寺
量子位 | 公众号 QbitAI
2025 年,大模型迎来应用爆发的一年。在越来越多的垂直行业中,AI 落地的经典实践案例开始涌现出来。
教育领域中,专注于职业教育培训的粉笔,就是其中之一。
就在第三届AIGC产业峰会现场,粉笔CTO陈建华坦言:
这种可能性正在粉笔的亲身实践中。并且它逐渐成为可以量化观察的实例。
为了完整地呈现陈建华的思考,且不改变原意,量子位对演讲内容进行了编辑和整理,期望能给你带来更多的启发。
中国 AIGC 产业峰会由量子位主办,是 AI 领域的前沿峰会。有 20 余位产业代表参与会议并进行讨论。线下参会的观众超过千人,线上直播的观众达到 320 万以上,累计曝光量为 2000 万以上。
话题要点
以下为陈建华演讲全文:
学习的本质
大家下午好。很高兴来到量子位 AIGC 产业大会。我要在这里分享我们在 AI 赋能教育领域的探索和实践经验。或许在座的有些朋友对粉笔不太了解,那我先简单地做个介绍。
粉笔于 2015 年成立。它是一家互联网教育公司,专注于职业考试培训。其核心业务主要涵盖公务员、事业单位、教师、考编、考证类培训。通过持续进行产品创新和技术探索,构建了“教、学、练、测、评”一体化的学习闭环。并且推出了题库、模考、课程、直播、社区、招考等多个深受用户欢迎的功能模块。
在 AI 嵌入落地之前,我们想要简单地谈一谈我们对于教育本质的理解。
我们把整个学习的过程分成了四个阶段:
第一个阶段为感知阶段。此阶段实际上是对概念进行死记硬背,在这个阶段会对知识形成初步的理解。
第二个阶段是理解阶段。此时开始切实地去理解知识以及概念的本质和其内在的逻辑,并非仅仅停留在表面记忆上。
第三个阶段是实践阶段。在这个阶段,要利用已经理解的知识去解决实际的问题。并且,通过不断地进行实践,能够加深对知识的理解。
首先是创造阶段。在这个阶段,随着持续的实践以及不断加深的理解,我们会逐渐构建起属于自己的知识体系。也就是在这个时候,知识才能够转变为自己真正拥有的知识。
从阶段划分来看,学习是一个不断进行从输入到输出的过程,并且会不断重构输入,它不是一下子就能完成的。
因此,大模型落地教育,我们认为有4个特点。
第一是聚焦学会,而不是只关注答案正确。
教育领域中,无论是听课还是做题,都仅仅是一个过程。其目标是学会,之后能够在其他地方更出色地做题或者解决问题。
第二点是学习的主动性面临着巨大的挑战。大家都明白学习是很违背人性的,需要战胜自身的惰性以及心理上的障碍,而激发学习的主动性是一项极具挑战性的工作。
第三,所有的培训教育都有与之对应的一套教研体系。这套体系能够保证培训内容具备科学性、系统性以及有效性。
教育是非常严肃的场景,这一点最后需要额外强调,并且对准确率要求非常高。
教育领域里面有一个“不可能三角”:大规模、高质量、个性化。
三者较难同时具备。例如,大班课做到了规模大且质量高,不过却以牺牲个性化为代价;一对一满足了个性化与高质量,然而却难以达成大规模的应用。
大模型的出现打破了这个不可能的三角,使其变成了可能。
大模型教育应用的三个阶段
粉笔探索大模型在教育领域的应用分成了三个阶段。
2023 年是第一个阶段,主要聚焦于三个关键词,分别是内部、有限制以及小场景。
我们最初开始尝试解题,那时模型的能力较为有限,所以正确率比较低。我们尝试用大模型来进行解析,进而发现解析可能与我们的教研体系不太相符。然而,在有些偏主观类的场景中,当给出点评框架之后,大模型的效果依然是非常好的。
这个阶段我们意识到,大模型若要在教育场景中落地,其推理能力需不断提升,而结构化引导是极为重要的。
2024 年 7 月份,我们正式推出了粉笔 AI 老师。这一举措标志着我们从单点场景开始,逐渐走向了系统化多场景的融合。
粉笔 AI 老师主要将注意力集中在答疑以及辅导的场景当中。它能够支持十大种较为核心的场景,同时还可以支持上百种较为细分的场景。
AI 老师的主要实现方案包含 RAG 和垂域模型。当用户提问后,首先会对提问进行识别。接着,利用 RAG 系统去获取与该提问场景相对应的数据。然后,借助垂域模型生成与之对应的回答。
教育是严肃场景,对准确率要求较高。所以在大模型落地时,我们要尽量降低幻觉的出现。凭借我们积累的高质量知识库数据以及对场景和需求的洞察,利用 RAG 系统能够极大地降低幻觉。
另外,业界对垂域模型存在较大争议。在我们看来,垂域模型的开发是很有必要的。职业教育的考试有其自身一套全面结构化且具有特色的考察体系。凭借我们独有的高质量数据,以及教员在教学方法和教学经验方面的积累,还有我们对用户学习行为的洞察,开发垂域模型能够让我们用更小的模型、更低的成本,达成更好的效果。
我们的垂域模型在题目答疑的核心场景里,其评分比通用模型经过优化之后要高 0.2 分以上。尤其是在言语科目上,它表现得更好;在判断推理科目上,它表现得更好;在常识科目上,它表现得也更好。
在我们对AI老师的探索中,也有一些收获:
第一,提问的门槛实际上是比较高的。AI 老师具备了极为出色的辅导和答疑能力,然而我们察觉到,在实际使用的过程中,用户主动提问的比例与预期相比要低很多。
很多用户不知道如何进行提问,他们甚至都没有提问的意识。因此,提问本身是一种需要被引导和训练的能力。
第二,在学习场景中,LUI(语言交互界面)的对话形式或许不是极为高效的交互模式。对于大多数用户而言,图形界面与对话相结合的混合交互方式才是更为适宜的。主动学习需要和被动学习进行深入的结合。
第三是学习方式呈现出高度的多样化。用户的学习行为缺乏标准性,个体差异极为显著。在学习时长、学习路径以及学习习惯等方面,都存在着非常大的差别。
在经历了前两个阶段的积累之后,粉笔于 2025 年正式推出了 AI 系统班。它基于大模型、数字人以及 TTS 等语音技术,推出了在 AI 时代全新的产品,该产品与传统的系统班有所区别。AI 系统班是一个系统性的课程,整个学习流程由 AI 老师来驱动。
我们为AI系统班定义了四个特性:
一是个性化的学习方案。我们能依据对用户当前水平的精准评估,为每一位学员单独定制学习方案,并且会随着用户在学习过程中的表现以及反馈持续进行动态优化,从而达成真正意义上的因材施教。
第二是学习过程更具人文气息。我们不但提供学习任务,还为每一个学习步骤给予清晰的解释与引导,帮助学生理解为何这样学以及下一步该如何学。这种设计使整个学习过程更有温度,让学员更具方向感。
第三是启发式答疑。在答疑过程中,系统通过启发式的方式来引导学员进行思考,不会直接给出答案,这样能促使学员主动去构建自己的知识体系,从而提升理解的深度。并且,基于对答题过程中表达方式以及错误模式的综合分析,AI 可以智能地识别出用户的薄弱点,进而实现更具针对性的学习支持。
第四点,传统排课制教学模式与 AI 系统班不同,AI 系统班的灵活性和主动性更强。在大模型的支持下,学员能够依据自身的时间安排进行自由学习,不会被固定的时间表所束缚,能够切实做到以学生为中心的自驱式学习。
为了达成个性化学习体验这一目标,我们引入了记忆系统,使得大模型既具备聪慧的特质,又拥有记忆的能力。此中主要包含三个关键的组成部分:
用户行为记录和画像构成第一部分。通过对用户做题、听课等各种行为进行记录,并且对行为习惯和兴趣偏好等多维数据进行建模,从而构建出动态更新的用户画像,这为个性化推荐和内容生成提供了一个基础。
第二部分是短期记忆,它会依据用户与 AI 老师的短期交互来响应用户的提问。
第三部分为长期记忆。在用户与 AI 老师长期交互期间,会不断抽取学员的核心信息并放入记忆仓,以此帮助系统对用户的学习风格和能力演进形成深度理解,进而制定中长期的学习策略和目标进行引导。
我们始终坚信,Context 的数量决定了个性化的程度。上下文信息是个性化的基础。只有在充分理解用户当前的状态、历史轨迹以及学习目标的前提下,大模型才能够为每一个学员生成适合其需求的内容和路径,从而实现因人而异的智慧学习。
此前我们进行了探索,展望未来,在大模型赋能教育领域的实践方面,主要将注意力集中在以下两个关键方向上:一是……;二是……。
第一个方向是多维度的个性化升级。
当前个性化主要聚焦于知识水平和学习行为。我们坚信个性化的空间不局限于此。未来,我们将探索更多的个性化维度,如学习风格、认知偏好、情绪状态、学习动机等,以使每个学员都能获得更契合自身特质的学习体验。
第二个方向是三维一体的AI老师形态。
我们正在探索构建一种更立体且更具沉浸感的 AI 老师形态。这种形态融合了文字交互、语音沟通以及白板演示这三种能力。通过融合,形成了可对话、可聆听、可演示的三位一体的 AI 老师形态。
这种交互方式具有多模态的特点,它能够提升教学的实时性与响应效率,和人类真实的教学场景较为贴近,还能更好地满足不同用户在不同场景下的学习需求,使得理解更加自然,学习也会更加高效。
持续深化个性化,构建更具沉浸感与互动性的 AI 教师形态。我们希望推动教育向智能化迈进,迈向智慧化。真正实现以人为本的未来学习方式。谢谢大家。
— 完 —