【GET2025】即构科技:RTC+AI,AI伴学开启在线课堂新范式
创始人
2025-12-07 19:44:43

以下为演讲实录,经编辑:

大家下午好!我是来自即构科技的教育行业产品经理,我今天分享的主题是“RTC+AI,AI伴学开启在线课堂新范式”。

即构科技是一家专注于RTC和AI领域的在线教育服务商。RTC是实时互动音视频技术,我们通过实时音视频技术为客户提供音视频互动通话,教育里面主要应用于在线课堂里面的直播、1V1相关场景。

基于我们20年的技术积累,截止到今天,我们服务了超过4000家全球企业,连接了超过5亿终端的用户,覆盖200多个国家和地区。每天使用ZEGO RTC服务的用户产生的日均互动时长超过30亿分钟,基于用户体验,我们适配了3万多台终端设备,覆盖国内外各大厂商。

一、在线课堂

(一)从技术视角,看在线课堂演进的驱动逻辑

教育行业也是我们服务的重点行业之一。通过RTC和AI相关技术,我们为教育行业主要输出了包括大班课、小班课、1V1、双师课堂、超级小班等各类在线课堂的解决方案。也正是因为有这样的一些积累,所以今天在这里,我们想从技术平台的视角来分享一些对在线课堂的看法。

从技术的视角,我们认为在线课堂主要受三大核心力量的驱动。

• 市场需求:首先是市场需求,市场需求是核心的牵引,在不同的阶段提出了不同的在线课堂的需求。

• 技术发展:底层是技术,技术是作为基础引擎为我们的市场需求提供解决方案,同时技术的突破可以去推动教学理念的演进。比如早期的教学理念是以资源为中心,当移动互联网直播技术的普及,把教育资源问题解决以后,教学的理念就变成了以学生为中心,今天又希望实时互动甚至AI相关的技术能够为学生提供更好的个性化教学服务。

• 教育理念:教育理念的不断变化同时在刷新着好课堂的定义,什么样的课堂才是一个好的在线课堂?所以我们认为在线课堂就是在这样一个循环里面不断地发展。

在线课堂的发展历程我们总结为大概四个阶段。

1. 在2015年之前,在线课堂其实还是在解决教育资源的问题,主要是解决资源不均衡的问题。

2. 从2015年开始,主要是直播、实时互动、移动互联网的普及,这个时候在线课堂才是真正实现了在线教学,也就是老师可以通过线上进行教学,而远端的学生直接进入课堂之后和老师进行线上的互动学习。

3. 到2020年,在线课堂又迈入了新的阶段,进入OMO线上线下融合、智能化的教学阶段,智能硬件、AI等技术大面积应用。

4. 现在这个阶段已经不再去满足于当下的直播的这种课堂需求,而更多的是以学生为中心,想要追求个性化的教学和提升学习的主动性。

(二)实时互动在线课堂典型产品形态

从2020年开始,当下的在线课堂更多的是追求学生的个性化,我们想看一下今天市面上主流的在线课堂产品形态,它们在这个方向上做得如何。这里列举了四个主流课堂场景:

1. 大班课:大班课的主要特点是普惠教育,它可以覆盖足够大的规模,但是大班课对学生的个性化关注几乎没有。

2. 1V1:和大班课截然相反的就是1V1,1V1是一个老师对一个学生,老师能关注到学生个体的意愿和诉求,可以因材施教。1V1可以满足个性化的需求,但是需要大量的老师,老师的成本对教育机构来讲是非常高昂的。

3. 小班课:介于大班课和1V1之间的课堂形态,小班课可以兼顾一定的个性化诉求以及课堂的氛围。但是如果想要兼顾这两者对老师的能力素质要求比较高,老师需要有很好的控场能力,所以老师的成本相对也是比较高的。

4. 录播AI课:除了这三种真人老师和学生之间的形式,还有录播AI课,录播AI课是把学习的内容一次性制作进行无限分发。它的特点是可以做到规模和成本的极致,但是它也没有办法交付个性化的辅导。

所以我们可以看得到,当下在主流的教育在线课堂的产品形态里面,每一个场景都有自己的特点,但是其核心就是在成本、个性化和规模化之间找平衡点。

(二)传统AI录播课:边际成本做到极低,但无法个性化教学

刚刚的几个场景各有优势,但是没有办法解决所有的问题,所以我们就提出一个问题,能否在追求普惠教育,也就是规模化的同时提升课堂学习的互动性和个性化?

这个图表示在没有AI之前的情况下,可以看到只有录播AI课是真正可以把规模化和成本做到极致,但是它和个性化的方向相距甚远,没有办法满足个性化的需求。

稍微讲一下录播AI课,这是录播AI课的学习流程。录播AI课本质上是把完整的内容切割成多个片段,然后把这些片段和学生进行人机交互,学生可以在过程中学习内容,到了一定的时候,通过点击或者是判断,或者是一些人机相关的交互,可以进行反馈,然后在固定的流程里面会根据学生的反馈给到判断式的反馈信息。它的特点就是一次制作标准的内容可以无限分发,把规模和成本做到极致,但也是因为它是固定的流程,所以在这个过程中学生没有办法脱离这个流程,也没有办法进行个性化的教学。

二、个性化AI伴学

(一)打造在线课堂新范式

没有AI的时候我们很难解决刚刚那些问题,但是今天有了AI之后,我们探索了一些新的课堂形式。AI伴学,就是我们接下来要讲的新的课堂形式,我们认为可以同时解决我们想要的规模化、个性化、成本之间的问题。

AI伴学是什么样的课堂形态?

这是在直播课中的AI伴学形式,它的流程是,有一位真人老师在直播课中先进行在线教学,比如说今天是一节英语课,她教的是关于How often这个问题对应的词汇。当真人老师需要和学生之间进行互动,来检验学习效果的时候,类似课堂演练的环节,这个时候真人老师可以通过控制系统,让所有的学生都进入到一对一的对话弹框,在这个对话弹框里我们引入了AI的分身老师,刚刚一个弹框里面的老师其实就是真人老师的分身,通过AI老师和学生之间进行个性化的问答。在刚刚的视频里面,学生刚开始没有答出来,老师给予了一定的引导,等到学生回答以后老师给予了肯定。

这里面有效解决了三大问题:

1. 学生参与互动少。传统的直播课里面如果想要互动只能是真人老师和学生之间通过连麦,真人老师可以选择少数几个同学进行连麦,其他同学只能眼巴巴地看着那些同学和老师连麦,可能只有羡慕的份儿,但是通过这种方式可以让所有学生在同时课都可以参与这种互动,所以有效解决了学生参与互动少的问题。

2. AI老师是真正根据学生进行一对一的互动问答,并且给到他个性化的学习。

3. 在直播课中引入AI伴学这种产品形式可以即时知道学习效果。老师和学生包括家长可以在这种随堂演练中,及时知道学生的学习效果,而不至于到课后练习之后才能知道学习效果如何。这就是AI伴学课堂方案,它是真正可以提供一种规模化、个性化的互动学习形式。

(二)业务能力根本性升华

我们把传统的AI录播课和新的AI伴学做一个对比,AI伴学不仅仅是交互技术上的变化,更多的是业务能力的根本性升华。我们总结了三个大点:

1. AI伴学对比传统的AI录播课是对整个教学模式的变化。传统的AI录播课核心是输出标准性的内容,还是在卖内容,但是AI伴学其实只是和学习主题有关,但是不再拘泥于生成标准性的内容,是真正做到个性化的互动,它所售卖或者给学生提供的是服务,是服务学生的时间。

2. AI伴学和传统的AI录播课相比,我们给了学生自由控制的权利。大家不要小看这个自由控制的权利,自由控制的权利其实是对学生探索意愿和好奇心的保护。想象一下,如果我在一个传统的AI录播课中,对某一个知识点有疑问,但是如果这个时候流程没有进入到提问的环节,你就没有办法对这个课程进行提问,从而解决你的一些疑惑。但是AI伴学的这种形式里面,你可以随时随地地给你的伴学老师进行提问,伴学老师给你反馈。这一点极大保持了学生的好奇心以及他对于知识探索的欲望。在传统的AI录播课里面,如果一而再再而三,让学生想要了解知识的时候了解不到,会影响他的学习欲望。AI伴学可以让学生有持续的学习动力。

3. AI伴学可以给业务机构形成护城河。怎么理解?传统AI录播课所能够给机构带来的数据最多就是判别式的数据,比如这道题学生答得对还是错,但是AI伴学给教学机构带来的是完整的对话,里面每一个环节都是对应数据,比如我们的学生在什么时候会发起这样的提问,提的问题都有什么、分布是怎么样的,学生的回答又是怎么样的,大部分的学生在这个回答中是流畅的还是有一定的磕巴,这些数据都可以反哺教育机构、反哺我们自己的AI模型,让我们的AI模型进行升级迭代,从而形成业务的护城河。

所以AI伴学我们认为是一个业务能力根本性的升华,它是一个真正意义上的教学新范式。

(三)个性化AI伴学——四大核心要素

AI伴学既然能解决这么多的问题,那么如何打造一个重塑业务场景的个性化AI伴学课堂。我们主要关心四大要素:

1. 互动体验。自然流畅的实时互动是整个学习的基础。

2. AI的“听”和“答”。AI能不能像真人老师一样及时性地理解学生提出的问题,并且准确地识别到学生所提到的关键词,给到对应的内容。只有让AI老师和学生进行正确的互动问答之后,你才能让对话持续,否则学生提一个问题,老师已读乱回,或者老师和学生各说各话,这个互动就没办法进行下去。

3. 学习效果。学习效果评价有两个方面:一是AI老师的专业性,专业性一是来源于大模型的设定,二是教学知识库相关的处理。还有另外一方面就是,AI是不是冰冷的AI,AI是不是有感情的AI,它也会影响学生的学习效果。比如我们的AI老师能够给学生回复的内容上,除了准确以外,还可以给予一定的情绪价值,比如说鼓励学生大胆开口,鼓励学生勇敢地回答,对于正确的答案给予一定的认可价值,都是能够提升学习效果的。

4. 性价比。能不能低成本、大规模的落地。今天成本是所有教育机构面临的核心问题,所以我们希望技术方案能够给教育机构不带来额外成本的情况下真正做到落地,让千万学生真正能够得到受益。

(四)即构AI伴学在线课堂方案

我们提供了什么样的技术能力来实现刚才所说的四大要点?

1. 实时流畅的对话

第一,业界领先的RTC服务,保障AI的稳定性与实时性。

我们在RTC领域持续积累了近20年,这里是我们几个关键性指标,第一个指标是我们为全球所有的用户可以提供200毫秒的超低延时的全球实时互动。这个数据是什么样的含义?今天人和人之间的沟通,比如我站在这里,你站在我旁边,我说一句话,你听到的时延大概是300-400毫秒,200毫秒以内完全是一个拟真的场景,完全感知不出来有距离,这是RTC的能力。RTC即使结合了ASR、AI、TTS等相关的处理环节,我们也可以提供在差不多1秒左右的端到端的AI互动对话体验,1秒左右基本上等同于人和人之间,我提了问题之后,你稍微思索一下,然后回复我的时延。国内外厂商终端的适配数量我们刚刚也提到了,我们大概适配了3万家国内厂商的终端适配,这点可以保障我们所有的学生,不管是什么样的机型,都能够有一致的互动体验。最下面的两点是我们自己全球的MSDN海量有序网络和节前情况,我们在全球覆盖500+的节点,为全球所有的用户提供稳定的网络服务。

2. 准确、拟人的互动

第二,我们希望可以提供提供一个更自然拟真的AI互动对话体验。

这里就用到我们自研的AI音频处理能力,我们的AI音频处理可以让AI像真人一样反应快、听得准、说得清。大家看到音频处理有太多的技术要点,它到底是什么东西?以及它的价值到底是什么?我这里就直接用两段音频给大家演示一下。

刚刚的两段音频大家应该能够听得出来区别,第一段音频里面在说话的时候,它有很多的背景噪音,比如说有风声、雨声,甚至有叮叮当当,其实那个是炒菜的声音,还有其他的杂音。第二段就是经过我们自己的音频处理之后,得到一个干净纯粹的声音。这里的价值就是,我们的学生在线课堂学习的时候,他的身边不一定是非常安静的环境,他有可能在客厅学习,妈妈可能在看电视、在做饭,或者在线下其他的地方,咖啡厅还有背景音乐,可能窗户外还有噪音等等这些声音。

人和人之间沟通的时候,这些声音我们可以通过一定的方法,比如说我和你的距离拉近一点,我的声音说大一点,或者我们人本身的大脑就会自动过滤掉这些杂音。但是我们要让学生和AI老师进行互动的时候,AI老师是不会直接把这些杂音处理掉的,就需要在给到AI老师准确的信息之前对它做一些处理,要保证我们给到的信息是真正的学生有价值、有用的准确信息,才能让AI老师真正理解学生的意思,并且给出正确的回答。所以我们说要让AI老师像真人一样反应快、听得准、说得性。

3. 个性化教学+情感反馈

第三,情感化相关的事情。

AI老师通过大语言模型、知识库可以做到回答得准,这个在今天已经不是非常困难了。但是如何让AI老师具有一定的情感?我们给出的方案就是可以定制老师的声音和形象,让它有一定的人格,可以做到更多的情感输出。针对不同的课堂场景以及不同的诉求,我们可以提供多种定制方案。比如说对于一些名师来讲,或者是一些相对比较严肃的,学生对于老师的认可度较高的场景,我们建议可以去复刻真人老师的形象;对一些比较有意思的课堂或者是一些有特点的课堂,我们可以通过AI生成拟真人的形象,复刻这些形象,可以做到形象的灵活百变,来提高学生吸引力。对于一些比较小的学生,幼龄的学生,他们可能对真人老师的形象会有一些害怕,就像小朋友见到大人会有一些害怕,这是自然的。

这个时候我们用卡通的形象,可能小朋友更容易接受,小朋友更喜爱,他就愿意和它进行对话。最后还有特定的场景,比如在语文和历史这样的课程中,可以运用一些历史人物的形象把它给复刻,让它和学生之间进行互动回答。比如我们讲李白,如果我们可以复刻一个李白的形象,让李白介绍自己的一生,对学生来讲仿佛穿越了课本,和古人真正进行互动对话,可以提高学生的学习兴趣。

4. 灵活选择,轻松接入

以上是互动相关的技术能力,在这个过程中我们需要有大语言模型等相关能力,我们现在已经接入了国内外各类大模型,教育机构可以根据自己的需求自定义,来调整大模型。同样,tts也可以根据机构的需求进行灵活调整。

5. 高并发能力

个性化的问题得到解决之后,还有第二个问题就是如何去做到大规模。

两个人同时互动对话的场景,其实这两个人是同时发生的,AI老师是根据一个教学主题,但是对两个同学下发了不同的问题,两个同学再根据这个问题进行回答,AI老师也给了他们对应的个性化反馈。我们这里演示的是两个人,其实我们整套的架构可以针对万人级别规模的并发,让所有的学生都可以在同时进入到这样的AI伴学场景里面。

这个就是我们整个AI伴学的业务架构,首先真人老师通过我们的直播技术或者是CDN技术来进行万级别甚至十万级别的直播,当老师进入到了需要AI伴学互动的环节,就像我刚刚提到的老师们需要随堂演练的时候,老师可以通过触发系统,让AI老师和学生进入到一对一的弹框。我们已经验证了在万级规模并发下保障所有的同学同时进入,保障所有学生的效果一致性。这个过程中,AI老师可以和学生提供个性化的问答,真人老师可以灵活自由控住互动问答的频率、时长。

6. 极致性价比

大规模、个性化都解决了,最后说一下关于性价比。我们讲用得起来、用得上的方案才是好的方案。所以通过我们不断的技术优化,我们可以通过灵活的计费和极致性价比得单价,可以做到单课程、单人成本在3块钱以内,这是大部分教育机构可以接受的成本。我们希望不给教育机构增加负担的情况下真正让这个方案能够落地实现。

(五)客户案例

这是我们某一个K12的教育机构的案例。首先从互动学生占比,直播课里面互动学生占比就是真人老师和学生之间的连麦,以前可能就是挑选那么两三个,不到5%,但是用了这个方案之后,所有的学生都可以参与这种互动,可以把占比提高到百分之百。互动频率上,在真人直播课里面,如果真人老师互动的话,因为真人老师精力的问题顶多有1-2次互动。但是用AI以后,真人老师只要控制这个AI老师就可以了,可以穿插5-6次的互动,甚至更多,单节课互动占比可以从之前的10%提升到30%。下面是这两个数据是对教育机构非常有价值的反馈信息,第一个是在退课和续费的转化率方面,我们的客户用了AI伴学方案之后,和没有AI伴学的课堂对比,整体的退课率降低了50%。

正是因为好的效果,当前该客户是在英语和数学学科上进行了使用,未来会在更多的学科里面复刻这个场景,然后为更多的学生提供个性化的教学。

这就是为我们的教育机构提供的一站式AI伴学解决方案,我们通过提供多模态的,包括IM、语音和数字人的互动形式,让我们的教育机构能够去实现一对一的伴学互动。通过高级的音频处理,让我们的AI能像真人一样,及时地去反馈听得清、说得准,在大语言模型,文字转语音上,机构都可以根据自己的需求自定义。我们配套提供了会话管理、知识库以及内容审核等相关能力,能让教育机构快速高效落地整套方案。

这是我们即构公司RTC+AI的整个产品矩阵,刚才讲的是AI伴学解决方案,AI伴学的底层核心是RTC+AI的工程化结合,这里面整个的能力其实已经融入到了我们公司的产品矩阵中来,不仅在教育行业,我们在娱乐、出海、金融等相关行业都提供相关的技术方案,这里我就不多讲了。希望我们能够给所有的行业伙伴和开发者们提供更好的实时音视频互动技术,共建实时互动世界。大家如果有兴趣的话,我们公司在外面有一个展台,可以来咨询。

我的分享就到这里,谢谢大家!

相关内容

热门资讯

日本炒作被辽宁舰编队雷达照射,... 南都讯记者莫倩如 发自北京 12月7日,国防部新闻发言人张晓刚大校针对日本炒作我辽宁舰航母编队舰载机...
湖北社科迈向AI时代!全国首个... 极目新闻记者 张艳 通讯员 朱京阳 12月7日,湖北省社科AI发展大会在武汉举行,全国首个省级哲学社...
斩获大奖,这部国内AI科幻电影... 那些没说出口的爱,终会在时间与科技的回声里被听见。 12月5日,电影《比如父子》在北京举行首映礼。导...
AI大模型、穿越微短剧让全民健... 新华社南宁12月7日电(记者曹祎铭)“我终于直观搞清楚了自己的步态问题,AI建议我在日常生活中通过平...
原创 我... 最近豆包AI手机热度直接爆炸,朋友圈、科技媒体、短视频全在刷它最核心的一点——一句话自动办复杂事。 ...