教育资源是组成教育生态的重要部分·,其中知识点、视频课程、教辅资料、作业题库等内容是组成教育资源的基础。教育产品以“内容为王”,内容运用于教学、学习、作业、批改等场景。当前在线教育领域存在内容质量良宥不齐、内容分布不均衡、创作者积极性不高等现象。从内容的生产和消费角度,我们该如何优化内容生产路径,挖掘优质内容,使得内容更好地服务于教师、学生和家长?
尽管不同领域内容建设各有差异,但都离不开内容建设的四部曲:内容生产、内容入库、内容审核、内容推荐。
一.内容生产
在线教育领域的内容生产一部分来源平台生产,另一部分来源于用户-教师和学生。用户生产内容的方式主要是PGC、UGC和OGC。
1.PGC
PGC:英文为Professionally-generated Content,即专业人士生产的内容。这种方式对于生产者的专业能力和知识具有较高要求,生产者一般是某一领域的名师、大V或者专家,质量有保障。
2.UGC
UGC:英文为User-generated Content,即普通用户生产的内容。这种方式门槛较低,人人都可生产内容,但质量参差不齐。
当前在线教育平台普遍存在优质用户难以沉淀、缺乏高质量的内容等现象,我们如何建立完善的用户激励体系,营造良好的创作氛围,同时优化内容生产路径,降低用户内容生产成本是另一个值得思考的问题。
二.内容入库
用户生产的海量内容,需要在平台进行沉淀、组织和管理。我们需要提炼不同内容的共性字段,设计结构化的信息将内容进行组织,方便内容的展示和管理。
1.组织架构
1)阶梯形
从上至下,由大类逐层划分小类,最终将内容归属到相应的小类中。这种组织架构常用于内容展示和后台管理。
2)用户自组织
用户自发地搜集内容,并将相同分类的内容归入同一个文件夹内。这种组织架构常用于教师的收藏夹,学生的错题本。
2.结构化信息处理
1)共性字段
视频、试卷、课件、教案、素材等不同内容类型的共性字段为所属知识点、内容标题、创建者、来源、创建时间等,合理的字段便于内容的维护和功能的扩展。
2)分类
分类是将无规律的事物按照不同的特点划分为有规律的事物,使事物具有统一性。分类体系的设计要符合大众的认知,在线教育常见的分类体系为依据所编写的教材或者知识点而构建的教材体系和知识点体系,将内容进行有体系的归档和组织,便于用户快速找到需要的内容。
3)标签
标签是事物抽象出来的定义,方便用户标记和机器识别。一般而言,分类体系大都是稳定的,而标签具有灵活性、自定义性。在线教育标签主要分为三类:知识标签、内容标签和用户标签。通过抽取出不同分类的共性标签,将知识、内容和用户进行连接。标签体系的建立是内容推荐的基础。
三.内容审核
内容审核的主要目的是一方面识别黄赌毒等违规内容,降低不良内容风险;另一方面甄别优质内容。目前内容审核一般采用机器审核为主+人工审核为辅,审核机制一搬为先审后发和先发后审。
1.审核机制
1)先审后发
先审后发通常是指生产者生产的内容经过平台审核通过后才能给其他用户展示和使用。平台审核的方式一般为自动化审核(事前定义好逻辑判断规则)或人工审核(事前定义好非机器审核标准)。自动化审核主要是通过预先设定的关键词、图片识别、NLP语义识别、违禁词等策略进行审核。自动化审核可以有效提升人工审核效率,但自动化审核只能采用已知逻辑作为判断依据,对未知新生的问题无法给出合理的判断,因此人工审核的流程还无法被机器取代。
先发后审的优点是内容质量有保证,可以有效避免违法违规低质有害内容的传播;缺点是时效性与内容传播流动性差,人工审核成本高。
2)先发后审
先发后审是用户创建的内容无需审核就能给其他用户展示和使用,一般通过后期用户的反馈再对内容进行审核处理。先发后审的优点是时效性强,缺点是一旦内容具有违规内容,存在处理延迟的风险。
目前内容运营在承担内容审核的工作,提高内容审核效率的主要方式为:
1)用户分类:平台提前区分优质用户、普通用户和风险用户,对于不同用户生产的内容采取不同的审核策略;
2)内容自动审核系统:平台通过预先设定的敏感词和关键词、图片识别等策略进行机器审核,提前将不合规的内容筛选出来,节省人工审核的成本;
3)分级处理:对于不同质量的内容进行对应的奖惩处理。优质内容生产者可获得加V、积分等奖励,其内容将加权推荐、优先推荐;违规内容生产者将受到封号、加入黑明单等处罚,其内容将删除、禁用。
4)反馈机制:对于用户端增加举报和反馈入口,后台设计反馈处理模块,在一定程度上可降低违规内容的风险。
四.内容推荐
前面所做的内容生产、内容入库、内容审核都是为内容推荐服务。内容推荐被应用于电商、新闻资讯、音乐、视频、知识付费等领域,在线教育领域目前也在涉及。推荐的本质是给用户推荐适合的内容,学生推荐他感兴趣、正在学习或者不会的内容,教师推荐他正在教或者待要教的内容。用户期望推荐的内容是他想要的,然而目前内容推荐普遍存在推荐的不准、重复、同质化等现象。内容推荐要做到推荐的精和准的前提是要积累优质的内容和大量的数据。优质的内容需要在内容生产、入库和审核过程中进行把控,大量的数据需要建立标签体系、用户画像和内容画像。用户画像主要分为用户基础信息和用户行为,用户画像最终要和内容进行匹配、连接。
常用的内容推荐方法:
(1)人工推荐
推荐方式一般通过后台人工选择推荐的内容和内容的排列顺序。这是一种低成本的推荐方式,适合于产品初期阶段,运营可运用数据分析、用户反馈等方式进行推荐参考。这种推荐方式的劣势在于,不同用户看到的内容都千篇一律,而且内容更新需要人工进行操作。
(2)个性化推荐
人工设置的推荐过于单调,无法满足不同用户对于内容的需求。个性化推荐通过算法,结合大数据,基于用户画像,对于不同的用户推送不同的内容。个性化系统常见的方式主要为:
1)基于相似用户推荐
通过具有相似特征的用户推荐用户喜欢或感兴趣的内容。什么叫相似用户?我们可以根据用户属性和用户行为进行划分。用户属性根据人口统计学的地区、性别、年龄、年级等进行划分,用户行为可根据用户观看视频时长、正确率、答题次数等维度划分。通过一定的计算公式和不同属性的权重计算出相似分,对于相同地区、相同年级和相同相似分的用户推荐相同的内容。
2)基于相似内容推荐
通过内容的基本信息确认内容与内容之间的相似度,再根据用户历史浏览和行为记录,将相似内容推荐给用户。这种推荐需要建立丰富的内容标签,将内容标签拆分的越细,描述的越完整,内容与用户行为记录匹配度就更高,推荐更精准。
不同推荐方式在不同场景下各有优势,在实际应用中,会将人工推荐+个性化推荐进行组合。