特征工程:学习分析中识别行为模式的重要方法

作者:欧阳嘉煜;范逸洲;罗淑芳;纪九梅;汪琼; 刊名:现代教育技术 上传者:严君

【摘要】学习分析作为学习科学的子领域,其关注的核心问题就是对学习过程的理解与优化,而这离不开对学习者学习行为数据的收集和对行为模式的分析。特征工程作为一种基于底层数据设计特征集的系统方法,为行为模式的分析提供了新的技术支持与研究路径。文章通过介绍特征工程实施的四个步骤,系统梳理了目前使用特征工程方法识别出的典型行为模式,如投机取巧、挫折、疑惑等,可为行为模式的相关研究提供参考。同时,文章基于对有效的技术支持和实践意义两个话题的讨论,指出了未来的研究取径与研究重点。

全文阅读

一问题引入学习分析作为学习科学的子领域,正受到越来越多研究者的关注与重视[1]。学习分析起源于智能导师系统(Intelligent Tutoring Systems,ITS)的相关研究。一般而言,学习分析被定义为:为了理解、优化学习过程和学习环境,对学习者及其所在情境的数据进行的测量、收集、分析和汇总工作[2]。这一定义明确了学习分析关注的主要问题之一是理解和优化学习过程,而这离不开对学习过程数据的收集和对行为模式的分析。通过揭示行为模式产生的深层次原因,进而为学生提供优质的支持服务,这是学习分析在教育领域应用的核心价值所在[3]。早期对于学习过程和行为模式的研究大多采用实地课堂观察、访谈法、问卷调查法等,这些方法关注的数据类型相对有限,并且以主观数据为主。过于关注主观数据而忽视学习者学习过程中产生的客观数据,教学研究就易受到研究者自身价值判断或研究工具信效度的影响,导致研究结论的客观性和可推广性较低。20世纪90年代之后,随着数据收集和分析技术的发展,以及人们对教学的理解更为深入,研究者开始收集学习者在学习过程中产生的细节数据,并进一步从客观数据中挖掘出学习者的行为模式。近年来,对于学习者行为模式的研究希望建立精确的预测分类算法或模型,虽然大多数算法在预测能力方面均能取得令人满意的效果,但致力于优化算法准确度的研究并没有取得实质性的突破。这样一种困境引发了研究者对预测算法特征之有效性的思考:如果基于底层数据提取的行为模式特征不够理想,那么建立在行为特征数据之上的预测算法或模型自然就难以进行较大优化,因此,如何选取能够有效反映学习者行为模式的特征是一个值得探讨的话题。特征工程作为一种基于底层数据设计特征集的系统方法,正是解决这一困境的良方。正如Asker等[4]所说,在一个学习系统中,想要创造出一个高的分类准确度,好的特征工程通常比一个特别的分类算法更为重要。综上可知,如何基于客观行为数据来运用特征工程识别行为模式是一个值得研究的问题。因此,本研究尝试回答以下两个问题:特征工程的一般步骤是什么?目前学习分析领域中使用特征工程方法所识别出的典型行为模式有哪些?本研究期待通过讨论特征工程的技术意义和教学意义两个话题,来指出未来学习分析领域使用特征工程技术可能开展的研究方向和研究问题。二什么是特征工程?特征工程(Feature Engineering)也称为变量消除(Variable Elimination),是机器学习领域的一个重要概念[5]。Arroba等[6]将特征工程定义为一种非常有用的技术,用于选择最优的特征集,这些特征最能描述并优化问题。而Turner等[7]认为特征工程就是选择适当的特征,避免包含不相关参数的过程。一般来说,可以认为特征工程是为机器学习应用而设计特征集的相关工作[8],重点关注如何设计出符合数据本身特点和所处情境的数据特征。特征工程可分为四个阶段[9][10]:(1)特征构建(Feature Construction)阶段,也称为头脑风暴阶段,是根据研究问题初步构思数据特征集的过程。如当我们探讨和描述学习者不认真学习的行为模式时,可能会构思出一些特征:回答问题总是错误、作业完成不认真、测验完成不认真等。此过程主要可运用三种方法:方法一是研究者自己思考得出一些特征;方法二是向他人询问,补充一些自身没有想到的想法,可以采用向专家询问或者阅读相关文献等手段;方法三则是扩展到“群体”,让更多的人群加入到思维发散构建特征的过程,也称为众所提议的特性[11]。(2)特征提取(Feature Exaction)阶段,是将前一阶段初步构思

参考文献

引证文献

问答

我要提问