大规模在线教育中协作学习实时分析及可视化呈现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 在线协作学习分析方法研究

在线协作学习的分析方法获得了诸多研究者的关注,大量的研究试图去完善与增强现存的分析方法。目前主要的分析方法包括简单统计方法、内容分析法、社会网络分析法、序列分析法以及数据挖掘方法。这些方法在关注点、方法取向、研究对象、使用的技术方案以及支持工具方面都各有不同。由于这些方法各有侧重点,综合运用这些方法成为目前协作学习过程分析的一个主流趋势。表2-2为在线协作讨论过程分析主流方法的一个总览。

表2-2 在线协作学习主流分析方法

2.2.1 简单统计方法

早期的在线协作学习分析主要采用简单统计方法,即通过问卷或者会话数量统计决定协作者的协作水平。其典型的使用是通过设立教学变量的假设,然后检测这些变量在统计意义上对协作学习的影响(Strijbos and Fischer, 2007)。例如,研究者通常统计用户发帖数、回复数、登录时间等来调查协作学习的参与程度和交互水平之间的影响(Kim and Lee, 2012)。一些研究通过使用简单统计结果显示,参与频次和时间与课程的完成率和学业成就呈正相关(Morris et al.,2005)。还有一些研究结果显示话语的平均数量与会话内容的质量呈正相关。另外,还有研究使用定量的方法将学习者的读写量累加作为协作交互水平的值进行对比(Benbunan-Fich and Hiltz, 1999),或者基于一定的标准对每条信息进行打分然后进行分析(Brooks and Jeong, 2006)。总体上说,采用简单统计方法能够对单独的信息进行编码并且基于统计的思想描述不同分类分布的频度以及识别他们的关系,其主要的优势是能够非常简单地定量协作学习交互的水平。由于研究者能够依据定量数据采用多种统计方法,因此早期研究者认为,这个方法是用来分析学习者之间的在线交互的最客观的方法(Benbunan-Fich and Hiltz, 1999;Kim and Lee, 2012;Marra, 2006)。然而,这个方法的局限是它仅仅能够提供在线协作交互的简单数量分析,不能识别在线协作交互过程中更为重要的信息,从而很难帮助判断协作交互的质量(Strijbos et al.,2006)。同时,由于分析方法比较浅显,其研究结果也受到众多质疑。

2.2.2 内容分析法

在CSCL领域,内容分析法一般针对讨论中交互的文本内容进行交互特征的标识进而进行分析,是比定量分析更为细致的一种分析方法,因此被认为能够比简单统计方法更好地分析交互的类型和水平(Kim and Lee, 2012)。大多数针对分析过程和参与者交互的定性分析使用了内容分析法(Strijbos and Stahl, 2007)。内容分析法经常作为混合方法的一个部分,通过结合定量方法从而对讨论进行更深入的分析(Clarà and Mauri, 2010)。

帖子质量是一个重要的评价在线学习的标准(Häkkinen, 2013)。内容分析法的一个重要作用是评价在线协作讨论的帖子质量(Strijbos and Fischer, 2007)。因此,内容分析法作为一种挖掘讨论脚本中重要信息的技术手段,用来揭示不能从讨论脚本表层表达的信息。例如,在研究中各种各样的内容分析法基于不同的分类系统用来特征化问题类型、观点的深度、争论的模式等(Baker et al.,2007;Kai, 2003;van Aalst and Chan, 2007),并与简单定量统计方法结合使用,将在线讨论的定性分析转换为可以定量的编码,从而提供更令人信服的关于知识建构的发生以及对讨论更深度理解的证据(Clarà and Mauri, 2010)。

在CSCL领域,应用内容分析法对交互文本进行分析的基本过程(刘黄玲子等,2005b)如下:①选择合适的数据来源,确定原始样本资料的规模和大小;②确定分析所选用的最小分析单元,如句子、消息、片段、意义单元等;③选择一个已有的或改编的编码体系对样本进行编码;④对编码结果进行描述统计,如各维度帖子数量或者频次等;⑤分析编码结果,发现隐含的规律或趋势,并解释发现的规律或趋势。

在实际的CSCL研究中,研究者将内容分析法作为一个主要的手段应用于各种各样的协作讨论的教学实验分析中,从而获得各种深层次的教学发现和研究成果。如Wise等利用Gunawardena的五阶段模型对学生在知识建构过程中产生的帖子进行编码,研究结果发现,学生在知识建构过程中主要停留在第一阶段(Wise and Chiu, 2011)。Abedin等使用脚本分析工具分别对有目标任务和无目标任务的两个班的在线协作讨论中的行为进行了编码。通过应用内容分析法,结果发现,有无任务下的协作讨论中存在差异,如无任务下的讨论更多地包含带有引证的陈述、衍生出横向问题和打招呼。这表明无目标情况下学生更愿意共享他人的信息,并且能够参考和评论同学的意见(Abedin et al.,2014)。

总的来说,内容分析的目的是揭示一些不能从讨论脚本表层轻易获得的信息。它增强了研究者从协作交互过程中收集更多信息的能力,因此被广泛地采用。然而,内容分析法也存在一些局限,尽管提供了关于类型和水平的定量信息,但内容分析法存在较多的主观性,不同编码方式在细节水平和使用的分析类型等方面都有不同,而且采用内容分析法中的有效且可靠信息的数量以及所选择的分析单元的差异都会对最终分析结果产生影响。另外,内容分析法是一个关注协作消息质量的重要方法,其不能提供协作交互的结构化信息的分析与展示,不能用来检查消息之间的关系以及消息的序列,不能反映群组当下的交互过程是否影响了接下来的讨论和认知输出。

2.2.3 社会网络分析法

社会网络分析法(Social Network Analysis,SNA)在CSCL领域被广泛采用(郑兰琴,2013)。不同于关注交互过程中的个体特性数据或属性的内容分析方法,SNA的分析对象是网络成员之间发生的交互,是一种关注于关系数据的分析方法。其从社会关系的视角分析交互,发现推动或阻碍群体知识创新或传播的关系网络,强调成员关系会影响个体知识的获得。

SNA使用关系矩阵表征参与者之间的交互关系并基于图理论去描述交互模式及网络的特征。社会网络图中用节点代表信息的发出者和接收者,箭头代表发送的方向,节点间连线的粗细表示信息传递的频率或传递的信息量,整体反映了协作群组内成员之间信息流动的统计特征(郑兰琴,2010)。根据研究的侧重点不同,关注的“关系”也不同。如果关注整体网络,则研究所有参与者之间的关系,那么研究者就需要分析密度、凝聚力、核心—边缘结构等能表征整体的关系特征。而如果关注的是网络中的个体参与者,探究个体在整体中的参与状态和关系,那么研究者可能分析有关个体的一些关系特征,如个体中介性、个体中心度等。

在教育领域中,SNA分析主要关注学习者与学习者、学习者与指导者、学习者与学习社群中的人员之间的交互关系。这些交互关系将依据个体之间的交互连接被划分为强关系和弱关系。关系的强弱划分依赖于已定义的交互的一些指标,如交互发生的频率、质量、重要程度、持续时间、直接或非直接的连接等。社会学习关系分析还帮助理解学习者如何发展和维护他们的关系以支持学习。从个体的角度来说,社会学习关系分析还关注个体在社会学习环境和群体中的地位,这将通过基于个体学习者的分类指标来识别一个学习者。如通过学习者与他人的关联关系判断学习者是位于学习社群的中心位置还是边缘位置。例如,社会学习关系分析能够识别在活动中最有影响力的和有潜在可能影响的人,我们称之为意见领袖者。又如,对于识别出远离网络的学习者,应提示系统或指导者给予更多关注;社会学习关系分析利用社会网络分析工具,关注学习者之间的交互关系,通过对这些交互关系数据的收集处理与展示,利用可视化的社会学习关系网络图识别学习者在网络中的位置,并能够提供潜在的识别干预。

SNA通过对个体之间关系的关注取代了对个体本身的关注。这种分析方法被认为是一种更准确、更宏观的方法。大量研究通过关注协作过程中的互动网络结构对CSCL的机制进行探究(Hong et al.,2010;Lipponen et al.,2003)。如王陆教授采用社会网络分析法探索虚拟学习社区社会网络中的助学者群体。研究发现,有部分学生扮演学习者和教师双重身份,有两名学习者不仅与教师具有较高水平的结构对等性,而且与教师具有较高水平的规则对等性,即他们能在不改变网络关系结构的条件下替换教师(王陆,2010)。金振威和赵蔚在中学信息技术课进行实验研究,选取社会网络分析法中密度、中心度、凝聚子群等指标对两个班的学生交流情况进行对比,发现了信息技术课应用协作学习的优势,并为如何将协作学习更好地应用在信息技术课堂提出了一些建议(金振威赵蔚,2012)。Tirado R.等通过实证的方法调查异步讨论环境中,网络结构和社会知识建构之间的关系(Tirado et al.,2015)。其中,SNA主要使用了凝聚力、密度、中心性三个指标。结果显示,凝聚力和中心性之间存在正相关,而且凝聚力指标与中心性指标对知识建构的社会存在和认知存在具有积极的影响。Yang等使用SNA来调查团队交互网络(Yang et al.,2015)。他们选取了凝聚力和成员影响力这两个常用的指标来确定整个交互网络和在线协作转换活动中不同小组的交互表现。仲伟等基于学习元平台组织师生协同阅读活动,从协同知识建构的角度出发,利用社会网络分析的整体网络分析和中心性分析,研究社会成员的关系和互动特点。结果表明,师生交互较为均衡,有较好的网络结构和凝聚性。另外,群体中“意见领袖”和“边缘人”并存(钟伟等,2015)。

支持社会网络分析的软件已经有很多,常用的有NetMiner、SNAPP和Gephi8等。如SNAPP能够收集在线学习论坛中的与帖子相关的交互信息(讨论者、发帖者、回帖者、回帖数等),进行自我中心社会网络分析、小团体分析、中心性分析等社会网络分析(孟玲玲等,2014),并以可视化的关系网络图呈现。

2.2.4 序列分析法

序列分析法最早是由Sackett于1978年提出的,旨在评估交互过程中序列行为随时间发生的概率,是行为分析的一种方法(Bakeman and Gottman, 1997)。这种方法主要用来检验两种连续发生的行为是否存在统计意义上的显著性(Hawks, 1987;Hou et al.,2010)。该方法在众多的研究领域,如医学治疗行为、孩子的交互行为以及运动行为的序列模式研究中都得到了广泛应用。

序列分析法按照行为出现先后顺序,找出一个行为接着另一个行为出现的频率,利用序列分析残差表的Z-score值解释行为之间是否存在显著性的关联,并用状态转换图的方式表征行为转换模式。早期行为数据的处理主要依赖人工,耗时耗力。为了辅助进行数据处理,专用分析软件GSEQ被开发用于识别高、低讨论质量的学生在行为序列上不同的模式。自此,序列分析方法被广泛应用于协作学习领域。

使用序列分析法的基本步骤包括:①定义行为编码;②记录需要观察的行为;③对观察的行为进行编码;④按GSED要求的编码格式输入所有行为编码;⑤根据Z-score值过滤有显著意义的行为序列,绘制行为转换图;⑥根据行为转换图解释行为序列模式。其具体算法思路是,依据讨论会话的编码类型进行编码标注,若一个会话行为按照编码表编码为1,而接下来的会话行为编码是2,那么就组成了一个序列对(1,2),若再接下来是4,则与上一个行为2组成了又一个序列对(2,4);对整个协作过程进行类似的编码,再依据编码表二级维度统计后得到序列对频次矩阵,通过计算可得出矩阵每一序列对的调整残差Z值,当Z>1.96时,表示这一会话行为的转换是显著的;找出显著的序列对,并据此画出如图2-1所示的行为转换图。

图2-1 基于序列分析法的行为转换图

近年来,研究者多利用序列分析法进行行为模式的发现与挖掘。在教育领域,研究者开始利用该方法研究在线学习环境下的在线学习行为模式(Jeong, 2003)、在线会话中的知识分享行为(Eryilmaz et al.,2013)、角色扮演中的操作行为(H.T.Hou, 2012)以及应用移动设备的非正式学习行为(Sung et al.,2010)等。这种方法的重要作用在于可以帮助研究者和教学者准确把握学习者潜在的行为模式,从行为视角掌握协作群组及学生个体的行为偏好,进而有针对性地进行教学干预与个性化的教学指导。

2.2.5 数据挖掘方法

伴随技术的不断进步,一些自动化分析的方法逐渐进入协作学习分析领域。这些自动化的分析方法既包括一些基于自然语言处理的文本统计方法,也包含使用教育数据挖掘类的方法。最终目的都是获得对协作讨论过程更深机制与规律的挖掘,并使得分析方法能够更直接地应用于实践教学中。例如,澳大利亚悉尼大学的Dilhan Perera博士使用一款开源的专业软件开发追踪系统TRAC开展协作活动,利用该软件集成的wiki工具进行协作知识分享,并收集学生在系统中的各种行为信息,分析在线协作的行为和交互信息。研究使用聚类算法发现相似的群组和相似的个体成员,使用序列模式挖掘算法发现好学生和差学生的行为模式特征差异。该研究探索了影响协作成功的一些关键因素,教师可以观测这些因素,从而能够在早期对协作结果作出预测并积极给予反馈(Perera et al.,2009)。中国台湾的洪皇尧教授采用从交互文本中自动抽取共享关键词的方法探究在线协作学习知识建构环境中集体知识的表达和评价方法。他认为这种简单的方法可以在评价集体知识方面作为传统的在线交互测量的补充(Hong and Scardamalia, 2014)。Soller等采用隐马尔科夫模型(HMM)和多维尺度分析(MDS)技术分析和评价协作中知识分享交互的行为,动态识别学生在什么时间遇到了学习困难以及判断为什么会有这样的困难,认为这样的系统可以辅助指导教师更好地理解学生协作知识分享的过程(Soller, 2004)。Kumar等使用本体的方法构建了一个基于电子追踪数据的工具自动的检查群组知识构建和认知(Kumar et al.,2010)。

总体上来说,不同研究方法的侧重点不同,其对应协作讨论过程分析的优势和局限性也各有不同。内容分析法主要采用编码表的方式对协作学习过程从知识建构、交互模式等不同角度进行分析,具有较大的灵活性,但对人工依赖程度较高。社会网络分析法以图理论为基础,关注揭示在线交互的关系和结构,并能够较好地可视化这些交互关系,其侧重对交互关系结构的测量。定量分析方法主要使用相对简单但是客观的统计数据,提供较为浅显的协作过程的分析。序列分析法能够将协作讨论中内隐行为依据编码表转化为相应的认知行为,并提供这些行为之间转换的显性表达。数据挖掘方法则主要能够发现隐含的规律,并实现自动化的分析。这些方法各有优缺点,在协作学习过程研究的不同方面起到了不同的作用。通过对目前的文献进行综述,还发现采用混合的研究方法成为一个趋势。针对不同的研究问题,将不同的研究方法结合使用,可以反映协作讨论交互活动的不同侧面,对于更深入地理解知识建构的发生和协作学习的内部机制具有积极的作用。