Skip to main content
  1. 论文/

过去10年学生参与研究趋势:基于机器学习的42,000篇研究文章分析

·5585 words·12 mins
学生参与 机器学习 主题建模 研究趋势 学术成就 学习者满意度 社区参与 学校参与 动机导向工具 学习环境
Table of Contents

✏️ Fatih Gurcan
✏️ Fatih Erdogdu
✏️ Nergiz Ercil Cagiltay
✏️ Kursat Cagiltay

要点总结
#

学生参与是学术成就和学习满意度的关键因素,但在不同学习环境中的研究趋势和主题分析仍然不足。本文通过主题建模技术,分析了2010年至2019年间发表的42,517篇同行评审期刊文章,揭示了学生参与研究的主题和趋势。研究发现,除了现有的维度外,还识别出了“社区参与”和“学校参与”两个新维度。未来的研究预计将集中在动机导向的工具和方法、社会和行为参与等维度,以及特定学习环境如EFL和STEM上。

本文采用了基于概率主题建模的半自动化文本挖掘方法,首次对学生参与研究领域进行了全面的分析。研究通过LDA算法识别了16个主题,并分析了这些主题的时间变化趋势。结果表明,学生参与研究的主题和趋势在过去十年中发生了显著变化,特别是在动机、医学教育和行为参与等领域。研究还提出了未来研究方向,强调了学习技术和动机在学生参与中的重要性。

关键要点
#

论文重要性
#

这项研究对学生参与研究领域具有重要的理论和实践意义。通过机器学习技术,研究揭示了学生参与的主题和趋势,为教育研究者和实践者提供了宝贵的参考。研究提出的新维度和未来研究方向,特别是在动机和学习技术方面的应用,将有助于推动学生参与研究的进一步发展。此外,研究结果与当前教育技术趋势紧密相关,为未来的教育创新提供了新的思路。未来的研究可以进一步扩展数据集,探索更多学习环境中的学生参与问题。


图表分析
#

研究方法概述
#

🔼 该图表概述了本研究采用的研究方法,主要分为五个连续步骤。首先,研究者根据文献中学生参与的概念框架制定了搜索策略,目的是获取最一致的数据。接下来,使用该策略获取的论文创建了一个关于学生参与的实验语料库。第三步是对该文本语料库进行预处理,使其适用于主题建模分析。这一阶段包括将所有文本转换为小写、删除网络链接和出版商信息,然后进行分词。之后,删除英文停用词、数字表达式、标点符号和符号,以及诸如 article、paper、research 和 study 之类的通用词。然后,通过使用 snowball 词干算法对词语进行词干化,并将词语简化为词根。应用词级 N-gram 模型以识别高频项。最后,基于“词袋”方法将每篇文章建模为一个词向量,并将经验语料库转换为文档术语矩阵(DTM)。第四步是在语料库上实施基于潜在狄利克雷分布 (LDA) 的主题建模技术。最后一步包括解释 LDA 发现的主题的内容和重点,以及主题的标签,从而提出学生参与研究的系统分类。图表通过图形方式呈现了该流程的步骤,展示了从搜索策略到最终结果的整个过程。总的来说,该图为理解研究中使用的严谨方法提供了重要的可视化概述,强调了每个阶段的逻辑顺序和重要性。方法中的每一步都经过精心设计,以确保数据的准确性和结果的可靠性,确保通过系统的方法对学生参与研究进行全面评估。

更多图表分析

研究方法概述
#

🔼 该图表(图1)概述了本研究的方法论,该研究旨在探索过去十年学生参与研究的主题和趋势。该方法由五个连续的步骤组成,清晰地呈现了研究的流程。首先,研究人员根据文献中学生参与的概念框架制定了搜索策略,以确保数据的准确性和相关性。其次,使用该策略,研究者从Scopus数据库中收集了相关文献,创建了一个学生参与的实验语料库。接着,对该语料库进行了预处理,包括转换为小写、删除链接和停用词、进行词形还原等,为后续的topic建模分析做准备。第四步,研究人员使用潜在狄利克雷分配(LDA)技术对预处理后的语料库进行主题建模,以识别潜在的语义结构。最后,研究人员对通过LDA发现的主题进行了解释,对主题进行标记,并揭示了主题的时间加速,从而提出了学生参与研究的系统分类法。图表中的箭头清晰地展示了这些步骤之间的流动关系,整个研究过程清晰、系统,为读者理解研究方法提供了便捷的途径。

该方法论的严谨性体现了研究者对数据的处理和主题的挖掘的专业性。从搜索策略到预处理,再到LDA主题模型的应用,每个环节都经过精心设计,以确保研究结果的有效性和可靠性。图表的呈现方式简洁明了,使得研究方法易于理解。这对于确保研究的可重复性和促进学术交流至关重要。总的来说,该图表不仅是对研究方法论的总结,也是对研究过程的有力支撑。

学生参与度研究主题十年趋势
#

🔼 该图(图2)展示了2010年至2019年间,学术界对学生参与度研究的年度论文发表数量变化。整体来看,研究数量呈现显著增长趋势,从2010年的2252篇增长到2019年的7032篇,增幅高达212.2%。这一增长趋势表明,近年来学术界对学生参与度这一议题的关注度日益提升。特别值得注意的是,2018年至2019年间的研究论文数量增幅最大,增加了1078篇,这可能与教育领域对学生参与度重要性的认识不断加深,以及相关研究方法的成熟有关。相比之下,2011年至2012年之间的增幅最小,仅为223篇。这种年度增长的波动可能受到多种因素的影响,包括研究热点、经费支持以及教育政策的变化等。图中的数据清晰地表明,学生参与度研究是一个活跃且不断发展的领域,未来的研究可能将继续保持增长势头,尤其是在教育技术快速发展的背景下,学生参与度研究的价值日益凸显。这项研究的结论是,学术界对“参与”研究的兴趣日益浓厚。

研究方法流程图
#

🔼 该图展示了研究的方法流程,旨在探索学生参与研究的主题和趋势。整个流程分为五个连续步骤,从文献中提取数据,到最终解释结果并提出分类法。首先,研究者根据文献中学生参与的概念框架,设计了搜索策略,确保获取最相关的数据。接下来,利用这一策略创建了一个学生参与研究的实验语料库,该语料库由从 Scopus 数据库检索到的 42,517 篇学术期刊文章组成。在数据准备阶段,对文本语料库进行预处理,包括去除停用词、词干化等,使其适合进行主题建模分析。随后,采用基于潜在狄利克雷分配(LDA)的主题建模技术,从预处理后的语料库中提取出潜在的主题。最终,对通过LDA发现的主题进行解释,并根据主题的关键词和时间趋势进行标记,从而提出一个系统的学生参与研究分类法。此方法流程的清晰展示,有助于理解研究的整体结构和步骤,从而增强研究结果的透明度和可重复性。整体的流程框架清晰地概述了从数据收集到结果解释的整个过程,强调了该研究方法的严谨性和系统性。图中呈现的步骤表明,该研究利用量化分析方法来理解学生参与研究的复杂性。

研究方法概述
#

🔼 本图(Fig. 1)概述了本研究的方法论,该研究旨在探索学生参与研究中的研究主题和趋势。该方法包括五个顺序步骤。首先,根据文献中学生参与的概念框架,制定了一个搜索策略,以获得研究范围内最一致的数据。然后,使用通过此搜索获得的文献创建了一个关于学生参与的实验语料库。接下来,通过对其应用预处理任务,使该文本语料库适合主题建模分析。在此阶段,在语料库上实施了基于潜在狄利克雷分配(LDA)的主题建模技术。最后,对LDA发现的主题的内容和重点进行了解释,对主题进行了标记,并揭示了主题的时间加速;因此,提出了一个关于学生参与研究的系统分类法。

该图以流程图的形式展示了这五个步骤,清晰地展现了研究的整体框架。从图示中可以看出,研究过程从文献搜索开始,经过数据收集、预处理,最终到达主题分析和解读。这种清晰的步骤展示有助于读者理解研究的严谨性和逻辑性。本研究采用的方法保证了研究结果的可靠性和有效性,为理解学生参与研究的演变趋势提供了有力的依据。通过将预处理后的语料库进行 LDA 分析,可以有效揭示隐含的语义结构,为后续的解释和研究提供支持。此图不仅概括了方法论,还强调了该研究中使用的严谨的分析方法,强调了其在探索复杂教育主题方面的价值。

研究方法概述图
#

🔼 该图展示了研究中采用的文本挖掘方法的流程,该流程旨在识别和分析学生参与研究中的主题和趋势。整个过程分为五个阶段:搜索策略、数据收集、数据预处理、实证分析以及解释和报告。在“搜索策略”阶段,研究人员定义了学生参与的维度,并设置了在搜索查询中使用的关键词,最终在指定关键词和约束条件下创建了搜索字符串。接着,在“数据收集”阶段,研究团队选择了Scopus数据库作为数字数据源,从该数据源中下载特定领域的文章,并建立了一个包含42,517篇文章的经验语料库。在“数据预处理”阶段,文本被转换为小写,移除了数字、链接、标签、标点符号和停用词,对剩余的词汇进行了词干提取,并应用N-gram模型。最后,为实证分析创建了一个文档-词项矩阵。在“实证分析”阶段,研究人员实施了LDA模型进行主题建模分析,并检查了LDA发现的主题的一致性。他们重复使用不同的LDA先验参数值进行分析,直到达到最佳一致性。在最后的“解释和报告”阶段,对主题的范围和重点进行了解释,根据其范围和重点为主题分配了适当的标签,并以清晰的演示文稿报告了分析的结果和推论。此图总结了通过文本挖掘识别学生参与研究趋势的系统性方法。

2010-2019年主题加速趋势
#

🔼 该图表展示了2010年至2019年间,学生参与度研究中各个主题的加速趋势。图表以水平条形图的形式呈现,横轴代表加速值,正值表示主题研究的加速增长,负值表示主题研究的减速。纵轴列出各个研究主题。图表分为上下两部分,清晰展示了加速增长和减速的主题。

在加速增长方面,“动机”(Motivation)以2.63的加速值位居榜首,表明该主题的研究在过去十年中显著增加。紧随其后的是“医学教育”(Medical Education),其加速值为1.11,显示出该领域对学生参与度研究的日益重视。“评估”(Assessment)的加速值为1.04,也呈现出显著增长,这可能与在线学习评估和学生反馈的关注度提高有关。“行为参与”(Behavioral Engagement)和“体育活动”(Physical Activity)的加速值分别为0.41和0.38,表明这些领域的研究也有所增加,但增速相对较慢。“学习技术”(Learning Technology)和“外语学习”(EFL)的加速值分别为0.24和0.22,增长相对温和。

在减速方面,“学习发展”(Learning Development)主题的加速值为-1.96,显示其研究增长速度显著减缓。这可能是因为该领域的研究已经相对成熟,研究人员开始转向其他新兴领域。另外,“教师教育”(Teacher Education)、“学校参与”(School Engagement)、“社会参与”(Social Engagement)、“管理”(Management)、“认知参与”(Cognitive Engagement)、“社区参与”(Community Engagement)和“高等教育”(Higher Education)等主题的研究也呈现出不同程度的减速趋势,加速值分别为-0.95、-0.87、-0.76、-0.53、-0.39、-0.37和-0.13。“科学、技术、工程和数学”(STEM)主题的加速值略微下降,为-0.08。

总的来说,该图表清晰地揭示了学生参与度研究领域在过去十年中的动态变化,显示出研究焦点从传统的学习发展转向更关注动机、评估和行为参与。这些发现对于研究人员和教育工作者了解该领域的发展趋势,并制定相应的研究和教学策略具有重要意义。

深度解读
#

学生参与趋势
#

本研究通过机器学习技术分析了2010年至2019年间发表的42,517篇同行评审期刊文章,揭示了学生参与研究的主要趋势和主题。研究发现,除了现有的学生参与维度外,还新增了‘社区参与’和‘学校参与’两个维度。未来的研究预计将集中在以动机为导向的工具和方法、社会和行为参与等维度,以及特定学习环境如英语作为外语(EFL)和科学、技术、工程和数学(STEM)领域。这些发现为学生参与研究提供了新的方向,特别是在在线学习和混合学习环境中,学生参与的重要性日益凸显。

方法论创新
#

本研究采用了基于概率主题建模的半自动化文本挖掘方法,首次对学生参与研究领域进行了全面的主题分析。传统的系统综述方法通常只能手动分析有限数量的文章,而本研究通过LDA(潜在狄利克雷分布)算法,能够自动分析大量文献,揭示隐藏的语义结构。这种方法不仅提高了分析的效率,还提供了更全面的研究视角。然而,该方法也存在一定的局限性,例如主题标签的确定依赖于研究者的主观判断,未来研究可以通过结合其他文本挖掘技术来进一步优化。

动机与参与
#

动机在学生参与研究中占据了重要地位,研究发现,动机与学生的学术成就密切相关。通过分析42,000多篇文章,本研究发现‘动机’主题的研究数量在过去十年中显著增加,且其加速趋势最为明显。动机不仅影响学生的学习行为,还直接关系到他们的情感和认知参与。未来的研究可以进一步探索如何通过技术手段(如个性化学习系统)来增强学生的学习动机,从而提高他们的参与度和学习效果。

特定学习环境
#

学生参与研究在多个特定学习环境中得到了广泛应用,特别是医学教育、EFL(英语作为外语)和STEM(科学、技术、工程和数学)领域。研究发现,医学教育中的学生参与研究呈现出明显的增长趋势,这与医学教育的实践性和学生的高度参与性密切相关。EFL和STEM领域的研究也显示出较高的加速趋势,表明这些领域的学生参与研究正在成为热点。未来的研究可以进一步探索如何在这些特定学习环境中设计更有效的参与策略。

未来研究方向
#

本研究揭示了学生参与研究的未来方向,特别是随着学习技术的快速发展,个性化、情境感知和自适应学习系统将在学生参与研究中发挥更大作用。未来的研究可以进一步探索如何利用这些先进技术来支持学生的学习发展,特别是在动机和行为参与方面。此外,情感参与作为一个重要的维度,目前的研究还不够成熟,未来的研究可以更多地关注情感参与对学生学习成果的影响。总体而言,学生参与研究的主题将继续扩展和多样化,为教育领域提供更多的创新思路。

完整论文
#