Skip to main content
  1. 论文/

11,310个简体中文词语的效价和唤醒度评分

·8979 words·18 mins
效价 唤醒度 具体性 习得年龄 中文词语 跨语言比较 情感体验 心理语言学 情感神经语言学
Table of Contents

✏️ Xu Xu
✏️ Jiayin Li
✏️ Huilin Chen

要点总结
#

研究背景与问题:情感体验在我们的生活中占据重要地位,语言与情感的关系一直是跨学科研究的焦点。尽管已有多种语言的情感词汇数据库,但中文的情感词汇数据库相对较少。本研究旨在填补这一空白,为11,310个简体中文词汇提供情感效价(valence)和唤醒度(arousal)的评分。这些词汇主要来自MELD-SCH数据库,涵盖了双字词、三字词和四字词。通过与已有的小样本情感评分进行比较,验证了这些评分的有效性。

方法论与贡献:研究通过在线调查收集了2949名参与者的评分,最终保留了2421名参与者的数据。参与者被随机分配进行效价或唤醒度的评分任务。研究结果显示,效价评分的可靠性高于唤醒度评分,且与之前的中文词汇情感评分高度一致。此外,研究还探讨了效价和唤醒度与其他词汇属性(如词频、具体性、习得年龄)的关系,并进行了跨语言的比较,揭示了文化和社会政治对情感表达的影响。

关键要点
#

论文重要性
#

这项研究的意义在于:它为中文情感词汇的研究提供了大规模的数据支持,进一步丰富了MELD-SCH数据库,使其成为一个更为全面的心理语言学研究工具。这些情感评分不仅有助于理解中文词汇的情感属性,还为跨语言的情感研究提供了基础。未来研究可以基于这些数据,进一步探讨情感与语言处理的关系,特别是在临床心理学和自然语言处理领域的应用。此外,跨语言的比较研究也为理解文化对情感表达的影响提供了新的视角。


图表分析
#

图1:临床心理学和自然语言处理领域引用ANEW或Warriner等文章的数量
#

🔼 图1展示了自2000年初以来,在临床心理学和自然语言处理两个领域中,引用Affective Norms for English Words (ANEW) 或 Warriner et al. 作为研究工具的期刊文章数量。图表清晰地表明,在这两个领域中,对情感词汇规范数据库的利用呈现出显著的增长趋势。在临床心理学领域,引用量呈现稳定增长态势,表明该数据库在研究情绪障碍、心理健康以及相关疾病方面的重要性日益凸显。自然语言处理领域中,引用量的增加幅度更为显著,这反映了情感分析、意见挖掘等技术在文本处理和人工智能领域的快速发展。总体而言,该图有力地证明了情感词汇规范数据库在跨学科研究中的广泛应用和重要价值。该图对论文的贡献在于,它通过数据可视化的方式,直观地展现了情感词汇规范数据库在学术研究中的实际应用程度和影响力,支持了论文中关于情感词汇研究重要性的论点。这部分内容强调了该研究的背景和价值,也引出了后续的研究内容。

更多图表分析

ANEW在不同领域的引用量
#

🔼 该图表为柱状图,展示了自2002年以来,在临床心理学和自然语言处理两个领域中,引用 ANEW(Affective Norms for English Words)研究工具的期刊文章数量。横轴表示年份,从2002年到2020年,纵轴表示期刊文章的数量。图例区分了临床心理学(黑色)和自然语言处理(黄色)两个领域。在2002年至2010年间,两个领域的引用量均较低,均低于20篇。2011年之后,两个领域的引用量均开始上升。自然语言处理领域的引用量明显高于临床心理学领域,尤其是在2014年之后,自然语言处理的引用量增长迅速,在2020年达到峰值,超过70篇。而临床心理学领域的引用量增长相对平缓,最高也只在2018年左右达到接近30篇。整体来看,自然语言处理领域对 ANEW 的使用远超临床心理学领域。该图表说明 ANEW 作为一种情感词汇工具,在自然语言处理领域具有广泛的应用价值和影响力,并反映了该领域对情感分析和词汇情感属性研究的重视。同时,临床心理学领域虽然引用量较少,但也在稳定增长,表明 ANEW 在该领域也有一定的应用前景,可用于研究情感词汇与心理健康之间的关系。总而言之,此图有效地展示了 ANEW 在不同领域的学术影响力和应用趋势,强调了情感词汇资源在多学科研究中的重要性。

中国被试的地理分布
#

🔼 该图为柱状图,展示了参与词语效价(valence)和唤醒度(arousal)评分的被试的地理分布。图表横轴代表频率(Frequency),纵轴列出了不同的地理区域,包括华中,华东,华北,东北,西北,海外和西南地区。每区域分别使用黄色和黑色柱状条代表,黄色代表为唤醒度评分的参与者数量,黑色代表效价评分的参与者数量。从图中可以看出,华东地区的被试数量最多,无论是在效价评分还是唤醒度评分上,都明显高于其他地区,且两类评分的被试数量都超过了400人。华中地区的被试数量也相对较多,两项评分的被试数量均在300以上。相比之下,其他地区的被试数量相对较少。其中,海外地区的被试数量最少,两项评分的被试数量均低于100人。东北和西北地区的被试数量相近,两项评分的被试数量都在100人左右。西南地区的被试数量略高于东北和西北,但仍低于华东和华中。整体而言,参与唤醒度评分的被试人数在各地区都略高于参与效价评分的人数。这张图表明,研究的参与者主要来自中国东部和中部地区,而其他地区的参与者相对较少。 这可能反映了中国人口的分布和在线研究参与者的招募情况。此外,可以看出,对于每个地区,进行唤醒度评分的参与者人数略高于效价评分,但差别不大。该图强调了数据收集的地理偏向性,也为后续分析提供了背景信息,有助于理解研究结果的地域差异性。

跨研究效度:效价与唤醒
#

🔼 该图表为散点图,展示了本研究与Wang et al.(2008)研究中效价和唤醒评分的跨研究一致性。左图展示了效价评分的比较,横轴为Wang et al.(2008)研究的效价评分,纵轴为本研究的效价评分,两个研究的效价评分都使用了不同的量表,在视觉上呈现出明显的线性关系。散点集中分布在一条斜线上,表明两个研究的效价评分高度一致。这种一致性说明两个研究在测量词语情感效价方面具有很高的可靠性,验证了本研究的效价评分的效度。具体而言,Wang et al.(2008)研究中得分较高的词语,在本研究中也获得了较高的评分,反之亦然。右图展示了唤醒评分的比较,横轴为Wang et al.(2008)研究的唤醒评分,纵轴为本研究的唤醒评分。与效价图类似,散点也呈现出相对集中分布的趋势,但相较于左图的效价评分,散点分布更为分散,没有像效价评分那样明显的线性关系。这表明两个研究在测量词语唤醒度方面虽然存在一定的相关性,但一致性不如效价评分高,暗示唤醒的测量可能存在更多的主观性和变异性。此外,唤醒评分的散点图斜率也比效价评分的更平缓,这或许是由于两个研究使用的唤醒评分量表差异所致,或者反映了唤醒度本身在跨研究间的变异性。总而言之,该图表直观地显示了本研究的效价评分具有较高的跨研究效度,而唤醒评分的跨研究一致性相对较弱,强调了在情感词汇研究中对效价和唤醒的不同性质进行区分的重要性。图表下方的文字说明进一步明确了图表的主题,即跨研究效度验证。

跨研究效度:效价与唤醒度
#

🔼 本图展示了本研究与Yee(2017)研究中效价(valence)和唤醒度(arousal)评级的一致性。图表由两个散点图组成,左侧图显示了两个研究中效价评级之间的关系,右侧图显示了两个研究中唤醒度评级之间的关系。横轴代表Yee(2017)研究中的评级,纵轴代表本研究中的评级。每个点代表一个词,其在两个研究中的评级值。图中还绘制了回归线,显示了两个研究评级之间的总体趋势。

对于效价评级,散点图显示出明显的正相关关系,即在Yee(2017)研究中效价较高的词,在本研究中也倾向于获得较高的效价评级。点分布相对集中在回归线附近,表明两个研究在效价评级上具有较高的一致性。这种一致性表明效价评级在不同研究之间具有较高的可靠性,从而支持了效价作为情感词汇一个重要维度的有效性。

而对于唤醒度评级,散点图显示出较弱的相关性,点的分布更加分散,表明两个研究之间在唤醒度评级上的一致性相对较低。回归线的斜率也比效价评级的回归线平缓。这种差异可能源于唤醒度本身主观性较强,受个体差异和情境因素影响较大。两个研究之间评级标准的不同也可能导致这种差异。

总的来说,图表清晰地展示了效价评级在不同研究间具有较好的一致性,而唤醒度评级的一致性相对较低。这进一步验证了研究中效价和唤醒度作为两个不同的情感维度,且效价维度可能比唤醒度维度具有更高的稳定性和共识性。该图表支持了文章的论点,即在情感词汇的评级中,效价和唤醒度是两个独立的维度,且效价的测量更加可靠。

效价与唤醒度散点图
#

🔼 该图为效价(Valence)与唤醒度(Arousal)的散点图,展示了11310个简体中文词汇在这两个情感维度上的分布情况。横轴表示效价,取值范围从-3到+3,其中-3代表极度负向情感,+3代表极度正向情感,0代表中性情感。纵轴表示唤醒度,取值范围从0到4,其中0代表极低唤醒度,4代表极高唤醒度。每个点代表一个词汇,其在图中的位置反映了该词汇在效价和唤醒度上的平均得分。图中的点的分布呈现出明显的非线性关系,形成一个类似心形的结构,中间部分点最密集,两侧逐渐稀疏。这种结构表明,中性词汇的唤醒度通常较低,而高唤醒度的词汇往往带有强烈的正向或负向情感。 具体来说,从图中可以看出,唤醒度较高的词汇主要分布在效价轴的两端,即高度负向和高度正向的区域,这意味着无论是积极的还是消极的情感体验都可能伴随着较高的生理唤醒水平。而接近效价轴中心,即情感倾向不明显的词汇,其唤醒度通常较低。这种分布趋势与心理学研究中情感的环状模型相符,该模型认为情感体验在效价和唤醒度两个维度上呈环形分布。该图清晰地展示了效价和唤醒度之间的复杂关系,为研究者提供了直观的数据参考,同时也支持了心理学中关于情感体验的二维理论框架。此外,此图也验证了研究中效价和唤醒度之间的关系,为后续分析提供了基础。该图的布局相对清晰,尽管点比较密集,但整体趋势依然可以辨识,有助于理解大规模词汇的情感属性分布,展示了情感词汇在二维情感空间中的分布模式,是论文中的重要组成部分。

具体性与唤醒度关系图
#

🔼 该图展示了具体性(concreteness)与唤醒度(arousal)之间的关系。横轴表示具体性,数值从 1 到 5,其中 1 代表“非常具体”,5 代表“非常抽象”。纵轴表示唤醒度,数值从 0 到 4。图中的每个点代表一个词语,其在具体性和唤醒度上的评分。整体而言,图表呈现出一种分散的分布模式,而非明显的线性关系。大部分数据点集中在唤醒度1.00至3.00之间。该图表明,词语的具体性与唤醒度之间没有明显的直接关联。虽然在某些区域,例如,具体性评分接近2.0时,唤醒度的分布相对集中,但是整体而言,不同具体性的词语可以对应不同程度的唤醒度。具体来说,无论词语是具体还是抽象,它们的唤醒度都可能较高或较低,没有明显的规律。图中可见一条浅色的回归线,表示整体的趋势,即具体性略微提高唤醒度。从内容分析来看,该图的主要目的是展示两个变量之间的关系,而不是强调特定区域的数据。与研究问题的关联方面,该图为研究具体性与唤醒度之间是否独立或相关提供了数据。在批判性评估方面,该图的表达效果尚可,能够清晰地展示变量之间的分散关系,然而,如果能辅以统计数据,如相关系数,或增加不同具体性程度下唤醒度均值的比较,将更具说服力。可能需要更精细的分析以明确具体性和唤醒度之间的潜在关系。

效价评分的变异性
#

🔼 这张图展示了在七点量表上效价评分的变异性。横轴表示效价评分,从-3(极度负面)到+3(极度正面),而纵轴表示效价评分的标准差(SD)。图中每一个点代表一个词汇,其位置由该词汇的平均效价评分和评分标准差决定。从图中可以看出,在效价量表的中间区域,即接近0的位置,标准差较低,呈现出一个“花束状”的分布。这意味着,对于那些效价中性的词汇,评分者之间的意见较为一致,他们都倾向于认为这些词既不积极也不消极,具有较高的共识度。而随着效价评分向两端移动,即词汇变得更加积极或更加消极时,评分的标准差逐渐增大,即评分者之间的意见开始出现分歧。特别是在-1和+1的附近,标准差明显较高,说明对于中间偏负面和中间偏正面的词语,评分者之间的主观感受差异较大。这种分布形态与以往研究结果相符,表明在效价评估中,中性词汇的共识度通常高于极端词汇。同时,该图的清晰展示有助于研究者理解词汇效价评分的内部一致性,并在进行研究设计时,充分考虑到这种变异性,避免因使用变异性过大的词汇而影响研究结果的准确性。该图与文中关于效价可靠性的讨论相呼应,强调了效价作为情感维度,其可靠性受到词语效价本身属性的影响。整体来说,该图说明了效价评分的分布情况及其变异性,为后续基于情感词汇的研究提供重要参考。这一发现对理解情感词汇的心理现实具有重要意义,并可用于优化词汇选择和实验设计。

年龄获取评级的可变性
#

🔼 这张图表展示了年龄获取(AoA)评级的变异性,横轴代表词语的年龄获取值,纵轴代表这些评级的标准差(SD)。图中的每一个点代表一个词语,其位置根据该词的平均AoA值及其评级标准差确定。从图中可以看出,AoA评级标准差随平均AoA值的增加而增加,呈现出一种线性的正相关关系。这意味着,人们在早期习得的词汇的年龄获取评级上更为一致,而对于较晚习得的词汇,评级者的意见差异较大。这种现象可能是因为早期习得的词汇通常更为基础和常见,而后期习得的词汇则更多样化,并且每个人的学习经验可能不同,导致对词汇习得时间的评估存在差异。此外,图表中的点分布呈现出一种“纺锤形”,即大部分的点集中在中间,而两侧较少,这也暗示了大多数词汇的AoA值处于一个中间范围,并且这些词汇的评级变异性也相对较高。总体而言,这张图表清晰地展示了AoA评级的可变性与词汇习得年龄之间的关系,为了解词汇的心理表征提供有价值的见解。对词汇的获取年龄与评级变异性的研究,有助于我们深入理解语言学习和认知发展的过程,以及个体差异在语言习得中的作用。

Arousal Rating变异性
#

🔼 该图为散点图,展示了在5点量表上,词语的唤醒度评分的标准差(SD)与平均唤醒度之间的关系。横轴表示词语的平均唤醒度,取值范围为0到4。纵轴表示词语唤醒度评分的标准差,即评分者之间在唤醒度评定上的差异程度。图中每一个点代表一个词语,点的位置由该词的平均唤醒度和标准差决定。从整体分布来看,大多数词语的唤醒度评分标准差在0.75到1.25之间,形成了一个相对密集的云状区域,这表明大部分词语在唤醒度上的评分存在一定程度的差异。值得注意的是,当词语的平均唤醒度接近量表中间值(约2.0)时,评分的标准差往往较大,而当唤醒度接近两端时,标准差趋于较小。这说明对于唤醒度适中的词语,不同评分者之间的理解和感受差异较大,而在唤醒度极端(极高或极低)的词语上,评分者的观点则更趋于一致。该图与文章中描述的唤醒度评分特点相符,即评分者在词语唤醒度方面的共识程度低于词语效价,体现了个人对唤醒程度感知的主观性,与理论研究结果相符。该图可以帮助研究者理解在研究中使用唤醒度评级时,需要注意哪些数据分布特点,并做出更严谨的分析和解释。

情感词汇的二维分布
#

🔼 该图为情感词汇的二维分布图,展示了情绪词在效价(valence)和唤醒(arousal)两个维度上的分布情况。图中分别展示了两组情绪词的分布,左侧图似乎展示的是原始的英语情绪词,而右侧图展示的是根据本研究中数据所得的25个情绪词的分布。两个图的横轴大致表示效价,从左到右代表从负面到正面的情感,纵轴大致表示唤醒程度,从下到上代表从低到高的唤醒程度。 在左侧图中,位于左下象限的词语,如“Miserable”,“Depressed”,“Sad”,“Gloomy”和“Bored”,表示负面效价和低唤醒状态的情绪。右上象限的词语,如“Excited”,“Astonished”和“Delighted”,表示正面效价和高唤醒状态的情绪。左上象限的词语,如“Alarmed”,“Afraid”,“Tense”和“Angry”,表示负面效价和高唤醒状态的情绪。右下象限的词语,如“Calm”,“Relaxed”和“At Ease”,表示正面效价和低唤醒状态的情绪。 右侧图中,情绪词的分布与左侧图相似,但有一些细微差别。如,“Glad”,“Happy”,“Pleased”位于右上象限,表示正面效价和中高唤醒程度;“Content”,“Satisfied”等位于右下象限,表示正面效价和低唤醒程度;“Miserable”,“Sad”,“Depressed”,“Gloomy”,“Bored”等位于左下象限,表示负面效价和低唤醒程度;“Angry”,“Frustrated”,“Tense”,“Annoyed”和“Distressed”等位于左上象限,表示负面效价和高唤醒程度。 总体而言,两图都符合Russell的环形情绪模型,表明情绪在二维空间中可以被系统地组织。这些分布提供了对不同情绪词的效价和唤醒程度的直观理解。右侧图为本研究的数据结果,可以与左侧的原始模型进行对比,以确认不同文化背景下对情绪词的认知是否存在差异。这有助于我们理解情绪词的语义结构,对情感心理学,语言学等领域的研究具有重要意义。

25个情绪词的二维分布
#

🔼 这张图表(Fig. 12)展示了25个情绪词在二维空间中的分布情况,横轴代表效价(valence),从负向到正向,纵轴代表唤醒度(arousal),从低到高。图中的每个点代表一个情绪词,其位置由该词的效价和唤醒度评分决定。在效价维度上,情绪词从左至右逐渐由负面情绪(如“悲伤”、“沮丧”、“厌烦”)过渡到中性情绪,再到正面情绪(如“平静”、“满足”、“快乐”)。在唤醒度维度上,情绪词从下至上逐渐由低唤醒度(如“平静”、“疲倦”)过渡到高唤醒度(如“兴奋”、“愤怒”)。此图呈现出情绪词分布的基本模式,证实了情绪体验通常可以用效价和唤醒度两个维度来描述,并支持了Russell的情绪环形模型。这与图11中基于英文情绪词的环形模型布局大致匹配,表明不同语言使用者在情绪概念的理解上存在相似性,同时也为跨语言的情绪研究提供了有价值的参考,虽然具体的文化背景和社会因素也可能会影响情绪词的理解和使用。此外,图中的情绪词分布并不是完全均匀的,例如,高唤醒度和负效价的情绪词(如“愤怒”)和高唤醒度和正效价的情绪词(如“兴奋”)都相对集中分布,而低唤醒度的情绪词则相对分散一些,这可能反映了人类情绪体验的一些内在结构。该图为理解情绪的二维结构提供了直观的视觉呈现。

深度解读
#

情感词汇库
#

本研究为11,310个简体中文词汇提供了情感效价(valence)和唤醒度(arousal)的评分,进一步丰富了MELD-SCH数据库。情感效价和唤醒度是情感体验的两个核心维度,效价反映了词汇的积极或消极情感,而唤醒度则反映了词汇引发的情感强度。通过大规模的数据收集,研究者不仅验证了这些评分与先前小样本研究的一致性,还揭示了中文词汇在情感表达上的独特性。这一数据库的建立为心理学、自然语言处理和情感神经科学等领域的研究提供了宝贵的工具,尤其是在跨语言比较和文化差异研究中。此外,研究还发现,效价评分的可靠性显著高于唤醒度评分,这可能与效价的双极性质有关,即人们更容易在积极和消极之间达成共识,而唤醒度的感知则更具个体差异。

跨文化比较
#

通过对比中文和英文词汇的情感效价和唤醒度评分,研究发现不同语言和文化背景下情感表达的异同。中文和英文在情感词汇的组织上存在相似性,尤其是在效价和唤醒度的曲线关系上,这与Russell的情感环状模型一致。然而,研究也揭示了显著的跨文化差异。中文词汇中高度积极的词汇往往与国家利益和集体价值观相关,如“国泰民安”和“见义勇为”,而英文词汇中高度积极的词汇则更多与个人情感和体验相关,如“happiness”和“vacation”。这种差异反映了集体主义与个人主义文化的不同影响。此外,中文词汇中高度消极的词汇也更多涉及国家耻辱和犯罪行为,如“丧权辱国”和“卖国贼”,而英文词汇中则更多涉及疾病和暴力犯罪。这些发现表明,情感词汇的选择和评价受到文化和社会背景的深刻影响。

情感效价与唤醒度
#

本研究深入探讨了情感效价和唤醒度的关系及其在词汇处理中的作用。效价和唤醒度之间存在曲线关系,即无论是积极还是消极的词汇,其情感强度越高,唤醒度也越高。这一发现与多种语言的研究结果一致,表明情感效价和唤醒度的关系具有跨语言的普遍性。然而,研究也指出,效价评分的可靠性显著高于唤醒度评分,这可能是因为效价的双极性质使得人们更容易在积极和消极之间达成共识,而唤醒度的感知则更具个体差异。此外,研究还发现,情感效价和唤醒度对词汇处理效率的贡献有限,尤其是在控制了词汇频率和习得年龄后,情感变量对词汇决策任务的影响较小。这表明,情感词汇的处理可能更多依赖于词汇的语义和结构特征,而非情感维度本身。

性别差异
#

研究还探讨了性别在情感词汇评分上的差异。女性在效价评分上倾向于给出更积极的评价,而男性在唤醒度评分上则倾向于给出更高的评分。尽管这些差异的幅度较小,但它们与先前的研究结果一致,表明性别在情感体验和表达上存在细微但显著的差异。具体而言,女性对积极词汇的评分更高,对消极词汇的评分更低,而男性则对高唤醒度词汇的评分更高。这种性别差异可能与情感处理中的社会化和文化因素有关,女性通常被认为更善于表达情感,而男性则更倾向于关注情感强度。此外,研究还发现,性别差异在效价评分上更为显著,而在唤醒度评分上则相对较弱,这可能进一步支持了效价在情感体验中的核心地位。

未来研究方向
#

本研究为未来的情感词汇研究提供了多个方向。首先,未来的研究可以进一步探讨情感词汇在不同文化和社会背景下的表达差异,尤其是在全球化背景下,跨文化情感表达的趋同与分化。其次,研究可以扩展情感词汇库的规模,涵盖更多语言和方言,以揭示情感表达的普遍性和特殊性。此外,情感词汇的神经机制研究也是一个重要的方向,尤其是通过脑成像技术探讨情感词汇处理的大脑活动模式。最后,情感词汇库的应用潜力巨大,尤其是在临床心理学和情感障碍治疗中,情感词汇的评估和干预可能成为新的治疗手段。未来的研究还可以结合自然语言处理技术,开发基于情感词汇库的自动化情感分析工具,为社交媒体、市场分析和心理健康监测提供支持。

完整论文
#