要点总结 #
随着越来越多的人与聊天机器人互动,了解用户如何感知和评估它们变得至关重要。本研究通过在线实验(N=416)探讨了自由文本与按钮交互机制以及社交与中性错误响应对用户感知的影响。研究发现,自由文本交互并未增加用户接受度,反而按钮交互更受青睐,可能是因为用户认为自由文本聊天机器人不够温暖和有能力。此外,社交错误响应仅提高了用户满意度,但对其他结果变量没有显著影响。
研究结果表明,按钮交互在用户感知温暖、能力、满意度和使用意图方面表现更好,而社交错误响应仅在提高用户满意度方面有效。研究还发现,感知温暖和能力在交互机制对用户满意度、使用意图和情感连接的影响中起到了中介作用。这些发现挑战了现有的“媒体即社交参与者”范式,表明在任务导向的背景下,用户更注重聊天机器人的可用性而非其拟人化程度。
关键要点 #
论文重要性 #
这项研究对设计和优化客户服务聊天机器人具有重要指导意义。研究结果表明,按钮交互在任务导向的背景下更受用户欢迎,而社交错误响应虽然能提高用户满意度,但其影响有限。这些发现挑战了现有的“媒体即社交参与者”范式,表明在任务导向的背景下,用户更注重聊天机器人的可用性而非其拟人化程度。未来的研究可以进一步探讨在不同任务类型和文化背景下,交互机制和错误响应对用户感知的影响。
图表分析 #
不同交互机制和错误反馈对用户的影响 #
🔼 本研究探讨了用户与客户服务聊天机器人交互时,不同的交互机制(自由文本 vs. 按钮)和错误反馈(社交 vs. 中性)如何影响用户体验。研究发现,与假设相反,自由文本交互并没有提高用户的接受度。相反,用户更喜欢通过按钮进行交互,这可能是因为他们认为自由文本聊天机器人不够热情和专业。有趣的是,社交错误反馈仅提高了用户满意度,而对其他指标没有显著影响。具体而言,使用按钮交互的聊天机器人比自由文本交互的聊天机器人获得更高的用户评价,包括感知到的温暖度、能力、满意度和使用意愿。当用户通过按钮与聊天机器人交互时,他们觉得聊天机器人更容易使用,也更有效率。这表明,在设计聊天机器人时,用户体验的便捷性和效率可能比追求人机交互的“人性化”更重要。此外,社交错误回应,如道歉和承认不足,可以有效提升用户满意度,但似乎不足以显著改变用户对聊天机器人的整体看法或与公司建立情感联系。研究还揭示了用户对聊天机器人的温暖和能力的感知,在交互机制与用户满意度、使用意愿和情感连接之间的关系中起着重要的中介作用。然而,这些中介效应的方向与预期相反,这表明,当用户认为聊天机器人易于使用时,其温暖度和能力也会相应增加。这项研究的结果挑战了“媒体即社会行动者”(MASA)范式在特定场景下的适用性,特别是在以任务为导向的客户服务环境中。它突出了用户体验和可用性在技术设计中的重要性。此外,研究还强调了社交线索在某些情况下可能会产生反作用,例如当用户认为聊天机器人的错误反应与预期的不一致时。总而言之,该研究表明,在设计客户服务聊天机器人时,需要仔细权衡不同交互机制和错误反馈策略的影响,并优先考虑易用性和效率。
更多图表分析
聊天机器人界面截图 #
🔼 该图展示了论文中实验所使用的两种聊天机器人界面,分别是按钮式交互界面和自由文本输入界面。按钮式界面(左侧)主要通过预设的按钮选项引导用户进行交互,用户只需点击按钮即可完成操作,例如“订单”、“配送”和“主菜单”等。在选定一个主要类别后,会出现更具体的按钮选项,例如在“订单”类别下有“选项”、“费用”、“跟踪”等。这种方式简化了用户的输入过程,并提供了明确的操作路径。自由文本输入界面(右侧)则允许用户直接输入文字进行提问,例如“我的订单在哪里?”。这种方式更接近自然语言交流,但同时也要求用户有更明确的提问意识。这两种界面在实验中用于研究不同的交互方式对用户体验的影响。图中的元素包括:聊天机器人的名称“Mika”,用户与聊天机器人的对话气泡,以及按钮或文本输入区域。按钮式交互界面通过清晰的按钮标签引导用户,避免了自由文本输入的模糊性,但可能限制了用户的个性化表达。自由文本输入界面虽然更加灵活,但也对用户的表达能力和聊天机器人的理解能力提出了更高的要求。论文通过对比这两种界面,分析了交互方式对用户满意度、使用意愿等的影响。在按钮式界面,用户可以通过点击按钮快速找到自己需要的信息。在文本输入界面,用户可以以更自由的方式提问,例如“我想知道更多关于退货的信息?”,然后输入“不”,会提示用户“请选择一个选项”。整体而言,图示内容主要展示了实验中对聊天机器人界面的设计。通过对比这两种不同的交互方式,可以更好的探索用户和聊天机器人交互过程中的偏好和体验,以便未来开发更高效、用户友好的聊天机器人系统。

中介效应分析图 #
🔼 该图展示了交互机制(按钮 vs. 自由文本)通过感知温暖和感知能力对用户满意度、使用意愿以及与公司情感联系的中介效应分析结果。研究结果表明,与按钮交互相比,自由文本交互导致用户对机器人的感知温暖度降低,进而负面影响用户的满意度、使用意愿和与公司情感联系。具体来说,自由文本交互通过降低用户的感知温暖度,间接地降低了用户的满意度、使用意愿和情感联系,且这种间接效应显著。此外,对于使用意愿,感知温暖度在交互机制和使用意愿之间起到了部分中介作用,即除了感知温暖度的间接影响外,交互机制本身也对使用意愿有直接的负面影响。对于情感联系,感知温暖度起到了完全中介作用,自由文本交互降低情感联系完全是通过降低感知温暖度来实现的。这些结果挑战了传统的观点,即自由文本交互因更人性化而受到欢迎,研究表明在特定任务导向的背景下,用户可能更偏好结构化的按钮交互方式,因其便捷易用。此外,该图还表明,感知能力的中介效应也与感知温暖度类似,自由文本交互降低感知能力,进而负面影响用户的满意度、使用意愿和与公司情感联系。这些发现表明,在设计聊天机器人时,不仅要考虑交互的人性化,还要充分考虑交互机制对用户体验的直接和间接影响。在客户服务等任务导向的环境中,用户更看重易用性和效率,而不是单纯追求人性化的交互机制,这为聊天机器人的设计提供了宝贵的指导。

图 2: 实验中使用的按钮和自由文本聊天机器人示例屏幕截图 #
🔼 图2展示了本研究中使用的两种聊天机器人界面,分别为按钮式和自由文本式。左侧的按钮式聊天机器人界面提供了一系列预设的选项按钮,用户可以通过点击这些按钮来选择他们的请求或问题。这种方式简化了用户的输入过程,使其无需手动输入文字,只需在提供的选项中选择即可。这种设计旨在提高交互的便捷性和效率,特别是对于那些不熟悉键盘输入的用户或在移动设备上操作的用户。右侧的自由文本聊天机器人界面则允许用户通过键盘自由输入文字来表达他们的请求。这种方式模拟了人与人之间对话的自然方式,允许用户更灵活地表达,并提供更个性化的交互体验。用户可以根据自己的需求自由地输入问题或请求,而不仅仅局限于预设的选项。两种界面都具有清晰的布局,方便用户理解和操作,同时为后续实验提供了可控的交互环境。按钮式的界面侧重于结构化的选择和便捷的操作,而自由文本式界面则侧重于开放式的输入和自然的对话,体现了两种不同交互方式的核心特点。实验结果表明用户在实验中更偏好按钮式交互, 这可能是因为按钮式在易用性上更具优势, 减少了用户输入时所需要的认知负荷。用户在熟悉基于鼠标点击的交互方式后,会感觉按钮式交互更简单高效。同时,按钮式预设的选项也可能更贴合研究中的问题,而自由文本则需要用户思考如何组织语言。而自由文本的输入方式,可能因为需要额外的打字输入,降低用户体验, 使得用户感觉不那么温暖和亲切。

研究变量相关性 #
🔼 该表格展示了研究中使用的五个变量:感知温暖度、感知能力、满意度、使用意愿以及与公司情感联系的描述性统计、双变量相关性和克隆巴赫α值。变量定义与测量:
-
感知温暖度 (Perceived Warmth): 指的是用户对聊天机器人的友好度、好感度和社交性的评价。研究中使用的是Godspeed问卷中的好感度量表,包含5个项目,每个项目使用七点语义差异量表进行评估。本研究中该量表的 α 值为 0.93,表明量表内部一致性良好,平均值为 5.43,标准差为 1.05。
-
感知能力 (Perceived Competence): 指的是用户对聊天机器人的智能、能力和自主性的评价。研究中使用的是Godspeed问卷中的感知智能量表,包含5个项目,每个项目使用七点语义差异量表进行评估。本研究中该量表的 α 值为 0.87,表明量表内部一致性良好,平均值为 4.87,标准差为 1.05。
-
满意度 (Satisfaction): 指的是用户对聊天机器人体验是否满足其需求和期望的程度。研究采用了Cheng和Jiang(2020)提出的3个项目,使用7点李克特量表进行测量。本研究中该量表的 α 值为 0.74,表明量表内部一致性良好,平均值为 5.03,标准差为 1.44。
-
使用意愿 (Intention to Use): 指的是用户未来继续使用聊天机器人的意愿。研究采用了Cheng和Jiang(2020)提出的3个项目,使用7点李克特量表进行测量。本研究中该量表的 α 值为 0.88,表明量表内部一致性良好,平均值为 4.20,标准差为 1.60。
-
与公司情感联系 (Emotional Connection with the company): 指的是用户与公司之间的情感亲和力。研究改编自 Christodoulides et al. (2006) 的量表,使用了两个项目,使用7点李克特量表进行测量。本研究中该量表的 α 值为 0.92,表明量表内部一致性良好,平均值为 4.16,标准差为 1.48。**相关性分析:**表格中的相关性分析显示,所有变量之间都存在显著的正相关关系 (p < .001)。具体而言:
-
感知温暖度与感知能力之间的相关系数为0.67,表明用户认为聊天机器人越友好,也越可能认为其能力更强。
-
感知温暖度、感知能力与满意度的相关性分别为0.61和0.74,表明用户对聊天机器人的温暖度和能力评价越高,对聊天机器人的满意度也越高。
-
使用意愿与感知温暖度、感知能力、满意度的相关系数分别为0.88、0.55和0.63,表明用户对聊天机器人评价越高,未来使用该机器人的意愿也越强。
-
与公司情感联系与感知温暖度、感知能力、满意度以及使用意愿的相关系数分别为 0.92、0.60、0.70和0.59,表明用户对聊天机器人的评价越高,越有可能与该公司建立情感联系。**克隆巴赫α值:**每个变量的克隆巴赫α值都大于 0.7,表明量表具有较好的内部一致性。
**总结:**总的来说,该表格提供了关键研究变量的统计描述,并揭示了变量之间显著的正相关性。这些结果支持了用户体验与情感维度对聊天机器人评价的重要性。此外,这些数据为后续的假设检验和因果关系分析提供了基础。

研究变量的描述统计 #
🔼 表1展示了研究中使用的各个变量的描述性统计数据,包括均值(M)、标准差(SD)以及Cronbach’s alpha值(α)。此外,该表还提供了变量间的双变量相关性。具体来看,表中的变量包括:感知的热情度、感知的胜任力、满意度、使用意愿以及与公司的情感联系。所有变量间的相关性均在p < .001的水平上显著。这些数据为后续的统计分析提供了基础。 感知的热情度和感知的胜任力分别衡量用户对聊天机器人的友好程度和能力水平的评价。满意度测量用户对聊天机器人体验的总体满意程度。使用意愿则反映用户未来继续使用聊天机器人的意愿。情感联系评估用户与公司的情感联系程度。这些变量之间都存在显著的正相关关系,说明用户对聊天机器人体验的积极评价通常与对公司的积极态度相关联。从Cronbach’s alpha值来看,所有变量的内部一致性都较高,表明这些量表具有较好的信度。均值和标准差为进一步分析提供了参考,允许研究人员考察不同条件下这些变量的变化。这些数据对于理解聊天机器人交互体验的各个维度以及用户反应具有重要意义。这些信息将有助于深入分析用户如何评价聊天机器人及其对用户行为的影响,从而为设计更高效、用户友好的聊天机器人提供依据。

深度解读 #
交互机制影响 #
本研究发现,按钮式交互机制相较于自由文本输入,显著提升了用户对聊天机器人的感知温暖度、能力感、满意度、使用意愿以及与公司的情感连接。这一结果与预期相反,自由文本输入并未带来更高的用户接受度,反而因为用户认为其不够温暖和能力不足,导致负面评价。按钮式交互的优势在于其结构化的对话流程,减少了用户的认知负担,尤其是在任务导向的客户服务场景中,用户更倾向于选择简单、直观的交互方式。这一发现挑战了传统的“媒体即社交主体”(MASA)范式,表明在任务导向的交互中,可用性可能比拟人化的交互机制更为重要。未来的研究可以进一步探讨在不同任务类型(如情感支持或复杂问题解决)中,交互机制的影响是否有所不同。
错误响应效果 #
研究结果表明,社交化的错误响应(如道歉和承认错误)能够显著提升用户对聊天机器人的满意度,但对感知温暖度、能力感、使用意愿和与公司的情感连接影响不显著。这一发现部分支持了社交响应理论,即社交线索能够增强用户对媒体的积极反应。然而,社交化的错误响应并未在其他关键变量上产生显著效果,可能是因为其社交线索的强度不足以引发用户的深层次情感共鸣。这一结果提示,错误响应的设计在提升用户满意度方面具有一定潜力,但其对整体用户体验的影响可能有限。未来的研究可以探索更复杂的社交线索组合,以进一步验证其在提升用户感知方面的作用。
交互与错误响应 #
研究发现,交互机制与错误响应的组合并未显著影响用户对聊天机器人的整体评价。尽管预期自由文本交互与社交化错误响应的组合会增强用户的积极反应,但实际结果并未支持这一假设。唯一的显著交互效应出现在情感连接上,即按钮式交互与社交化错误响应的组合显著提升了用户与公司的情感连接。这一结果可能表明,按钮式交互在结构化任务中更具优势,而社交化错误响应则进一步增强了用户对公司的信任感。未来的研究可以进一步探讨不同交互机制与错误响应组合的效果,尤其是在更复杂或情感化的交互场景中。
感知温暖与能力 #
研究发现,感知温暖和能力在交互机制对用户反应的影响中起到了中介作用。自由文本交互降低了用户对聊天机器人的感知温暖和能力,进而导致满意度、使用意愿和情感连接的下降。这一结果表明,可用性是影响用户感知的关键因素,低可用性会削弱用户对聊天机器人的积极评价。此外,感知温暖和能力的中介效应进一步验证了其在用户评估新技术中的核心地位。未来的研究可以进一步探讨如何通过设计提升聊天机器人的可用性,从而增强用户的感知温暖和能力。
未来研究方向 #
本研究为未来的研究提供了多个方向。首先,真实场景下的验证是必要的,当前的实验环境可能无法完全反映用户在真实客户服务中的情感和行为反应。其次,跨文化研究可以进一步验证研究结果的普适性,尤其是在不同文化背景下,用户对交互机制和错误响应的反应可能有所不同。此外,复杂任务场景的研究也值得关注,当前的客户服务任务相对简单,未来可以探索在更复杂或情感化的交互中,交互机制和错误响应的效果是否有所不同。最后,长期研究可以揭示用户与聊天机器人交互的动态变化,尤其是感知温暖和能力在长期使用中的演变。
完整论文 #



















