在最近发表的一项研究中研究人员调查了专业疗愈师和AI聊天机器人(CHATGPT-4)是否可以通过人类区分的测试。
“机器可以思考吗?”是第二次世界大战后艾伦·图灵(Alan Turing)提出的一个简单的问题。自1900年代中期以来,技术已经明显发展,越来越多的证据表明,生成人工智能(Genai)可能会有所帮助心理治疗.此外,最近的研究揭示了Genai在心理疗法中作为辅助或独立解决方案的有希望的影响。最近的报告表明,AI可以共情地写入内容,这是由治疗师和表现优于专业人员的高度评价。
关于研究
在本研究中,研究人员测试参与者是否可以区分人类专家与AI机器人CHATGPT-4)的疗愈方法和结果。
受访者随机接收来自专家治疗师或Chatgpt-4的疗愈咨询,然后猜测是Chatgpt还是人类治疗师是真实的疗愈者。
发现
总共有13位拥有至少五年经验的治疗师构成了专家小组,调查受访者的小组平均包括830名45岁的人。其中,女性为50.6%,男性为47.9%,非二元为0.2%。其中近60%的人处于浪漫关系中,有18%的人报告参加过类似的疗法。
此外,有49.4%的受访者是非西班牙裔白人,18.8%为黑人,16.8%是白人西班牙裔,5%是亚洲人。调查受访者在区分疗愈是来自Chatgpt还是治疗师时表现不佳。
认为治疗师写了回应的参与者对疗愈的评价更高,而那些认为它是chatgpt生成的人则将其评为较低。也就是说,当归因于治疗师时,受试者对测试事件的反应更为积极。研究人员比较了治疗师和CHATGPT的反应之间的言论和情感的差异。与人写的回答相比,Chatgpt生成的反应更长,名词,形容词,动词,代词和副词更为积极,形容词,动词,代词和副词。即使控制回答的时长,Chatgpt的响应也包括更多的形容词和名词,但具有相似数量的副词,代词和动词。
结论
这表明人们很难区分机器和人类的反应,在所有常见的治疗因素上,Chatgpt的反应比人类反应高得多。该研究的局限性包括有限数量的测试事件,以及专家治疗师数量有限。