什么是情绪识别
编辑情绪识别是识别人类情绪的过程。人们在识别他人情绪方面的准确性差异很大。使用技术帮助人们进行情绪识别是一个相对较新的研究领域。通常,如果该技术在上下文中使用多种模式,则效果最佳。迄今为止,大部分工作都是在自动识别视频中的面部表情、音频中的口语表达、文本中的书面表达以及通过可穿戴设备测量的生理学方面进行的。
人类的情绪识别
编辑人类在识别情绪的能力上表现出很大的可变性。在学习自动情绪识别时要记住的一个关键点是,有几个“基本事实”的来源,或关于真实情绪的真相。假设我们试图识别亚历克斯的情绪。一个消息来源是“大多数人会说亚历克斯的感受是什么?”在这种情况下,“真相”可能与亚历克斯的感受不相符,但可能与大多数人所说的亚历克斯的感受相符。例如,亚历克斯实际上可能会感到悲伤,但他会露出灿烂的笑容,然后大多数人说他看起来很开心。如果自动化方法获得了与一组观察者相同的结果,则它可能被认为是准确的,即使它实际上并没有衡量亚历克斯的真实感受。“真相”的另一个来源是问亚历克斯他的真实感受。如果Alex对他的内部状态有很好的了解,并且想告诉您它是什么,并且能够将其准确地转化为文字或数字,那么这将起作用。然而,有些人是述情障碍,对自己的内在感受没有很好的感觉,或者无法用文字和数字准确地传达它们。一般来说,要了解实际存在的情绪的真相可能需要一些工作,可能会因选择的标准而异,并且通常会涉及保持一定程度的不确定性。或者他们无法用文字和数字准确地传达它们。一般来说,要了解实际存在的情绪的真相可能需要一些工作,可能会因选择的标准而异,并且通常会涉及保持一定程度的不确定性。或者他们无法用文字和数字准确地传达它们。一般而言,了解实际存在的情绪的真相可能需要一些工作,可能会因选择的标准而异,并且通常涉及保持一定程度的不确定性。
情绪识别的子领域
编辑如果通过组合不同的对象(包括文本(对话)、音频、视频和生理学)来应用多种模态来检测情绪,则情绪识别可能会获得最佳结果。
文本中的情绪识别
当文本数据在人类生活中随处可用且免费时,文本数据是情感识别的有利研究对象。与其他类型的数据相比,由于语言中单词和字符的频繁重复,文本数据的存储更轻,易于压缩到最佳性能。情感可以从两种基本的文本形式中提取:书面文本和对话(对话)。对于书面文本,许多学者专注于从句子层面提取代表情感的“词/短语”。
音频中的情绪识别
与文本中的情感识别不同,语音信号用于识别以从音频中提取情感。
视频中的情绪识别
视频数据是音频数据、图像数据和有时文本(在字幕的情况下)的组合。
对话中的情绪识别
对话中的情绪识别(ERC)从社交平台(如Facebook、Twitter、YouTube等)的海量对话数据中提取参与者之间的意见。ERC可以采用文本、音频、视频或组合形式等输入数据来检测多种情绪,如恐惧、欲望、痛苦和愉悦。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/126338/