人工情绪智能技术与应用趋势-潘建飞博士

2023-09-01

1  概述

       近年来,人工智能已经自然而然地融入了我们的日常生活,用来在短时间内解决那些因为人类的困难或耗时的任务而低效的事情。这种人工智能被称为弱AI,处于理性思考、理性行动的人工智能水平,弱AI具有逻辑求解、推理、优化等功能。这种人工智能在翻译、自动驾驶、图像识别等领域已经取得了显著的进展,并正在朝着解决实际问题的实用化方向发展。强AI是一个更进一步的概念,它具有像人一样思考,像人一样行动的系统,与人类几乎相同的人工智能。虽然人工智能技术还没有达到这一点,但它是人工智能研究的最终目标。理解情感(敏感性),有能力创造新事物,像人一样思考,像人一样行动,对于人工智能来说这是一个非常重要的过程。在这方面,大多数人仍然认为,造物和情感是人类独有的领域。然而,人工智能已经在艺术、音乐和视频领域创造了新事物。人工智能正处于人类情感可以被理解、识别并应用于实际应用的阶段。对此,高德纳公司认为,人工智能能够理解和识别人类的情感,并与人类互动,是一种可以创造新的商业生态系统的潜在技术。到2022年,人工智能将能够理解人类的情感,并比现在更有效地交流。

       在人类情感领域研究人工智能,研究人类的感性,并在此基础上开发产品和服务,已经形成了一个产业。在研究中,有研究人与计算机(系统)之间交互的HCI,以及旨在识别、推断和解释人类情绪的情感计算。此外,还有敏感性科学,这是一个研究领域,根据人类的情感和敏感性设计产品、服务和环境,以进一步提高生活质量。在产业领域,已经出现了将ICT与情感意识结合起来的“情感ICT产业”。ICT通过向ICT产品提供情感沟通,赋予新的体验和价值。最近还开发出了人工智能(AI)技术,该技术可以识别并产生人类的情绪,从而产生人类的情绪并与之交互。它们正在各个领域被使用和开发,2018年该领域的全球市场规模为120.37亿美元。较2019年增长了40.46%,预计2024年将形成910.67亿美元的市场。

      本研究的目的是通过对人工情绪智能技术现状和案例的分领域考察,探讨人工情绪智能产业化所需要素。


2  情绪智能行业

2.1 情绪的研究现状

       情绪科学、人机交互、情绪计算等多个领域都在研究和发展对人类情感的识别和利用的技术。

       情绪工程是通过特定的产品设计来实现情感作为人类欲望的工程方法。它对人的情感进行定性和定量的测量和评估,科学地进行分析,并将其应用于产品和环境设计中,使其更方便、舒适、安全。因此,它是一项最终帮助人类过上更好生活的技术。换句话说,它是一个通过测量、分析和应用人的生理和心理反应来为用户提供产品或环境的领域。情感工程侧重于产品设计和环境设计,也有情感科学。

       情感科学是从情感工程的角度从更广阔的角度来研究和发展的一个概念。情感科学是一门以人为中心,以情感为中心,摆脱以机器-物质为中心范式,提高生活质量的科学。它是一个科学领域,是各种信息、机械、技术、文化领域相互接触和研究的契合点,有助于实现技术和文化相结合的新文明。1988年,国际人体工程学学会在悉尼正式命名敏感性科学。密切相关的领域包括人体工程学、认知工程、UI(用户界面)、工业设计、可用性评估和人机交互(HCI)。

       在这里,HCI是一个研究人与计算机(系统)之间交互的领域,是一个使计算机与人之间的交流越来越容易的研究领域。它包含广泛意义上的各种元素,包括人、计算机、交互、任务和环境。由于各个学术领域的多学科性质,人机交互的定义和主要研究范式随着时间的推移而发生了变化。传统人机交互所涵盖的人机交互定义是用户与计算机之间的交互。换句话说,只有三个要素存在:个人、计算机和交互,而HCI研究的主要目标是设计和评估更方便可用的计算机系统。然而,随着Web 2.0的出现,HCI (HCI 2.0)的定义发生了变化,包括各种数字系统和人之间的所有交互。研究的主要目标也改变了,给一个新的和有益的用户体验。人机交互研究的主要模式也随着时间发生了变化。在过去十年,重点已经转移到移动和社交互动主题。因此,人机交互侧重于人与计算机(系统)之间的交互。与此高度相关的技术和研究包括情感计算和各种用于识别和理解人类情绪的人工智能技术。

        情绪计算的概念是由麻省理工学院媒体实验室的Rosalind W. Picard在1885年首次提出。这是一个非常类似于人工情绪智能的概念,是一个基于人工智能的识别和解释人类情绪的系统概念。它还指从物理或感官外部刺激中识别人们的心理反应,并将其用于人与计算机之间的交互的技术。

       情感计算主要集中在识别人类互动中的情感技术。人工情绪智能(Artificial Emotional Intelligence)是指在识别和理解人类情绪之后,对人类情绪进行模拟的技术。通过这一点,人工情绪智能技术正在发展到可以刺激人类产生情绪和情感互动的阶段。


2.2 情绪和敏感智能

       Schuller D认为,人工情绪智能技术目前正在作为一个情感识别、情感生成和情感增强技术的框架进行研究,如图1所示。在介绍了情绪计算领域中主要关注的情绪识别之后,本研究将研究情绪产生、情绪增强技术和人工情绪智能的使用案例。

     (1)情感识别技术

        识别一个人的情绪表达最常用的手段是一个人的表情和声音。大多数情绪识别技术的研究都集中在面部和语言识别技术[10],因此,使用了语音、音频、图像、文本、视频等各种数据。此外,研究人员还分析了人体姿态、手势、步态、心率和脑电波等生物信号。这种分析方法已经应用于各种机器学习技术,如支持向量机(SVM),基于内核的机器(KM),隐马尔可夫模型(HMM)和具有通用图形模型和长短期记忆(LSTM)的神经网络。最近,专注于开发深度学习技术的研究正在进行,例如能够进行多模态分析的End2You Toolkit。

        面部表情在人们的情绪识别中很有用,因为每种情绪都有各自的特征。Ekman分类的愤怒、厌恶、恐惧、快乐、悲伤、惊讶六种基本情绪可以通过隐马尔可夫模型、光流、主动外观模型、神经网络处理等方法进行检测和处理。

       情感FACS (EMFACS)也通过对面部表情进行分类,重点关注面部肌肉运动的单位、强度和不对称程度,作为适用于情绪检测的面部运动评分的相关方法来识别人类的情绪。

       在使用语音数据的情况下,主要通过强调信息中重要内容的线索和说话者情绪状态的元素来识别。人工智能对声音的均值、范围、强度、变化和发声等因素的分析与Ekman所分类的愤怒、厌恶、恐惧、快乐、悲伤和惊讶这六种基本情绪分类最为相关。通过语音数据识别的文本形式也是识别情绪的重要因素。自然语言处理最常用文本分析,这不仅是语音数据使用的关键技术,也是计算机(系统)理解语言、处理对话、生成响应的关键技术。换句话说,情感识别可以通过文本本身,也就是人们写的东西来实现。姿势和手势也被用于人类情感识别。姿势是指一个人站着或坐着的整个身体,而手势是指身体某一部分的运动,通常以手或头的表情形式出现。Kleinsmith和Bianchi-Berthouze在对情绪身体表达识别的回顾研究中表明,静止的身体姿势和手势可以传达情绪。在这项研究之后,人们对各种情绪的静止身体姿势和手势特征进行了各种研究,基于数据学习人工智能对情绪进行分类和预测的模型也在积极涌现。在使用生物信号的情况下,情绪识别主要是根据心电图、脑电波、皮肤电导率、呼吸、体温等测量数据进行的。情绪的分类主要基于效价(Valence),即积极和消极的状态,以及觉醒(Arousal),即平静或可感知的状态。利用生物信号识别情绪时,主要包括测量生物信号,提取每种情绪的生物信号特征,对情绪进行分类和识别。


    (2)情感产生与情感增强技术

      人工智能必须对来自外部刺激的特定模式产生即时和自动的情绪反应,在人工智能中,情绪生成就像将情绪合成到机器中,使得机器看起来有真实的情感,和人类的情感是一样的。换句话说,情感生成需要一个合成动作的过程,这些动作可以代表人工智能的情绪状态。对情绪产生的研究已有30多年的历史,主要是对言语和面部表情的研究。重点是情感语音合成,如文本到语音(TTS),面部表情,通过手势和姿势的视觉代理进行情感合成,以及通过文本进行情感合成。近年来,基于深度学习(如WaveNet)的情感语音生成研究越来越多。情绪生成技术主要基于社会学和心理学研究。它被广泛用于开发机器人的基本情感生成模型,并以社交机器人的形式在各个领域得到了发展,这是因为人类的情感表达主要是通过声音和表情来表达的,而机器人很容易表达声音和表情,即适合多模态表达。近年来,随着现实化、沉浸式技术的发展,虚拟人物情感生成技术正被应用于各个领域。

       与人工情绪智能技术中的情绪识别技术相比,人工智能通过规划和推理产生情绪的情感增强技术在研发中是少见的尝试。情感增强的研究主要在对话管理(DM)领域,通过解释命令来回答问题。

       情感增强的研究和开发仍需继续,如果将这种方法系统化,将情绪本身的原理纳入机器学习中,可以开发出人工情绪智能技术的三要素,重新模拟人类的情绪,使情绪交流和互动更加顺畅。 


3  结论

      目前,人工情绪智能技术正按照情绪识别技术、情绪生成(合成)技术、情绪增强技术的顺序发展和研究,识别和理解人类情绪的应用最为活跃。但是,如果情绪生成(合成)技术和情感增强技术得到进一步发展,人工情感智能有望作为一种工具,在人类与新的情感或情绪之间进行尽可能高的情感互动。此外,该领域的全球市场规模预计将在2024年形成910.67亿美元的市场,在2019年至2024年期间增长40.46%,并将彻底改变包括工业、文化、艺术、研发和日常生活在内的许多事情。人工情绪智能未来的增长潜力巨大,因此考察人工情绪智能产业化需要哪些因素,也将是一项重要任务。在人工情感智能产业化的情感识别、情感生成(合成)、情感增强三大技术要素中,稳步研发情感生成(合成)和情感增强技术将是至关重要的。此外,存储和管理人类情感数据的框架也将是一个重要的因素。此外,还需要基础设施和平台,以确保优秀的人力资源,并在工业界和学术界建立产业。也有必要加强政府对产业振兴整体方面的支持和监管,这方面的政策也可以成为人工情绪智能产业化的重要因素。