AI读懂说话人心情，数据堂语音情感辨认数据等你Pick

1550216188 · 2020-9-17 16:26:52

　　近日，小米推出了片面支持情感化语音交互的小米小爱音箱Art，小米也成为业内首家情感化TTS大规模落地的企业。
　　基于开心、关怀、害羞等有限但类型不同的情感音频数据，经过不同技术训练并迭代声学模型，这款音箱支持情感TTS合成，并完成了“小爱同窗”的音感化、拟人化。
　　

　　随着人工智能技术的发展，在完成人机对话的基础上，各大AI企业都在情感化语音交互的范畴积极展开探求。
　　例如在智能客服范畴，当用户的成绩无法处理或者成绩表述不清时，智能客服很有能够无法辨认用户的心情、停止进一步操作，从而引发用户的不满和赞扬。
　　针对这一状况，日本NTT研讨所研发出一款客服电话情感辨认系统，对用户的电话语音停止搜集处理，假如未检测到用户愤怒的情感，则继续当前的语音服务;假如检测到愤怒的情感，则转为人工服务停止业务处理。
　　语音情感辨认通常指机器从语音中自动辨认人类情感和情感相关形状的过程。经过分析说话人心情使机器停止拟人化的互动，辨认说话人的情感成为语音技术发力的一个新热点。
　　语音情感辨认包括两种，NTT推出的客服电话情感辨认系统属于只经过声响来分析情感。这一情感语音辨认模型的落地运用离不开训练数据的支撑。
　　数据堂深耕于AI数据范畴近十年，不断努力于为全球人工智能企业提供专业的数据服务，行业内高标准的语音情感辨认训练数据《20人英文情感语音麦克风采集数据》和《30部电影语音视频标注数据》广受注重和好评。
　　语音情感辨认的另外一种模型就是结合声响和图像的多模态情感分析。
　　机器人Pepper就是运用多模态情感分析的典型案例。
　　Pepper是由日本软银集团和法国Aldebaran Robotics研发的一款人形机器人，可综合思索周围环境，积极自动地作出反应。
　　Pepper装备了语音辨认技术以及分析表情和声调的心情辨认技术，经过定制化开发，可经过表情、动作、语音与人类交流、反馈，甚至可以跳舞、开玩笑。
　　如今在商业范畴，全球超过2000家企业运用了Pepper，服务于批发、金融、健康护理等众多行业。
　　

　　麻省理工学院媒体实验室分拆公司Affectiva经过语音和面部数据打造了情感档案，其神经网络SoundNet可以在短短1.2秒内辨认出音频数据中的愤怒心情。
　　除了愤怒，人的情感从大类上可分为高兴、悲伤、绝望、诧异等面部情感，从内心境感上还可细分为：尴尬、犹疑、赞同、羡慕等。这些情感可以用VAD方法停止量化打分。
　　所谓VAD，是指Valence、Arousal、Dominance三个衡量维度。
　　· Valence(效价)，指达到目的对于满足个人需求的价值，同一个目的对每一个人能够有三种效价：正、零、负。
　　· Arousal(积极程度)，即肉体+身体共同表现出的积极程度，如充满活力或万马齐喑。
　　· Dominance(优势度)，表示个体对情形和别人的控制形状，如愤怒就属于优势度高的情感，而恐惧属于优势度低的情感。
　　数据堂不断努力于开发个性化的机器训练数据，并将数据和服务落地到AI产品和业务，为人们带去更好的产品体验，让每个人都能享用人工智能带来的美妙生活。

k67577521 · 2020-9-17 22:13:04

确实不错，顶先

小DO爱小丹 · 2020-9-18 21:09:34

不错不错，楼主快出来写点实战经验哇~

猫大宏 · 2020-9-19 16:21:34

好棒的分享楼主多写点吧，写完记得通知我，哈哈

		自动登录	找回密码
密码			立即注册

AI读懂说话人心情，数据堂语音情感辨认数据等你Pick

本帖子中包含更多资源

大神点评3

最近发表

公社版块

关注我们