当前位置:   article > 正文

语音情绪识别_tess数据集

tess数据集

1.数据集

1.1  the Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS) dataset  RAVDESS数据集

1.2 the Toronto emotional speech set (TESS) dataset  TESS数据集

数据集样本个数:4240个

2.识别结果

01 = neutral,

02 = calm,

03 = happy,

04 = sad,

05 = angry,

06 = fearful,

07 = disgust,

08 = surprised

3.特征处理

    音频特征处理使用MFCC,获得40维的一维向量

    提取过程:连续语音--预加重--加窗分帧--FFT--MEL滤波器组--对数运算--DCT

4.神经网路模型

识别模型是基于cnn+mfcc的卷积神经网络

模型结构:

Model: "sequential_1"
_________________________________________________________________
Layer (type) Output Shape Param # 
==========

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号