IDENTIFICAÇÃO DE SENTIMENTO EM VOZ POR MEIO DA COMBINAÇÃO DE CLASSIFICAÇÕES INTERMEDIÁRIAS DOS SINAIS EM EXCITAÇÃO, VALÊNCIA E QUADRANTE
A identificação de sentimento em voz é comumente realizada em classes categóricas como “tristeza” ou “alegria”. De acordo com o mapa de afeto de Russell, sentimentos também podem ser classificados por excitação, valência e quadrantes. Neste trabalho é proposto um método para incrementar o desempenho de identificação de sentimentos em classes categóricas utilizando classificadores que realizam classificação intermediária nas classes de excitação valência e quadrantes usando uma abordagem Multi-Visão. Para combinar esses resultados e obter a classificação final é proposta uma árvore de decisão que aumentou o desempenho F1 de 0,73 do Ensemble de três tipos de classificadores para 0,87 sobre uma base de dados pública.
IDENTIFICAÇÃO DE SENTIMENTO EM VOZ POR MEIO DA COMBINAÇÃO DE CLASSIFICAÇÕES INTERMEDIÁRIAS DOS SINAIS EM EXCITAÇÃO, VALÊNCIA E QUADRANTE
-
DOI: 10.22533/at.ed.37319181215
-
Palavras-chave: Identificação sentimento em voz, Excitação-valência, Abordagem Multi-Tarefa
-
Keywords: Speech emotion recognition, Arousal-Valence, Multi-task
-
Abstract:
Speech emotion recognition is commonly performed in categorical classes, such as “sadness” or “joy”. According to Russell’s map of affection, emotions can also be classified by arousal (excitation), valence, and quadrants. In this work is proposed a method to increase the performance of speech emotion recognition in categorical classes using classifiers that perform intermediate classification in the classes of valence, excitation and quadrants using a multiview approach. To combine these results and obtain the final classification, a decision tree is proposed and that increases F1 metrics from 0.73 by Ensemble of three kinds of classifiers to 0.87 in a public database.
-
Número de páginas: 14
- Patrick Marques Ciarelli
- Evandro Ottoni Teatini Salles
- Guilherme Butzke Schreiber Gering