Show simple item record

Arquiteturas de redes neurais profundas para classificação de dialetos e sotaques

dc.contributor.advisorMutz, Filipe Wall
dc.contributor.authorTostes, Wagner Arca
dc.date.accessioned2022-03-28T18:48:19Z
dc.date.available2022-03-28T18:48:19Z
dc.date.issued2022-02-08
dc.identifier.citationTOSTES, Wagner Arca. Arquiteturas de redes neurais profundas para classificação de dialetos e sotaques. 2022. 76 f. Dissertação (Mestrado em Computação Aplicada) - Instituto Federal do Espírito Santo, Serra, 2022.pt_BR
dc.identifier.urihttps://repositorio.ifes.edu.br/handle/123456789/1771
dc.description.abstractRESUMO A classificação automática de sotaques possui diversas aplicações potenciais como a identificação e autenticação de usuários, ferramentas de investigação forense e a seleção de modelos especializados para as conversões de texto em fala (text-to-speech) e fala em texto (speech-to-text). Neste trabalho, propomos e avaliamos diversas arquiteturas de redes neurais artificiais para a tarefa de classificação de dialetos e sotaques. Em particular, é desenvolvida uma arquitetura baseada em convoluções 1D sobre faixas frequências de espectrogramas seguidas por redes recorrentes do tipo Long Short-Term Memory. Para avaliação destas arquiteturas foram utilizadas as bases de dados Braccent, Ynoguti e the IViE Corpus, além de subconjuntos das bases Speech Accent Archive e AiShell 3. As redes neurais alcançaram boa performance em todas as bases de dados com acurácia máxima de 90% na base Braccent, 93% na base Ynoguti, 96% na base IViE Corpus, 60% na base Speech Accent Archive e 61% na base AiShell 3. Embora existam muitos trabalhos na literatura que abordem a identificação de sotaques e dialetos em outras línguas, este é um dos primeiros trabalhos que usam bases de dados do português brasileiro e a performance preditiva alcançada indica que os modelos propostos são promissores.pt_BR
dc.description.abstractABSTRACT The automatic classification of accents has several potential applications, for instance, the identification and authentication of users, forensic investigation tools, and the selection of specialized models in text-to-speech and speech-to-text systems. In this work, we propose and evaluate several architectures of artificial neural networks to classify dialects and accents. In particular, an architecture based on 1D convolutions over spectrogram frequency bands followed by recurrent Long Short-Term Memory networks. To evaluate these architectures, the datasets Braccent, Ynoguti and the IViE Corpus we employed, along with subsets of the Speech Accent Archive and the AiShell 3. The neural networks achieved good performance in all datasetse with maximum accuracy of 90% in the dataset Braccent, 93% in the Ynoguti, 96% in the IViE Corpus, 60% in the Speech Accent Archive and 61% in the AiShell 3. Although there are substantial works in the literature studying the identification of accents and dialects in other languages, this is one the first works to use Brazilian Portuguese datasets. The predictive performance achieved indicates that the proposed models are promising.pt_BR
dc.format.extent76 f.pt_BR
dc.languagept_BRpt_BR
dc.rightsacesso_abertopt_BR
dc.subjectReconhecimento de Sotaquespt_BR
dc.subjectRedes Neurais Convolucionaispt_BR
dc.subjectRedes Neurais Recorrentespt_BR
dc.subjectRedes neurais (Computação)pt_BR
dc.subjectProcessamento de linguagem natural (Computação)pt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectLíngua Portuguesa - Regionalismos - Brasil.pt_BR
dc.subjectSistemas de reconhecimento de padrõespt_BR
dc.titleArquiteturas de redes neurais profundas para classificação de dialetos e sotaquespt_BR
dc.typedissertacao_mestradopt_BR
dc.contributor.advisor-coKomati, Karin Satie
dc.publisher.localSerrapt_BR
ifes.campusCampus_Serrapt_BR
dc.contributor.institutionInstituto Federal do Espírito Santo (IFES)pt_BR
dc.identifier.capes30004012075P4pt_BR
ifes.knowledgeAreaComputação Aplicadapt_BR
ifes.researchAreaInteligência Artificialpt_BR
ifes.advisor.latteshttp://lattes.cnpq.br/3123292310632540pt_BR
ifes.advisorco.latteshttp://lattes.cnpq.br/9860697624155451pt_BR
ifes.course.underposgraduateMestrado em Computação Aplicada
dc.contributor.memberOliveira, Hilário Tomaz Alves de
dc.contributor.memberCampana, Vitor Faiçal
ifes.member.latteshttp://lattes.cnpq.br/8980213630090119pt_BR
ifes.member.orcidhttps://orcid.org/0000-0003-0643-7206pt_BR
ifes.advisor.orcidhttps://orcid.org/0000-0002-2951-9207pt_BR
ifes.advisorco.orcidhttps://orcid.org/0000-0001-5677-4724pt_BR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record