Desenvolvimento de modelo de Inteligência Artificial para degravação de depoimentos judiciais

Carrari, Gabriely Machado (2024-12-09)

tcc

RESUMO: A morosidade do sistema judiciário brasileiro, agravada pela alta demanda processual e pela complexidade de tarefas manuais, como a degravação de depoimentos, representa um dos principais desafios para a eficiência judicial. Esse problema é intensificado pela confidencialidade dos dados, o que pode limitar o uso de sistemas automatizados externos, tornando essencial o desenvolvimento de soluções próprias pelo Poder Judiciário. Analisando essa problemática, este trabalho propõe o desenvolvimento de um modelo de inteligência artificial baseado em redes neurais artificiais, utilizando arquiteturas híbridas de Redes Neurais Convolucionais e Redes Neurais Recorrentes. O modelo foi treinado com o dataset Common Voice Corpus 17.0, adaptado ao português, e validado em um conjunto de dados simulado que representa o contexto jurídico. Os resultados obtidos mostraram taxas de erro de caracteres (CER) de 20,13% e de palavras (WER) de 59,29%, demonstrando o potencial das RNAs na tarefa, apesar das limitações do dataset utilizado. Esses achados reforçam a viabilidade de soluções automatizadas no sistema judiciário, especialmente quando suportadas por datasets mais robustos e específicos ao domínio jurídico.

ABSTRACT: The slowness of the Brazilian judicial system, aggravated by the high procedural demand and the complexity of manual tasks such as the transcription of testimonies, represents one of the main challenges to judicial efficiency. This problem is further intensified by the confidentiality of data, which can limit the use of external automated systems, making it essential for the Judiciary to develop its own solutions. Analyzing this issue, this study proposes the development of an artificial intelligence model based on artificial neural networks, utilizing hybrid architectures of Convolutional Neural Networks and Recurrent Neural Networks. The model was trained using the Common Voice Corpus 17.0 dataset, adapted to Brazilian Portuguese, and validated on a simulated dataset representing the judicial context.The results obtained showed character error rates (CER) of 20.13% and word error rates (WER) of 59.29%, demonstrating the potential of artificial neural networks for the task, despite the limitations of the dataset used. These findings reinforce the feasibility of automated solutions in the judicial system, especially when supported by more robust and domain-specific datasets.


Collections: