Resumo:
O envio de mensagens eletrônicas é uma forma de comunicação usada em diversos serviços, incluindo os da área da saúde. Neste trabalho, é proposto um sistema de busca ativa de pacientes, em que mensagens são recebidas e classificadas em mensagens que são respondidas automaticamente ou mensagens que devem ser direcionadas para serem respondidas por um humano, em função de necessidades de saúde. A base de dados utilizada neste trabalho é uma base com as duas classes desbalanceadas. Para lidar com esse problema, foi utilizado o ChatGPT 3.5 para gerar mais exemplos da classe minoritária na base de dados. Foram comparados 3 cenários: o primeiro com dados na base original desbalanceada, o segundo com a base de dados de mensagens sintéticas geradas pelo ChatGPT e o terceiro com mensagens do ChatGPT, mas contendo linguagem coloquial e erros de português. Em todos os modelos foi utilizado o algoritmo XGBoost. O cenário onde o XGBoost apresentou melhor capacidade de discriminação entre as mensagens foi aquele treinado na base de dados com mensagens sintéticas sem erros de português.
Referência:
BRITO, Adriana Camargo de; CUSTÓDIO, Gustavo Torres; RIBEIRO, Rogerio Silicani; SILVEIRA, Rubens Carvalho; MONTEIRO, Renata Luciria; CASTALDONI, Rodrigo Cabrera. Modelo de aprendizado de máquina para classificação de mensagens de usuários do sistema de saúde quanto à presença de necessidade de saúde. In: INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS AND TECHONLOGY MANAGEMENT VIRTUAL, 20., 2024, São Paulo. Proceedings…
Acesso ao trabalho no site do Evento:
https://www.tecsi.org/contecsi/index.php/contecsi/20thCONTECSI/paper/view/7236