Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições

A crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recup...

Full description

Saved in:
Bibliographic Details
Main Authors: Gilsiley Henrique Daru, Gustavo Valentim Loch, Daniel Felipe Pietezak
Format: Article
Language:English
Published: Universidade Federal do Rio Grande do Sul 2024-01-01
Series:Em Questão
Subjects:
Online Access:https://seer.ufrgs.br/index.php/EmQuestao/article/view/139205
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:A crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recuperação da informação, como bag-of-words, TF e TF-IDF, para a tarefa de classificar descrições curtas de produtos. A pesquisa avalia diferentes estratégias de pré-processamento e tokenização, incluindo a análise do impacto da normalização. Os resultados demonstraram que métodos simples de recuperação da informação, quando combinados com pré-processamento adequado e otimização de parâmetros, podem alcançar desempenho significativamente superior.
ISSN:1808-5245