Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições

A crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recup...

Full description

Saved in:
Bibliographic Details
Main Authors: Gilsiley Henrique Daru, Gustavo Valentim Loch, Daniel Felipe Pietezak
Format: Article
Language:English
Published: Universidade Federal do Rio Grande do Sul 2024-01-01
Series:Em Questão
Subjects:
Online Access:https://seer.ufrgs.br/index.php/EmQuestao/article/view/139205
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1832591151503245312
author Gilsiley Henrique Daru
Gustavo Valentim Loch
Daniel Felipe Pietezak
author_facet Gilsiley Henrique Daru
Gustavo Valentim Loch
Daniel Felipe Pietezak
author_sort Gilsiley Henrique Daru
collection DOAJ
description A crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recuperação da informação, como bag-of-words, TF e TF-IDF, para a tarefa de classificar descrições curtas de produtos. A pesquisa avalia diferentes estratégias de pré-processamento e tokenização, incluindo a análise do impacto da normalização. Os resultados demonstraram que métodos simples de recuperação da informação, quando combinados com pré-processamento adequado e otimização de parâmetros, podem alcançar desempenho significativamente superior.
format Article
id doaj-art-1ffc284bc7024ef9b46d186577b5d78b
institution Kabale University
issn 1808-5245
language English
publishDate 2024-01-01
publisher Universidade Federal do Rio Grande do Sul
record_format Article
series Em Questão
spelling doaj-art-1ffc284bc7024ef9b46d186577b5d78b2025-01-22T18:45:34ZengUniversidade Federal do Rio Grande do SulEm Questão1808-52452024-01-013012910.1590/1808-5245.30.139205Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descriçõesGilsiley Henrique Daru0https://orcid.org/0000-0002-8979-0461Gustavo Valentim Loch1https://orcid.org/0000-0002-6672-8139Daniel Felipe Pietezak2https://orcid.org/0009-0007-2802-8805Universidade Federal do ParanáUniversidade Federal do ParanáSENAIA crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recuperação da informação, como bag-of-words, TF e TF-IDF, para a tarefa de classificar descrições curtas de produtos. A pesquisa avalia diferentes estratégias de pré-processamento e tokenização, incluindo a análise do impacto da normalização. Os resultados demonstraram que métodos simples de recuperação da informação, quando combinados com pré-processamento adequado e otimização de parâmetros, podem alcançar desempenho significativamente superior.https://seer.ufrgs.br/index.php/EmQuestao/article/view/139205aprendizado de máquinaprocessamento de linguagem naturalclassificação de textodescrição do produtotexto curtobag of wordsfrequência de termosfrequência inversa de documentos
spellingShingle Gilsiley Henrique Daru
Gustavo Valentim Loch
Daniel Felipe Pietezak
Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições
Em Questão
aprendizado de máquina
processamento de linguagem natural
classificação de texto
descrição do produto
texto curto
bag of words
frequência de termos
frequência inversa de documentos
title Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições
title_full Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições
title_fullStr Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições
title_full_unstemmed Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições
title_short Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições
title_sort aprimorando a classificacao de descricoes de produtos em portugues com a utilizacao de tecnicas da recuperacao de informacao uma abordagem de agrupamento de descricoes
topic aprendizado de máquina
processamento de linguagem natural
classificação de texto
descrição do produto
texto curto
bag of words
frequência de termos
frequência inversa de documentos
url https://seer.ufrgs.br/index.php/EmQuestao/article/view/139205
work_keys_str_mv AT gilsileyhenriquedaru aprimorandoaclassificacaodedescricoesdeprodutosemportuguescomautilizacaodetecnicasdarecuperacaodeinformacaoumaabordagemdeagrupamentodedescricoes
AT gustavovalentimloch aprimorandoaclassificacaodedescricoesdeprodutosemportuguescomautilizacaodetecnicasdarecuperacaodeinformacaoumaabordagemdeagrupamentodedescricoes
AT danielfelipepietezak aprimorandoaclassificacaodedescricoesdeprodutosemportuguescomautilizacaodetecnicasdarecuperacaodeinformacaoumaabordagemdeagrupamentodedescricoes