Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições
A crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recup...
Saved in:
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Universidade Federal do Rio Grande do Sul
2024-01-01
|
Series: | Em Questão |
Subjects: | |
Online Access: | https://seer.ufrgs.br/index.php/EmQuestao/article/view/139205 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
_version_ | 1832591151503245312 |
---|---|
author | Gilsiley Henrique Daru Gustavo Valentim Loch Daniel Felipe Pietezak |
author_facet | Gilsiley Henrique Daru Gustavo Valentim Loch Daniel Felipe Pietezak |
author_sort | Gilsiley Henrique Daru |
collection | DOAJ |
description | A crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recuperação da informação, como bag-of-words, TF e TF-IDF, para a tarefa de classificar descrições curtas de produtos. A pesquisa avalia diferentes estratégias de pré-processamento e tokenização, incluindo a análise do impacto da normalização. Os resultados demonstraram que métodos simples de recuperação da informação, quando combinados com pré-processamento adequado e otimização de parâmetros, podem alcançar desempenho significativamente superior. |
format | Article |
id | doaj-art-1ffc284bc7024ef9b46d186577b5d78b |
institution | Kabale University |
issn | 1808-5245 |
language | English |
publishDate | 2024-01-01 |
publisher | Universidade Federal do Rio Grande do Sul |
record_format | Article |
series | Em Questão |
spelling | doaj-art-1ffc284bc7024ef9b46d186577b5d78b2025-01-22T18:45:34ZengUniversidade Federal do Rio Grande do SulEm Questão1808-52452024-01-013012910.1590/1808-5245.30.139205Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descriçõesGilsiley Henrique Daru0https://orcid.org/0000-0002-8979-0461Gustavo Valentim Loch1https://orcid.org/0000-0002-6672-8139Daniel Felipe Pietezak2https://orcid.org/0009-0007-2802-8805Universidade Federal do ParanáUniversidade Federal do ParanáSENAIA crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas clássicas de recuperação da informação, como bag-of-words, TF e TF-IDF, para a tarefa de classificar descrições curtas de produtos. A pesquisa avalia diferentes estratégias de pré-processamento e tokenização, incluindo a análise do impacto da normalização. Os resultados demonstraram que métodos simples de recuperação da informação, quando combinados com pré-processamento adequado e otimização de parâmetros, podem alcançar desempenho significativamente superior.https://seer.ufrgs.br/index.php/EmQuestao/article/view/139205aprendizado de máquinaprocessamento de linguagem naturalclassificação de textodescrição do produtotexto curtobag of wordsfrequência de termosfrequência inversa de documentos |
spellingShingle | Gilsiley Henrique Daru Gustavo Valentim Loch Daniel Felipe Pietezak Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições Em Questão aprendizado de máquina processamento de linguagem natural classificação de texto descrição do produto texto curto bag of words frequência de termos frequência inversa de documentos |
title | Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições |
title_full | Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições |
title_fullStr | Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições |
title_full_unstemmed | Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições |
title_short | Aprimorando a classificação de descrições de produtos em português com a utilização de técnicas da recuperação de informação: uma abordagem de agrupamento de descrições |
title_sort | aprimorando a classificacao de descricoes de produtos em portugues com a utilizacao de tecnicas da recuperacao de informacao uma abordagem de agrupamento de descricoes |
topic | aprendizado de máquina processamento de linguagem natural classificação de texto descrição do produto texto curto bag of words frequência de termos frequência inversa de documentos |
url | https://seer.ufrgs.br/index.php/EmQuestao/article/view/139205 |
work_keys_str_mv | AT gilsileyhenriquedaru aprimorandoaclassificacaodedescricoesdeprodutosemportuguescomautilizacaodetecnicasdarecuperacaodeinformacaoumaabordagemdeagrupamentodedescricoes AT gustavovalentimloch aprimorandoaclassificacaodedescricoesdeprodutosemportuguescomautilizacaodetecnicasdarecuperacaodeinformacaoumaabordagemdeagrupamentodedescricoes AT danielfelipepietezak aprimorandoaclassificacaodedescricoesdeprodutosemportuguescomautilizacaodetecnicasdarecuperacaodeinformacaoumaabordagemdeagrupamentodedescricoes |