Aplicación de modelos Transformers para clasificar textos en idioma español

dc.contributor.advisorHaz López, Lídice Victoria
dc.contributor.authorMerchán Pérez, Erick Lenin
dc.date.accessioned2024-08-16T20:01:45Z
dc.date.available2024-08-16T20:01:45Z
dc.date.issued2024-08-16
dc.description.abstractLa llegada de los modelos Transformers ha revolucionado el procesamiento del lenguaje natural (PLN) al introducir un innovador mecanismo de atención capaz de capturar de manera eficiente y simultánea dependencias a largo plazo en secuencias de datos. Este avance arquitectónico ha generado un camino para un progreso significativo en diversas aplicaciones de PLN. En consecuencia, el enfoque de este proyecto radica en aprovechar estos modelos Transformers Pysentimiento para la clasificación de texto en el idioma español. Para lograr este objetivo, se emplearán cuatro modelos distintos: BERT, RoBERTa, DistilBERT y AlBERT, utilizando un conjunto de datos obtenido de la plataforma en línea Kaggle. Estos conjuntos de datos serán sometidos a un procesamiento previo y posteriormente alimentados a cada modelo para su evaluación. Se llevará a cabo un análisis comparativo de los resultados utilizando diversas métricas, y los hallazgos experimentales revelarán que, después de un adecuado preprocesamiento, el modelo DistilBERT alcanzo una precisión del 78%, un recall del 75%, una exactitud del 75% y una puntuación f1 del 76%. Este resultado establece al modelo DistilBERT como la opción más adecuada para tareas de clasificación de texto en el idioma español.es
dc.identifier.citationMerchán Pérez, Erick Lenin (2024). Aplicación de modelos Transformers para clasificar textos en idioma español. La Libertad. UPSE, Matriz. Facultad de Sistemas y Telecomunicaciones. 48p.es
dc.identifier.otherUPSE-TTI-2024-0035
dc.identifier.urihttps://repositorio.upse.edu.ec/handle/46000/11875
dc.language.isospaes
dc.pages48 p.es
dc.publisherLa Libertad: Universidad Estatal Península de Santa Elena, 2024es
dc.rightsopenAccesses
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 Ecuador*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/*
dc.subjectPLNes
dc.subjectTRANSFORMERSes
dc.subjectKAGGLEes
dc.subjectBERTes
dc.subjectROBERTAes
dc.subjectDISTILBERTes
dc.subjectALBERTes
dc.titleAplicación de modelos Transformers para clasificar textos en idioma españoles
dc.typebachelorThesises

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
UPSE-TTI-2024-0035.pdf
Size:
1.86 MB
Format:
Adobe Portable Document Format
Description:
EXAMEN COMPLEXIVO

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
13.84 KB
Format:
Item-specific license agreed upon to submission
Description: