news_179_dHéctor Ponce, profesor del MBA USACH y PhD in Management Systems, University of Lincoln, UK.; publicó su trabajo "Effects on Time and Quality of Short Text Clustering during Real – Time Presentations" en la prestigiosa revista IEEE Latin America Transactions.

Héctor Ponce, profesor del MBA USACH y PhD in Management Systems, University of Lincoln, UK.; publicó su trabajo "Effects on Time and Quality of Short Text Clustering during Real – Time Presentations" en la prestigiosa revista IEEE Latin America Transactions.

news_179_01El académico del MBA de la Universidad de Santiago de Chile, Héctor Ponce, PhD in Management Systems, University of Lincoln, UK., publicó uno de sus últimos trabajos de investigación denominado "Effects on Time and Quality of Short Text Clustering durin Real – Time Presentations" en la destacada revista IEEE Latin América Transactions.

Esta revista proporciona la difusión de documentos de investigación de calidad en tres áreas principales: computación, energía (eléctrica) y electrónica; con el objetivo de informar temas emergentes o la resolución de problemas en América Latina. La revista cuenta además con algunas subáreas (pero no se limitan a): control de sistemas, comunicaciones, instrumentación, inteligencia artificial, energía e industria.

Fue en esta prestigiosa revista donde el profesor del MBA plasmó su trabajo investigativo el que fue financiado por los Proyectos FONDEF/ CONICYT (IT18I001) y FONDECYT (1200803) y que realizó junto a Diego Fuentealba y Mario López, académicos del Departamento de Ingeniería Industrial de la Universidad de Santiago de Chile.

El estudio

La investigación examina los efectos en el tiempo y la calidad de los algoritmos de agrupación de texto aplicados a textos de tamaño corto, medio y largo, y se examina si la agrupación de texto corto muestra un rendimiento razonable para las presentaciones en directo. Para realizar este estudio, los investigadores de la USACH ejecutaron varias simulaciones en las que fueron variando el número de frases (de 5 a 200) contenidas en cada tipo de texto (largo, medio y corto) y el número de clústeres generados (de 2 a 10).

Los algoritmos utilizados fueron los steamers de bola de nieve, TF-IDF, y K-medios para la agrupación; y los tipos de texto fueron Reuters, 20 grupos de noticias y un conjunto de datos experimentales, para los textos de tamaño largo, medio y corto, respectivamente.

"El primer resultado mostró que el tamaño del texto tenía un gran efecto en el tiempo de ejecución del algoritmo, con el tiempo medio más corto para los textos cortos y el tiempo medio más largo para los textos largos. El segundo resultado mostró que el número de frases en cada tipo de texto predice significativamente el tiempo de ejecución, pero no el número de clústeres generados por K-means", explicó Héctor Ponce.

El académico del MBA de la FAE USACH señaló que se utilizaron medidas de inercia y pureza para probar la calidad de los racimos generados. El tamaño del texto, el número de frases y el número de grupos, predicen la inercia, mostrando la inercia más baja para los textos cortos. Las medidas de pureza fueron como los resultados reportados anteriormente para todos los tipos de texto. Por lo tanto, los algoritmos de agrupación para textos cortos se pueden utilizar con confianza en presentaciones en tiempo real.

Para leer el paper completo hacer CLIC AQUÍ.

Fuente: Vinculación con el Medio MBA