Descripción:
El presente trabajo presenta la implementación de un sistema de clasificación
automática para categorizar las respuestas de estudiantes a foros de
discusión de acuerdo al dominio cognitivo de la taxonomía de Bloom.
Diversos estudios se han llevado a cabo en esta área, en esta ocasión la
efectividad y desempeño de un clasificador Bayesiano, específicamente el
clasificador Naïve Bayes, son analizados. En esta propuesta este clasificador
es empleado conjuntamente con técnicas de minería de texto y un conjunto
de datos previamente clasificado por expertos para llevar a cabo la
categorización.
Este proyecto también contempló la implementación de una interfaz de
usuario en la versión cuatro del Sistema Interactivo de Desarrollo para el
Web – SIDWeb versión 4, con el objetivo que los profesores puedan
interactuar con el sistema de clasificación automática, etiquetando a través
de este las participaciones y contribuciones de estudiantes en los foros de
discusión que se efectúan dentro de SIDWeb 4. También se proveen
estadísticas de las participaciones de los estudiantes en las discusiones, así
como también de las categorías dentro de la taxonomía que están
alcanzando con la finalidad que los educadores puedan a simple vista tener
una idea de si están logrando los objetivos de aprendizaje planteados, el
vi
nivel al que están llegando sus estudiantes y si se encuentran discutiendo
superficialmente o si están generando nuevo conocimiento.
Otro aspecto que se estudió fue el determinar si el sistema de clasificación
puede compararse o considerarse como un codificador humano. Varias
pruebas fueron llevadas a cabo con el objetivo de obtener métricas cuyos
valores permitieron evaluar el desempeño del clasificador y calidad de los
resultados. Los resultados obtenidos indican que usando la arquitectura
propuesta es posible lograr los objetivos planteados, sin embargo la
efectividad de la clasificación se ve afectada por la calidad de los datos de
entrenamiento provocando que se logre buenos resultados para los niveles
de la taxonomía de los que se tienen una cantidad considerable de ejemplos
y malos resultados para los niveles que poseen pocos ejemplos etiquetados.