Recientemente he tenido la suerte de asistir al mayor encuentro mundial de minería de datos educativos: el congreso “Educational Data Mining 2015”, que ha celebrado su octava edición en Madrid, hospedado por la UNED y el grupo de Investigación aDeNu del Departamento de Inteligencia Artificial.
La Minería de Datos Educativos (EDM) es una disciplina emergente, que se centra en el desarrollo de métodos para explorar los datos procedentes del contexto educativo. En los últimos años desde distintos ámbitos (que incluyen informática, estadística y educación) han estado investigando sobre cómo la minería de datos puede mejorar la educación. Los datos que se utilizan proceden de diversas fuentes: clases en entornos tradicionales presenciales, software educativo, cursos on line o tests y pruebas acumulativas. Todas ellas proveen de una cantidad de datos en aumento, que puede ser analizada para dirigir preguntas que antes no era posible realizar y contemplan diferencias entre poblaciones de estudiantes o comportamientos específicos. Por ejemplo: ¿Existen diferencias significativas en los resultados que obtienen los estudiantes en función de factores demográficos? ¿Cómo podemos “modelizar” los tipos de estudiantes para ofrecerles el diseño pedagógico que proporcione mejores resultados de aprendizaje? ¿Incluiremos elementos de “gamificación” en todas las materias para aumentar la motivación?…
Las aportaciones de la minería de datos educativos han influido en las teorías de la pedagogía y el aprendizaje y han impulsado la mejora del software educativo, sobre todo respecto a su capacidad para personalizar la experiencia del estudiante.
La experiencia de la mineria de datos en el ámbito comercial se ha aplicado a la educación, si bien hay algunas diferencias importantes entre ellos:
- Ámbito: La meta de la minería de datos en comercio electrónico es influir en los clientes para que compren, mientras que en los sistemas educativos el propósito es guiar al estudiante en el aprendizaje.
- Datos: En eCommerce, la procedencia de los datos es fundamentalmente de los registros del acceso de los usuarios a los servidores, mientras que en EDM hay mucha más información disponible sobre los estudiantes que permite enriquecer el modelado del usuario (el estudiante en este caso). Según el tipo de entorno educativo (clase tradicional, formación basada en el ordenador…) y el tipo de sistema de información que lo respalda (un LMS o sistema gestor de aprendizaje, un sistema de tutorías inteligente o un sistema hipermedia adaptativo) los datos recogidos serán también diferentes, pues no son ya sólo datos sobre el perfil de los estudiantes, sino también de sus interacciones con cada uno de los actores del proceso formativo (con el sistema, con el educador y con sus iguales) y con los contenidos y tareas que se realizan durante el aprendizaje.
- Resultados: En el eCommerce el indicador principal es el beneficio, con otros secundarios como el número de clientes o su fidelidad, medibles de forma bastante directa, mientras que en aprendizaje son más difíciles de conseguir y deben ser obtenidos a partir de otros como la mejora del desempeño.
- Técnicas: La mayoría de las técnicas tradicionales de minería de datos como la clasificación, la agrupación (clustering), y la asociación se han aplicado con éxito en Educación, con las adaptaciones necesarias.
Pero ¿de qué han hablado los “mineros” de datos educativos en este último Congreso? Los temas principales han sido:
- Tutores automáticos que pueden proponer al estudiante contenidos más adaptados a su estilo de aprendizaje, a su nivel de estudios, a su velocidad de asimilación, a su evolución durante el curso… Pueden incluso detectar dónde fija la mirada el estudiantey saber si está “pensando en otra cosa”, para tratar de volver a captar su atención.
- Minería de datos y entornos pedagógicos emergentes, como los juegos educativos, los MOOC, y el aprendizaje exploratorio. ¿Cómo influyen estos entornos en los resultados de los estudiantes?
- Minería de datos en aprendizaje social y colaborativo: ¿se pueden predecir los resultados de los alumnos a partir de las emociones percibidas en los foros del curso?
- Revisión del "estado del arte" en técnicas de análisis de datos, sistemas de recomendación web, análisis de redes sociales, minería de opinión y modelizado del estudiante en educación (motivación, asimilación, resultados, errores …).
- Entornos de desarrollo para EDM, técnicas, métodos de investigación y enfoques: neurociencia educativa, grafos de aprendizaje…
También se abordaron temas delicados relacionados con los grupos de interés que participan en el proceso educativo (profesores, alumnos, entidades educativas, padres de los alumnos) como :
- ¿Hasta dónde llega el derecho a la privacidad de los datos?: ¿darán los padres su consentimiento a que los datos de sus hijos puedan condicionar su futuro profesional?
- ¿Qué sucedería si la seguridad de los datos quedara en entredicho?
- ¿Qué ocurrirá si se manipulan los datos para que los resultados mostrados condicionen las conclusiones con un determinado fin? (Don’t be evil).
- ¿Alguien ha pensado en la necesidad de un Plan de gestión del cambio para poder implantar estas tecnologías de manera concreta en instituciones y organizaciones?
Muchos de estos aspectos ya se han abordado en el sector de la salud, con soluciones rigurosas aplicables perfectamente al sector educativo.
Os invito a daros un paseo por esta interesante mina y buscar programas (muchos gratuitos) que nos permitirán encontrar “filones” para la innovación, aunque no lo olvidemos: la tecnología no es por sí sola innovación, sino una de las herramientas para llegar a ella al buscar maneras de aplicarla. En este sentido, la contribución de big data, que permite, mediante procesado distribuido, analizar millones de datos, es inestimable.
Imagen: Alan Newman

Soluciones y Sectores
Te puede interesar
-
Nodo IoT: el corazón de los edificios inteligentes en una smart city
Una ciudad se compone de edificios de todo tipo (residenciales, comerciales, industriales, públicos…) y para que se considere una ...
-
Una industria conectada es una industria sostenible
La industria manufacturera representa el 11,3% del PIB español pero es responsable del 24% del consumo energético y el ...
-
Radiografía de la experiencia de empleado en España
Las nuevas formas de trabajo suponen un cambio fundamental en la cultura de las organizaciones y una valiosa herramienta ...