Datamining

Para hacer Datamining y descubrimiento del conocimiento se necesitan Datos. Aunque estemos rodeados de datos, muchos no se pueden utilizar con libertad por ser privados abarcados por licencias y terminos de uso que casi nadie lee.

Justamente este fue uno de los obstaculos cuando buscaba tema de tesis, estuve mucho tiempo abordando y descartando temas por no tener datos que pueda usar libremente. Fue asi como me encontre con los Datos Abiertos que de manera similar al software libre podia: utilizarlos, modificarlos, compartirlos libremente.


Mi tesis se trata de Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires. El reconocimiento de dígitos manuscritos es un tema que ocupa distintas areas de conocimiento e investigacion tanto en aprendizaje automático como en clasificación de patrones. Su importancia se debe al interés que genera la posibilidad de su aplicación práctica mediante la automatización de la comprensión del alto volumen de documentos impresos en empresas, gobiernos y una sociedad en expansion permanente. Para citar algunos ejemplos la gestión automática de correo postal, procesamiento de cheques bancarios, ingreso manual de datos en formularios, registros gubernamentales y tarjetas de credito impresas son aplicaciones de gran uso.
Resumen de la Tesis (link 1) |  Resumen de la Tesis (link 2) |  Link a la tesis (Spanish)

También exploré lo que es el análisis de redes sociales, y aca comparto un trabajo práctico final de curso de Análisis de Redes Sociales en la universidad de Michigan durante el Otoño 2013. Utilicé una red de actores de películas argentinos. El trabajo está basado en IMDB, analicé películas y actores, creé una estructura de datos de grafo y analicé la relación entre actores que trabajan juntos. Análisis de Red Social de Actores