viernes, 26 de julio de 2013

OpenData - Colombia

Open Data?


Hace algunas semanas escribi un comentario bastante critico a http://www.datos.gov.co  sobre lo que el estado colombiano denomina "Open Data".
En los ultimos meses el Estado colombiano menciona frecuentemente sus politicas "Open Data".
Interesado en usar los paquetes de datos con algoritmos de Machine learning me emocione un poco.
El sitio web tiene paquetes de datos risibles, risibles porque la cantidad de datos son en los mejores casos 40 registros, o son datos absolutamente inutiles.

El OpenData debe ser una propuesta seria, para que los ciudadanos puedan ejercer control sobre el estado.

Decepcionado con la propuesta mediocre del gobierno he decidido iniciar dos miniproyectos personales.


Recursos para Procesamiento de lenguaje Natural

La idea es coleccionar recursos que ayuden al procesamiento de lenguaje natural. Corpora y diccionarios.

El repositorio LatinamericanTextResources contiene:
  • los discursos del expresidente Alvaro uribe desde el 2007 hasta el 2010
  • los discursos del president Juan manuel santos desde el 2010 hasta el 2013

Recursos sobre Violaciones de Derechos Humanos en Colombia

Usando bases de datos de grafos estoy correlacionando diferentes bases de datos sobre violaciones de derechos humanos. Espero tenerlo pronto en github.
Al momento un buen dataset sobre derechos humanos en colombia esta disponible en www.nocheyniebla.org