// estás leyendo...

General

La Irracional Efectividad de los Datos

En raras ocasiones uno se topa con un artículo científico que, dado su interés, su foco en lo pragmático y su buena escritura, se convierta en un artículo fácilmente digerible por casi cualquier persona, o al menos para cualquier persona con unos ciertos conocimientos informáticos o matemáticos. En este artículo, “The Unreasonable Effectiveness of Data“, 3 grandes Googlers (Alon Halevy, Peter Norving y Fernando Pereira) reflexionan sobre la importancia de dejar que los datos hablen por si mismos, de tratar de olvidar la creación de modelos extremamente complejos, o incluso la tendencia a utilizar datos etiquetados que muchos tenemos dentro de las áreas de la gestión de la información.

En el blog de Sistemas Inteligentes traduzco el abstract de este artículo al castellano, por si alguien quiere enterarse de qué trata con más profundidad antes de leerlo por completo (son apenas 5 páginas, así que no asusta mucho), pero os dejo algunas reflexiones que se me plantean al leer el artículo.

  1. Los datos son efectivos, claro está, pero ¿efectivos para qué? Para muchas tareas los datos por si mismos no sirven para mucho. Hay que tener claro cuál es nuestro objetivo, y trabajar en función de ellos. Por ejemplo, Google Translation hace uso de traducción estadística, gracias a su corpus, pero únicamente con estadística no se pueden construir sentencias gramaticalmente correctas.
  2. Los datos generan información, y la información genera conocimiento. Nosotros utilizamos el conocimiento para razonar pero únicamente con datos no es posible razonar. Para procesos de razonamiento necesitamos todo el mundo de lo Semántico, así que tampoco es cuestión de olvidarnos de las ontologías y la semántica, solo ser pragmáticos y utilizar lo más simple que podamos utilizar para cumplir nuestros objetivos.

Fotografía licenciada bajo CC-nc-sa por nickwheeleroz

Discusión

Sin comentarios para “La Irracional Efectividad de los Datos”

Comentar