Big Data

Demasiada información

Pese a que hace un tiempo comenzó a circular en los medios, el término Big Data resulta todavía desconocido para la mayoría de las personas ajenas al mundo de la informática. En charla con Noticias Exactas, el especialista Esteban Feuerstein da su parecer sobre esta disciplina, de la que se pronostica que en pocos años podría revolucionar la economía, la ciencia y hasta la vida cotidiana.

18 Jun 2014 POR
Big Data es el término que se utiliza para referirse a las cantidades astronómicas de datos que se guardan día a día en Internet y a la tecnología necesaria para procesarlos y transformarlos en información útil.

Big Data es el término que se utiliza para referirse a las cantidades astronómicas de datos que se guardan día a día en Internet y a la tecnología necesaria para procesarlos y transformarlos en información útil.

http://noticias.exactas.uba.ar/audio/EstebanFeuerstein.mp3
Descargar archivo MP3 de Esteban Feuerstein

En los últimos 10 años se ha creado más información que en toda la historia de la humanidad. De acuerdo con un informe elaborado por un instituto europeo, en Internet, cada minuto se envían 204 millones de correos electrónicos, se descargan 47 mil aplicaciones para smartphones y tablets, se abren más de 100 nuevas cuentas en LinkedIn y 320 en Twitter, se realizan 277 mil logins en Facebook, se escriben 100 mil tuits, se suben 30 horas de video a YouTube y se ven 1,3 millones de videos. Este inconmensurable tráfico de datos, además, seguirá creciendo de manera exponencial.  Naciones Unidas calcula que en el 2016 habrá cerca de 18.900 millones de dispositivos conectados a la red a escala mundial, lo que llevaría a que el tráfico global de datos alcance los 130 exabytes (1018) anuales. Este volumen equivale a 33 billones de DVDs.

“Estamos generando lo que se llama una ‘huella digital’ cada vez que nos movemos con nuestro celular porque, aunque no estemos hablando, las antenas están registrando dónde estamos; también cuando utilizamos GPS en el auto; cuando compramos por Internet; cada vez que un producto pasa por la caja de un supermercado. Todo queda registrado y guardado”, explica Esteban Feuerstein, doctor en Informática y profesor del Departamento de Computación de Exactas. Y agrega, “cada mensaje de texto, cada foto que subimos a Facebook, cada twit, son datos. Algunos se usan, otros no, pero potencialmente se podrían usar”.

Justamente, Big Data es el término que se utiliza para referirse a estas cantidades astronómicas de datos que se guardan día a día en Internet y a la tecnología necesaria para procesarlos y transformarlos en información útil. Claro que, semejante volumen de información incluye todo tipo de datos lo que hace imposible su análisis a partir de las bases tradicionales. “El volumen y la variedad de los datos que constituyen Big Data representan un desafío tecnológico muy importante”, se explaya Feuerstein y añade, “cuántos más datos tenés, más datos malos tenés también. En toda fuente de información hay errores y cuando tenés muchas fuentes, tenés muchos más errores. Separar el ‘ruido’ de la información útil es clave”.

Ahora bien, ¿quiénes han sido, hasta ahora, los más interesados en almacenar este maremágnum de datos? Por un lado, las agencias de Inteligencia -basta recordar las denuncias sobre la complicidad de la Agencia Nacional de Seguridad de los Estados Unidos con algunos de los más importantes buscadores y redes sociales-. Por otro, las grandes empresas. “Muchas de las firmas más importantes de la actualidad son valiosas gracias a los datos que han almacenado sobre sus clientes. Por eso los guardan muy celosamente y no los comparten con nadie”, revela Feuerstein. Para muchas compañías esta información constituye un insumo estratégico ya que les permite anticiparse a los deseos de los consumidores y ofrecerles nuevos productos y ofertas personalizadas.

Resulta esencial entender que Big Data no se trata simplemente de un aumento cuantitativo del flujo de datos que recibe la web sino que ese crecimiento da por resultado una herramienta de naturaleza cualitativamente diferente. “Estamos frente a un cambio de paradigma. Antes, un hospital no podía guardar millones de estudios individuales para siempre. Hoy día sí puede almacenar millones de bytes de información”, describe Feuerstein y remata, “esto genera nuevas formas de pensar. Antes, frente a cualquier pregunta había que analizar si era posible reunir los datos que permitieran buscar una respuesta. Ahora, en cambio, sabemos que la información está”.

Feuerstein

Esteban Feuerstein. Foto: Diana Martinez Llaser. Exactas-Comunicación.

Las posibilidades del Big Data parecen ilimitadas a la hora de imaginar la manera en que puede revolucionar diferentes ámbitos como la salud, la genética, el agro, las redes sociales, el marketing y las finanzas. En la industria petrolera, por ejemplo, a partir de sensores ubicados en el terreno, se puede obtener información que permita la optimización de las perforaciones de manera tal de encontrar con menos pozos el lugar ideal para realizar la extracción. En el agro, se puede medir la humedad del terreno con dispositivos ubicados en cada metro cuadrado del terreno, para luego decidir con suma precisión a qué profundidad plantar las semillas y qué cantidad de fertilizante es necesaria. Lo mismo ocurre en el campo de la salud: “Hace poco participé de una charla junto a un investigador que trabaja MIT (Massachusetts Institute of Technology) que afirmaba que los desarrollos más importantes de la medicina en la próxima década van a venir de la mano de la informática”, cuenta el especialista.

Dada la importancia que este tema está cobrando en todo el mundo, en 2013 se creó el “Programa de Ciencia de Datos” en la Fundación Sadosky con el objetivo de promover  y coordinar un conjunto de actividades destinadas a convertir a nuestro país en líder regional en Big Data. Feuerstein es coordinador de esta iniciativa: “Desde el MINCyT se detectó que Big Data era un área estratégica por eso se están impulsando iniciativas de capacitación, desarrollo de aplicaciones, financiamiento específico, utilización de tecnología Big Data en el agro”, resume y cierra: “Si no desarrollamos esta tecnología nosotros, la va a desarrollar otro y el valor agregado va a ser apropiado por otras sociedades”.