El Big Data és el nom que reben els conjunts de dades, els procediments i les aplicacions informàtiques, que, pel seu volum, la seva naturalesa diversa i la velocitat a què han de ser processades, ultrapassen la capacitat dels sistemes informàtics habituals.
La primera cita al terme Big Data la va fer als anys 90, l’informàtic teòric nordamericà John Mashey en el seu article “Big Data and the Next Wave of Infrastress”.
El principal objectiu de tots els sistemes que processen Big Data és extreure’n patrons. Es busca poder reduir una quantitat d’informació totalment immanejable per al ser humà i per a la majoria de sistemes informàtics, per a obtenir-ne informació més limitada i que sigui interpretable, que ens permeti treure’n conclusions.
Es pot definir en 5 característiques principals anomenades les 5 V’s: Volum, Varietat, Velocitat, Veracitat y Valor de la dada.
Com a exemple dels elevats volums d’informació amb què acostumen a treballar els tècnics de Big Data, aquí tenim una mostra (font: Forbes) del que passa a internet durant 2016 en un sol minut.
El fet d’haver d’emmagatzemar tota aquesta informació, ja és un repte en si mateix. Pensem doncs en anar un pas més enllà i intentar processar aquest volum cada minut i extreure’n patrons i conclusions. Simplement és una obra faraònica! Però aquí entren moltes disciplines científiques. No només hi ha enginyers i informàtics treballant. Són molt importants els matemàtics, estadístics, físics, i tot tipus de científics de base. Sense la seva aportació seria impossible reduir la informació que s’ha de processar.
Fins on podrà arribar la capacitat de procés del Big Data? És difícil de preveure. D’una banda els sistemes informàtics cada dia que passa són més potents i permeten processar més informació per segon. Però d’altra banda la informació que es recull per minut durant 2016 és exponencialment més gran que la que es recollia el 2015. Avui dia, creix més el volum d’informació que la capacitat de processar-la. Potser en un futur el creixement d’informació s’estancarà perquè ja no quedaran persones al món desenvolupat que no estigui “connectat”, i la tecnologia continuarà avançant fins a un possible punt d’equilibri.
Per exemple comparant la gràfica anterior de 2016, durant l’any 2015: Uber oferia només 695 viatges per minut, Amazon venia 119,760 dòlars i Spotify transmetia només 13,300 hores de música.
Algunes aplicacions del Big Data que poden resultar curioses:
Beisbol:
La temporada 2002 als Estats Units el gerent d l’Oakland Athletics, Billy Beane, va introduir una revolució al món de l’esport en general. Va contractar un jove economista, Peter Brand, i junts es van dedicar a contractar jugadors infravalorats, però econòmicament rendibles. El criteri de selecció va deixar de banda als experimentats caçatalents, i es va basar únicament en els patrons i les conclusions que podien extreure de l’anàlisi en Big Data d’infinitat d’estadístiques i números que es recollien en cada partit. A partir d’aquí van concloure quin jugador s’adaptava millor a cada posició i a cada moment del joc.
L’any 2011 Hollywood va portar la història a la pel·lícula: Moneyball: Rompiendo las reglas.
Altres aplicacions que tots ens trobem cada dia, però no ens hi fixem:
- Els trending topic de Twitter. Extreure 10 paraules a partir d’una infinitat de tuits cada minut.
- Els Google Trends. Eina molt elaborada que extreu els patrons de les paraules que més s’estan cercant i publicant en webs a tot el món.
- Les prediccions meteorològiques. Els instituts de física meteorològica inverteixen grans sumes de diners en tecnologia i científics per poder avançar més temps les prediccions i les catàstrofes naturals.
- En el camp de la medicina i la biologia. Es tracta de poder entendre les causes d’una patologia a partir de grans quantitats de dades de pacients de tot el món.
La gestió publicitària s’ha revolucionat des que els grans operadors: google, facebook, etc. apliquen la gestió del Big Data. Fes aquesta prova: Busca un determinat producte a Google. Per exemple un rellotge d’un model i marca concrets. Ara tanca el navegador. Torna’l a obrir i vés a Facebook. A què en els anuncis que et mostra apareix curiosament el mateix rellotge que havies buscat a Google? Màgia? No. Big Data! Tingues en compte que Google i Facebook són competidors directes; per tant, excepte que facin tractes obscurs per darrere NO comparteixen informació entre ells.
Per tant com ha sabut facebook que estàs interessat en aquest rellotge?
Si un producte és gratuït, llavors és que el producte ets tu!
Cada cosa que fas a internet deixa rastre. Un rastre immens, que és analitzat per les grans corporacions. De vegades de forma legal i de vegades de forma més fosca. Creus que si tens un compte de correu de Gmail, Google fica o no fica el nas en el que escrius? Oficialment segur que et diran que no miren la informació privada dels usuaris. Però internament segur que han de passar processos antivirus, sistemes de protecció a la privacitat, control de drets d’autor i vés a saber quantes coses més. A Google li interessen dues coses: Per una banda poder fer un perfil de la teva persona per mostrar-te publicitat amb més eficiència, i d’altra banda, poder perfilar a totes les persones del món sense importar com es diu cadascun, per poder optimitzar el seu cercador.
La informació que ens dóna el cercador Google optimitzada per a la nostra persona, és un avantatge i un inconvenient a la vegada. L’avantatge és que si ha pogut deduir que a mi m’agrada una determinada marca de rellotges a causa de les pàgines web que visito, als texts que escric, a les fotos que miro, etc. em pot fer servei que quan cerco la paraula “rellotge” ja em mostri la resposta molt personalitzada als meus gustos. L’inconvenient ve per la contrapartida d’aquest filtratge digital. Serà molt difícil que Google em mostri noves marques de rellotges o noves tecnologies en el món dels rellotges, perquè no m’està ensenyant coses en les quals jo encara no he mostrat interés. I no li puc mostrar perquè simplement desconec que existeixen.
Com pots veure no totes les aplicacions del Big Data són positives per a nosaltres. El principal damnificat de tots aquesta anàlisi d’informació és la nostra privacitat.
El big data tiene un poder tremendo de hacer el bien, pero solo por lo catastróficas que pueden ser las consecuencias de un fallo —por accidente o por ataque— puede conllevar un problema muy grave. También existe el problema de la privacidad y de quién es el dueño de los datos. Philip Evans. El País – Tecnologia.
El Big Data es pot usar contra nosaltres. A tot arreu on hi ha una tecnologia que pot ser molt positiva, hi ha qui hi veu la part fosca i l’aplica.
Com diu Philip Evans, imaginem que la teva companyia d’assegurances monitoritza tots els paràmetres de conducció del teu vehicle. T’ho vendran com un tema de seguretat i assistència, però en realitat ho faran servir per saber si ets bon o mal conductor i en funció d’això t’apujaran la prima de risc.
Recordes l’argument de la pel·lícula “Minority Report“? Anem cap aquí?