Més que mai al llarg de la història de les Ciències en general, i de les Ciències de la Terra en particular, els investigadors s'enfronten avui en dia al problema de tractar enormes quantitats de dades heterogènies que creixen contínuament a un ritme gairebé exponencial. Això fa del seu processament i disseminació amb mètodes convencionals tot un repte.
Les dades procedeixen de fonts molt diverses, des de plataformes satel·litàries o sensors de tot tipus, passant per simulacions realitzades amb models numèrics del sistema terrestre o avaluacions del que va passar en el passat combinant totes les fonts d'informació disponibles. Aquestes fonts es fan més complexes. Per exemple, les millores en els models numèrics inclouen un nombre creixent de fenòmens físics amb un major nombre de variables a analitzar i disseminar. Alhora, aquests models augmenten la seva resolució espacial per incorporar millor en la simulació la influència de fenòmens que ocorren a escales més petites o amb freqüències temporals més altes, la qual cosa incrementa el volum de dades generades.
Per exemplificar aquesta realitat, les taules 1 i 2 mostren la mida de les dades generades en els experiments de dos models utilitzats en el Departament de Ciències de la Terra del Barcelona Supercomputing Centre-Centro Nacional de Supercomputación (BSC-CNS), en dos contextos diferents: la qualitat de l’aire i el clima.
L'exemple que il·lustra el problema de la predicció de la qualitat de l'aire (Taula 1) correspon a un context operatiu en el qual es fa una predicció cada dia. Aquest tipus d'operació permet que hi hagi temps suficient per "post-processar", emmagatzemar i disseminar les prediccions de cada dia abans d'haver de tractar les del dia següent. El factor crític en aquest cas rau en proporcionar als usuaris les prediccions, que consisteixen en un resum de les dades obtingudes en la simulació, el més aviat possible perquè puguin prendre les decisions rellevants abans que les prediccions perdin el seu valor. En l'exemple de la simulació del clima global (Taula 2) s'ofereixen les estimacions per a una única simulació que reprodueix l'evolució del clima a alta resolució espacial. Aquests tipus de simulacions es poden realitzar fins a diverses vegades a l'any.
El BSC-CNS opera en aquest moment dos sistemes de predicció de la qualitat de l'aire, el CALIOPE i el Barcelona Dust Forecast Center (BDFC). CALIOPE és un sistema que proporciona prediccions de qualitat de l'aire d’àmbit europeu i, a més resolució, d’àmbit espanyol (fig. 1). Disposa també d'una aplicació mòbil que ofereix una millor interacció amb l'usuari, proporcionant prediccions de la qualitat de l'aire en funció de la localització o per a llocs específics amb un horitzó temporal de dos dies (fig. 2). Una de les aplicacions de CALIOPE consisteix en l'avaluació de determinades mesures sobre la qualitat de l’aire.
El segon sistema operatiu de qualitat de l'aire és el Barcelona Dust Forecast Center (BDFC), una iniciativa conjunta amb l’Agencia Estatal de Meteorología (AEMET), que compta amb la col·laboració de l'Organització Mundial de Meteorologia. Aquest és el primer centre regional que proporciona de manera rutinària prediccions de la pols mineral atmosfèrica per al nord d'Àfrica, Orient Mitjà i Europa (fig. 3).
En tots dos casos, es requereixen plataformes de càlcul d'altes prestacions, en les quals, ordinadors formats d’elements similars als dels ordinadors personals, es troben connectats per una xarxa especial que permet una interconnexió ordres de magnitud més ràpida que la que trobem a Internet, així com infraestructures (discos, nodes de càlcul per al processat, etc) connectades que permeten gestionar el volum ingent de dades.
A nivell de modelització del clima, el BSC-CNS desenvolupa eines de predicció climàtica amb la finalitat de proporcionar informació climàtica a escala global rellevant per a la presa de decisions en un futur pròxim. Un exemple de la informació generada l'ofereix el prototip semi-operatiu RESILIENCE, que proporciona informació probabilística sobre la variació de la velocitat del vent en la propera estació a escala global (fig. 4). Es tracta d'una eina dirigida als usuaris del sector de l'energia eòlica amb l'objectiu d'ajudar a entendre millor la futura variabilitat en la producció d'energia.
Un altre exemple l’ofereix el portal Seasonal Hurricane Predictions que reuneix, en una única plataforma, les prediccions estacionals de freqüència de ciclons tropicals a l'Atlàntic Nord proporcionades per diferents centres especialitzats (universitats, entitats privades i agències governamentals). A més de la predicció per a l'estació d'huracans, la plataforma realitza un seguiment de la seva evolució en temps real capturant la informació disponible públicament (fig. 5).
Com en el cas de la qualitat de l'aire, les prediccions climàtiques necessiten fer ús de la supercomputació per simular processos a escala global que afecten a la formació de fenòmens climàtics. Les tecnologies de Big Data juntament amb la supercomputació i els nous conceptes associats ofereixen el suport necessari per a un servei més eficaç.
A més de la necessitat de tenir capacitat computacional prop dels grans arxius de dades climàtiques, la gran quantitat de dades a emmagatzemar i distribuir també implica haver de considerar problemes com la compressió, la conservació, l'energia utilitzada, la replicació, la governança de les metadades i l'accés segur i senzill per a un espectre ampli d'usuaris. El gran repte en els propers anys serà, a més de ser capaços d'observar millor la Terra amb satèl·lits i un gran rang d'instruments, i simular millor els processos que ens permeten realitzar prediccions precises, l'extracció d'una informació més útil i millor orientada a l'usuari de les enormes bases de dades que s'estan generant.
L'ús dels nous avanços tecnològics en el tractament de Big Data, tant en el marc computacional com a nivell científic, permetran l'accés d'una manera inèdita a informació sobre fenòmens meteorològics, climàtics i de qualitat de l'aire a escales fins ara sense precedents. Creiem que aquests avanços milloraran significativament la seva comprensió i com a conseqüència, permetran la millora dels models ja existents, així com la gestió de recursos naturals, comportant un gran impacte a escala mundial, tant en l’àmbit ambiental com a nivell econòmic. Som conscients que el repte no és només tecnològic sinó també humà ja que l'obtenció d'una informació útil requereix la formació de grups multidisciplinaris que permeten que tècnics amb una gran diversitat de formacions i experiències puguin treballar junts d'una manera eficient.
Bibliografía
Bourne, P.E, J.R. Lorschy E.D. Green(2015). Sustaining the big-data ecosystem. Nature, 527, S16-S17, doi: 10.1038/527S16a.
Meehl, G. A., R. Moss, K. E. Taylor, V. Eyring, R. J. Stouffer, S. Bony y B. Stevens (2014). Climate Model Intercomparison: Preparing for the next phase. Eos, Trans. AGU, 95, 77.
[1] Un PetaByte és una unitat d’emmagatzematge de la informació el símbol de la cual PB, i equival a 1015 bytes: https://es.wikipedia.org/wiki/Petabyte
Autors:
Francesco Benincasa té un màster en Enginyeria Informàtica (algorismes d'optimització) i una experiència de més de 15 anys com a dissenyador i desenvolupador d'aplicacions sobre gestió de dades. En el departament de Ciències de la Terra del Barcelona Supercomputing Center s'ocupa d'eines de gestió i anàlisi de dades.
Pierre-Antoine Bretonnière té un màster en Modelització Matemàtica i Física i ha treballat a diversos centres de recerca sobre canvi climàtic. Treballa ara en el grup de Computational Earth Sciences del Barcelona Supercomputing Center on s'encarrega de la gestió de les dades i eines de diagnòstic de models climàtics.
Alicia Sánchez Lorente, és llicenciada en Ciències Físiques i té un doctorat en Espectroscòpia d'Alta Resolució en rajos X i gamma per la Universitat de Mainz, Alemanya. Actualment, colidera el grup de Ciències Computacionals en Ciències de la Terra al Centro Nacional de Supercomputación a Barcelona. Compta amb una llarga experiència en el tractament de grans volums de dades, així com en el desenvolupament d'eines de modelització i analítica, tasca que ha exercit en un ampli ventall d’àmbits a nivell interdisciplinari i internacional. En la seva posició actual, intenta compaginar aquestes activitats amb el paper que exerceix, avui dia, la intel·ligència artificial en el camp de les Ciències de la Terra.
Marta Terrado és llicenciada en Ciències Ambientals i doctora en Ciències de la Terra per la Universitat de Barcelona. Actualment exerceix com a especialista en Comunicació Científica en el departament de Ciències de la Terra del Barcelona Supercomputing Center-Centro Nacional de Supercomputación.
Francisco Doblas-Reyes és director del Departament de Ciències de la Terra del Barcelona Supercomputing Center-Centro Nacional de Supercomputación. És professor de recerca ICREA des de 2009, autor de més de 120 publicacions científiques, coordinador de diversos projectes de recerca amb finançament públic i privat i membre de diversos comitès internacionals. El seu interès investigador se centra en la predicció del clima a escala global en escales temporals que van des d'un mes a diversos anys en el futur.
Article publicat a .ambiental, la revista del COAMB