Si dice che ogni giorno vengano prodotti circa 2.5 quintilioni (un numero con 17 cifre!) di dati e che questo valore sia in costante crescita. Al di là del numero preciso, è indubitabile che il fenomeno sia gigantesco e non per niente si parla dell’era dei big data.
Se da un lato la disponibilità di questa marea di informazioni ha stimolato l’innovazione in quasi tutti i campi dell’azione umana, la loro gestione ha posto (e continua a porre!) delle grandi sfide per l’informatica e ciò che indirettamente la riguarda. Accenniamo di seguito a due delle tante dimensioni che si possono sviluppare sul tema dei dati, riservandoci di lasciare gli approfondimenti ai link in fondo alla pagina e a prossime pubblicazioni.
Memoria e sua organizzazione
Fino a qualche decennio fa, il problema principale nella memorizzazione dei dati era anzitutto relativo alla tecnologia a disposizione, che non era in grado di garantire l’accesso efficiente a grandi quantitativi di memoria, se non altro non a costi sostenibili per tutti gli attori potenzialmente interessati.
La situazione odierna per cui grandi aziende del settore riescono a offrire servizi fino a qualche anno fa impensabili a prezzi accessibili, non è arrivata solamente con il miglioramento delle performance dell’hardware a disposizione e delle infrastrutture di comunicazione, ma ha richiesto anche lo sviluppo di sistemi scalabili, cioè di sistemi in grado di variare la loro capacità in base alla domanda e alla disponibilità di risorse.
Questo, a sua volta, ha reso necessario un cambio radicale delle strutture tipicamente impiegate nell’organizzazione lato software dei dati: i database a grafo, più adatti nella gestione di grandi moli di dati molto interconnessi, sono oggi implementati nelle numerose situazioni in cui i database relazionali standard risulterebbero inefficienti.
Apertura e beni comuni
La grande disponibilità di dati ha enfatizzato anche l’importanza di trattare il tema in ambito giuridico, non solo dal punto di vista normativo ma anche da quello dei principi, dovendo affrontare la questione anche dal lato etico e dei diritti. Seppure infatti risultino decisive le norme in materia di protezione dei dati (come nel caso del regolamento europeo, comunemente noto come GDPR), si sono rivelati altrettanto significativi i problemi legati alla possibilità di accesso e di utilizzo dei dati pubblici. A questo scopo è nato il concetto di dati aperti (Open Data), che nel settore pubblico ha portato a un modello di trasparenza e di apertura delle amministrazioni pubbliche noto come governo aperto. In Italia, in materia di Open Data, resta ancora un po’ di lavoro da fare, già solo per uniformare la situazione dal livello locale a quello statale.
… e tanto altro!
Chiaramente, come anticipato, un tema così complesso come quello dei dati porta con sé tantissime altre possibili sfaccettature: questioni come la sicurezza, l’analisi, la rappresentazione, ecc. Ciascuna di queste implica un gran numero di problemi ancora aperti, a conferma una volta di più che i dati sono uno dei nodi cruciali del nostro tempo.
Approfondimenti
- Un approfondimento su come i big data entrino, con l’ausilio della robotica e dell’intelligenza artificiale, nel campo della salute: https://www.scienzainrete.it/articolo/big-data-robot-e-intelligenza-artificiale-salute/flavio-lirussi/2021-03-22
- Un approfondimento sui database a grafo: https://www.cwi.it/applicazioni-enterprise/database-a-grafo-111080
- La pagina del governo italiano relativa alle politiche di open government, con un link alla guida per gli scettici: https://open.gov.it/governo-aperto