Lo sappiamo, la quantità di dati astronomici presenti negli archivi, grazie anche ai metodi di indagine più moderni e agli strumenti più sofisticati, sta raggiungendo dei livelli incredibili, in termini di copertura del cielo e della qualità e quantità di dati raccolti. La gran parte di questi dati è a disposizione della comunità scientifica senza vincoli o restrizioni, ed è ormai frequente che ulteriori analisi di dati di archivio portino ad eccellenti nuovi lavori, quando non a scoperte davvero importanti.

Ecco che la fruizione sempre più intelligente delle mole di dati diventa fondamentale, per il continuo progresso della scienza, e per massimizzare l’utilità delle informazioni già raccolte (questo è l’obiettivo del data mining, su cui avremo modo di tornare). Al proposito si registra ancora una certa frammentazione dei dati disponibili. Da una parte abbiamo risorse online come Astrophysics Data System  (ADS, in breve) della NASA – ormai strumento di lavoro insostituibile per ogni astronomo-  per quanto riguarda i dati bibliografici, ovvero le pubblicazioni. Dall’altra, una buona quantità di archivi e database, che raccolgono i dati astronomici veri e propri.

Il sito NASA ADS è diventato un punto di riferimento imprescindibile per chi studia lo spazio ….

ADS è veramente una miniera di sapere impressionante: contiene circa nove milioni di riferimenti bibliografici e quattro milioni e mezzo di pagine scansionate. Per giunta, più di un milione di articoli sono presenti col il loro testo completo. Ogni astronomo professionista non può più lavorare senza.

ADS però non contiene in sè dati veri e propri. Questi sono catalogati in altri archivi come il SIMBAD Astronomical Database. Ora, il fatto è  che queste entità normalmente non si parlano, non sono in realazione tra loro. Allo stato attuale, salvo poche eccezioni, sono come  “scatoloni” a se stanti.

Ed ecco però che arriva l’idea geniale (ed ambiziosa) della creazione di un ADS All-Sky Survey, contenuta in un articolo apparso pochi giorni fa su astro-ph, a firma di Alberto PepeAlyssa Goodman e August Muench. Pensate come sarebbe bello se ogni articolo in ADS avesse una “targhetta” (un tag) riguardante la zona di cielo di cui si occupa, o gli oggetti che studia. Tramite tale targhetta (chiamiamola astrotag come gli autori dell’articolo) sarebbe facile esplorare visivamente delle zone di cielo (al proposito, il software non manca) e vedere in ogni porzione della volta celeste gli studi che ne sono stati fatti. Oppure esplorare un oggetto e vedere la lista degli articoli e dei dati.

Immaginate le ricerche che potrebbero essere condotte, avendo a disposizione un programma che vi consente di esplorare la volta celeste con tanto di riferimenti alle pubblicazioni relative, punto per punto. Senza complicate e spesso inconcludenti ricerche di archivio.

Il fatto è che molti articoli su ADS non hanno queste targhette già appiccicate. L’articolo però ci fornisce una strada, perché mostra come questo può essere fatto in larga parte con procedure automatiche. Queste procedure prendono in esame i dati dell’articolo, esaminano le figure in esso contenute, e tramite l’uso di risorse già disponibili come astrometry.net se la cavano in gran parte dei casi.

Insomma l’idea è tutto sommato semplice (non così la sua realizzazione): etichettare tutti gli articoli di ADS, in modo da poterli mettere in relazione con i dati veri e propri. Tutto questo promette una svolta epocale nella fruizione degli archivi di dati astronomici.

Per parte mia seguirò con interesse lo sviluppo del progetto. Se ne vedranno di belle, in cielo. Anche con l’aiuto dei computer.

Loading