Creare dataset open data georeferenziati con LibreOffice Calc 

Una guida rivolta anche ai meno esperti su come creare un dataset Open Data georeferenziato, cioè con dati geografici.

1. Scopo della guida

Lo scopo della presente guida è divulgare le modalità di creazione di un dataset Open Data georeferenziato, tramite l’applicazione libera e gratuita LibreOffice Calc

2. Cos’è un dataset?

Un dataset è una tabella di dati relazionali; la prima riga del dataset indica il nome del dato che viene inserito in ciascuna colonna.
Per ogni riga del dataset, esiste una associazione tra i dati di ciascuna colonna.   

Tabella Musei Milano
nome museo indirizzo
Acquario Civico Viale Gerolamo Gadio 2
Galleria d’Arte Moderna Via Palestro 16
Musei del Castello Sforzesco Piazza Castello
Museo Archeologico Corso Magenta 15
Museo del Novecento Piazza del Duomo 8
Museo di Storia Naturale Corso Venezia 55
Palazzo Reale Piazza del Duomo 12
Pac (Padiglione d’Arte Contemporanea) Via Palestro 14
Fabbrica del Vapore Via Giulio Cesare Procaccini 4
Casa Museo Boschi Di Stefano Via Giorgio Jan 15
Palazzo Moriggia - Museo del Risorgimento Via Borgonuovo 23
Mudec Via Tortona 56
Palazzo Morando - Costume Moda Immagine Via Andrea (Sant’) 6

Nell’esempio che segue, su ogni riga ad ogni nome di un museo viene associato il suo indirizzo.        
È importante notare che i due titoli delle colonne del dataset, ovvero “nome museo” e “indirizzo” in questo caso, sono semplici da comprendere.

Quando i titoli delle colonne non sono di immediata comprensione, andrà costruito un “data dictionary” che spiega al lettore del dataset il significato dei titoli delle colonne.
Anche il “data dictionary” è una tabella relazionale: nell’esempio di seguito viene data una breve descrizione dei titoli delle colonne.

Tabella Descrizione Colonne
colonna descrizione
nome museo La colonna contiene il nome del museo
indirizzo La colonna contiene l’indirizzo del museo

3. Cosa vuol dire Open Data?

Creare Open data vuol dire rendere accessibili a tutti sul web i dati delle amministrazioni pubbliche, in formato aperto, senza restrizioni di copyright, brevetti o altre forme di controllo che ne limitino l'utilizzo, l'integrazione e il riuso, seppur nel rispetto delle disposizioni previste dalla normativa vigente.

Le Pubbliche Amministrazioni, in particolare, sono chiamate a pubblicare i dati in formato aperto al fine di dare concreta attuazione al principio secondo il quale i dati, prodotti dalle istituzioni pubbliche nell'espletamento delle loro funzioni, appartengono alla collettività e, quindi, devono essere resi disponibili e riutilizzabili. 

In questo modo viene incrementata la trasparenza degli organismi pubblici nonché la partecipazione e la collaborazione tra pubblico e privato.

4. Cosa vuol dire che il dataset è georeferenziato?

Un dataset è georeferenziato quando, per ogni riga del dataset, esiste una colonna che indica le coordinate geografiche del luogo. 
Di seguito un esempio di tabella, dove ad ogni museo viene associata una coordinata geografica.

Tabella Musei con Coordinate
nome museo Location
Acquario Civico (45.4738009709, 9.18102424936)
Galleria d’Arte Moderna (45.4727715273, 9.19989295138)
Musei del Castello Sforzesco (45.46905374, 9.18123900996)
Museo Archeologico (45.465621941, 9.17863909832)
Museo del Novecento (45.4633084093, 9.19042210497)
Museo di Storia Naturale (45.4726581975, 9.20250857419)
Palazzo Reale (45.4631438148, 9.19107142252)
Pac Padiglione d’Arte Contemporanea (45.4728972384, 9.19950069662)
Fabbrica del Vapore (45.4840031675, 9.17547901649)
Casa Museo Boschi Di Stefano (45.4788545128, 9.21155456149)
Palazzo Moriggia - Museo del Risorgimento (45.4721902069, 9.18892895648)
Mudec (45.4514555221, 9.16161348145)
Palazzo Morando - Costume Moda Immagine (45.468643132878604, 9.196307710400147)

Grazie alle coordinate geografiche è possibile generare una mappa dei musei, come nell’immagine che segue.

5. Cosa è LibreOffice Calc?

LibreOffice Calc è un foglio di calcolo libero e gratuito, con il quale è possibile creare tabelle di dati, mettere in ordine i dati, editare i dati, contare i dati, analizzare i dati e molto altro.
Puoi trovare delle guide su LibreOffice calc sul sito ufficiale

6. Da dove iniziare per creare un dataset?

Per prima cosa è consigliabile visualizzare un dataset di esempio all’interno di LibreOffice Calc, per vedere come è fatto.
Apri LibreOffice Calc sul PC, otterrai un foglio bianco, come quello di seguito.

Dal menù in alto, clicca su “Foglio” 🡪 “Collegamenti esterni” per importare i dati di esempio.

Incolla nella casella “URL della sorgente dati esterna” un link da cui estrarre i dati, come ad esempio questo link:

 https://dati.comune.milano.it/dataset/87139f9c-7089-4b82-9f5d-1489e7ceb29e/resource/767ecccd-941d-4dec-a852-fa4965165436/download/milanomuseicard20240415.csv 

Assicurati che la casella ”Aggiorna ogni” non sia selezionata.

Premi “invio” sulla tastiera, e nella schermata successiva assicurati che:

  • Il tipo di carattere sia “Unicode (UTF-8)”
  • Il “separato da” sia il “Punto e virgola”
  • Il delimitatore stringa siano le virgolette “ ” 
  • Sia spuntata l’opzione “Formatta il campo tra virgolette come testo”

Premi “Ok” e visualizza i dati all’interno della tabella.

Cambia i titoli delle colonne ed inserisci i tuoi dati.

7. Come salvare un dataset?

Dopo aver inserito i dati, clicca sul menù “File” 🡪 “Salva con nome”.

Dai un nome al file e seleziona “Testo CSV (*.csv)” nella casella “Salva come”:

Seleziona come 

  • Set di caratteri “Unicode (UTF-8)”
  • Separatore di campo, il “punto e virgola”
  • Delimitatore stringa, le “virgolette con doppi apici”

Clicca “OK” per salvare il file.

8. Come georeferenziare un dataset?

Come nel dataset di esempio, le ultime tre colonne del dataset devono chiamarsi “LONG_X_4326”,  “LAT_Y_4326” e “Location”.

Tabella Coordinate
LONG_X_4326 LAT_Y_4326 Location
9.18102424936 45.4738009709 (45.4738009709, 9.18102424936)
9.19989295138 45.4727715273 (45.4727715273, 9.19989295138)
9.1812390096 45.46905374 (45.46905374, 9.1812390096)
9.17863909832 45.4656129141 (45.4656129141, 9.17863909832)
9.19042210497 45.4633084093 (45.4633084093, 9.19042210497)
9.20250857419 45.4726581975 (45.4726581975, 9.20250857419)
9.19107142252 45.4631438148 (45.4631438148, 9.19107142252)
9.19950069662 45.4728972384 (45.4728972384, 9.19950069662)
9.17547901649 45.4840031675 (45.4840031675, 9.17547901649)
9.21155456149 45.4788545128 (45.4788545128, 9.21155456149)
9.18982985648 45.4721902069 (45.4721902069, 9.18982985648)
9.1613148145 45.4515455221 (45.4515455221, 9.1613148145)
9.196307710400147 45.468643132878604 (45.468643132878604, 9.196307710400147)

Il Comune di Milano pubblica un dataset con la georeferenziazione dei numeri civici di tutta la città.
Per trovare le coordinate di un indirizzo vai alla pagina:

Questa è la pagina dedicata:

Clicca su “Download” 🡪 “CSV”

Apri LibreOffice Calc, e seleziona dal menù “File” 🡪 “Apri”

Seleziona il file appena scaricato e clicca su “Apri”

Assicurati che l’importazione del file avvenga con le impostazioni di cui sopra, ovvero che:

  • Il tipo di carattere sia “Unicode (UTF-8)”
  • Il “separato da” sia il “Punto e virgola”
  • Il delimitatore stringa siano le virgolette “ ” 
  • Sia spuntata l’opzione “Formatta il campo tra virgolette come testo”

Clicca “OK”.

Nella colonna “AD – DESCRITTIVO”, trova il nome della via o della piazza che ti interessa.

Nella colonna “C - Numero”, trova il numero civico che ti interessa.

Nelle ultime tre colonne del dataset, “LONG_X_4326”,  “LAT_Y_4326” e “Location”, sono presenti le coordinate geografiche del numero civico, che puoi copiare e incollare nel tuo file.


Consulta altre guide

Come visualizzare con QGIS un dataset Open Data georeferenziato

Segui la guida che spiega anche ai meno esperti come visualizzare un dataset Open Data con l'applicazione libera e gratuita QGIS.

Come utilizzare gli strumenti di Milano Statistica

Segui la guida all'utilizzo della piattaforma Milano Statistica, per visualizzare, utilizzare e scaricare i tuoi dati d'interesse.