Analisi del dataset “Theater History of Operations (THOR) Data: World War II”

Il GULLi ha lanciato l’iniziativa per una propria analisi del dataset “Theater History of Operations (THOR) Data: World War II“.[1] Il dataset riporta i dati dei bombardamenti aerei degli alleati durante la seconda guerra mondiale e pensiamo che l’analisi possa creare diversi interessi sia storici (quando, dove e come sono avvenuti i bombardamenti) che tecnici (come analizzare i file CSV con Python, geopandas, SQL). Per favorire l’iniziativa i dati sono stati caricati anche su un database PostgresSQL sul server del GULLi, mettendo così a disposizione a chiunque fosse interessato una base di dati condivisa (alcuni dati sono stati e dovranno essere corretti) accessibile da chiunque.

Queste alcune delle rappresentazioni che possono essere realizzate:

Bombardamenti alleati nel teatro europeo
Bombardamenti in Toscana

Bombardamenti per obiettivi città di Livorno
(tonnellate di esplosivi)

Interessi storici

L’iniziativa aspira a raccogliere aspetti e episodi storici, magari anche sotto forma di piccoli racconti, legati ad eventi identificati sui dati. A solo titolo di esempio, è possibile calcolare la quantità totale di materiale bellico sganciato sopra ogni paese:

  • Germania 1.991.588,00 t
  • Francia 820,945.00 t
  • Italia 417,004.62 t
  • etc…

Sarebbe interessante conoscere come e dove venivano prodotti quantitativi così ingenti.

E’ possibile estrarre le date di inizio e di fine dei bombardamenti in una determinata città o area geografica. Sarebbe interessante collegare nozioni storiche a questi periodi.

In rete è disponibile molto materiale storico, solo a titolo di riferimento segnaliamo:

Interessi tecnici

L’iniziativa offre l’opportunità di imparare l’uso di diversi strumenti informatici, linguaggi di programmazione, applicazioni più o meno complessi, formati standard di dati, etc…. Fra questi sono già stati identificati:

  • Database PostgreSQL : un database server che il GULLi ha installato e che mette a disposizione
  • Formato CSV: il formato di testo più comune per i dati testuali
  • Python: uno di più potenti linguaggi del momento
  • Jupyter: un ambiente per sviluppare le procedure di analisi in Python
  • PGAdmin: una interfaccia utente per accedere
  • SQL: linguaggio per l’interrogazione e gestione delle basi di dati 

Ed inoltre l’uso di librerie Python come Pandas, GeoPandas, Folium e Matplotlib

Strumenti

Il GULLi mette a disposizione sul proprio account Gitlab spazi web per condividere:

  • Interrogazioni SQL da usare nelle applicazioni o direttamente sull’interfaccia PgAdmin
  • Applicazioni Python o altro, Jupiter Notebook
  • Immagini e grafici

Risultati e articoli verranno pubblicati sul sito web del GULLi (https://linux.livorno.it).

Analisi

Le analisi potranno prendere in considerazione uno o più eventi storici e cercheranno testimonianze, relazioni ed approfondimenti nei dati a disposizione sul database. Viceversa, si cercherà di trovare testimonianze storiche a partire dai dati delle missioni registrati sui database.

Elenco delle analisi disponibili

Per collaborare all’iniziativa o per qualsiasi informazione info@linux.livorno.it