Excel: normalizzare gli elenchi di Excel con Google Refine

Partendo da un buon elenco, in Excel puoi analizzarlo, filtrarlo, riassumerlo con una tabella pivot e più in generale puoi estrarre informazioni dai dati in modo molto semplice, veloce e senza dover fare formule complesse.

E quindi alla fine il problema che hanno tutti coloro che usano Excel per fare analisi dati è sempre quello: normalizzare le tabelle di origine e ripulirle di tutti gli errori, imprecisioni, doppioni e problemi vari. Vale anche qui il classico principio garbage in garbage out, ovvero per avare informazioni buone occorre partire da dati buoni.

Esempio: nel campo “Nazione” troviamo a volte “GB”, a volte “Inghilterra”, a volte “Gran Bretagna”. Oppure: nella colonna “Percentuale” a volte troviamo “0,5″ e a volte “50″.

Ripulire le tabelle sporche è un lavoraccio ingrato e il più delle volte manuale. Una volta ho visto con i miei occhi (terrorizzati), in una società di cui non dirò il nome, che il controllo delle estrazioni dati da SAP verso Excel veniva fatto confrontando a mano su due schermi che proiettavano uno  l’originale SAP e l’altro la copia in Excel. Livelli di stress alle stelle!

Nei casi più spinosi io ho trovato molto utile Google Refine, uno strumento rilasciato quest’anno che permette di effettuare trasformazioni automatiche su grosse moli di dati.

Google Refine è in grado di importare dati in qualsiasi formato, come TXT, CSV, XML, XLS e XLSX, JSON e Google Spreadsheets, e direttamente dal web; esporta invece verso CSV, Excel e tabelle HTML.

Google Refine va scaricato e installato, nelle versioni per Windows, Mac OSX e Linux. Una volta installata, l’applicazione gira come server ed è raggiungibile puntando il proprio browser al localhost http://127.0.0.1:3333/.

Per cominciare a usare Google Refine, il primo passo è senz’altro guardarsi questo video.

Share

da Brain a StuxNet, 25 anni di virus informatici

Sono passati 25 anni dal Gennaio 1986, mese e anno in cui venne rinvenuto Brain, il primo virus informatico della storia.

Cosa è successo in questi 25 anni? Prova a spiegarcelo il bravissimo Mikko Hypponen, Chief Research Officer di F-Secure, nonchè uno dei guru della sicurezza informatica universalmente riconosciuti.

9 minuti per un video altamente istruttivo.

Share

Bing copia Google???

Parrebbe di sì, almeno leggendo questo ottimo report realizzato dagli ingegneri di google:

http://googleblog.blogspot.com/2011/02/microsofts-bing-uses-google-search.html

Una vera e propria trappola, escogitata dai tecnici di Google, fatta di criteri di ricerca completamente diversi dai risultati, messi apposta per non essere riproducibili con le comuni ricerche ma solo copiandone i risultati.

Fosse tutto vero, e ad oggi pare difficile che non lo sia leggendo l’articolo, Microsoft farebbe una bruttissima figura.

Si può competere in due modi solitamente: essere più bravi, o essere più furbi. A breve termine si vince anche con il secondo, ma di sicuro sul lungo periodo solo il primo ha successo.

Share