Clicca su Avanti

Aggiornamento firmware stampante Brother HL-5240

Grep e il problema di encoding dei caratteri

Non ho idea del perchè il “buon” MS Sql Server utilizza la codifica UTF-16 quando esporta i file di log – non è da escludere che chi ha configurato il database lo abbia impostato così di proposito (spero abbia avuto i suoi buoni motivi per farlo) o probabilmente per errore. Fatto sta che in queste condizioni andando di grep si riscontrano problemi di matching.

Naturalmente la soluzione è quella di convertire il file di log (un comune csv) da UTF-16 in UTF-8

iconv --from-code UTF-16 --to-code UTF-8 filelog.csv > newlog.csv

Date le impostazioni di codifica vi ritroverete con un file di log dalle dimensioni esattamente dimezzate e finalmente digeribile da grep.

Tassonomia dei dati del social networking

Stavo preparando delle slide sul trattamento dei dati da parte dei social network (ed ero quasi alla fine) quando mi sono imbattuto in questo interessante post di Schneier che inevitabilmente mi ha fatto cambiare rotta e rimesso in discussione quanto avevo precedentemente riportato sulle mie slide.

L’articolo tradotto in italiano è disponibile per intero sul numero di Dicembre 2009 di Cryptogram

1. Dati di servizio. I dati di servizio sono quelle informazioni che è necessario fornire al sito di social networking per poterne fare uso. Tali informazioni potrebbero comprendere nome e cognome, età e numero di carta di credito.

2. Dati divulgati, pubblici. Sono i contenuti che si pubblicano sulle proprie pagine: entrate di blog, fotografie, messaggi, commenti, eccetera.

3. Dati affidati. È ciò che si pubblica sulle pagine di altre persone. In sostanza, si tratta dello stesso tipo di dati divulgati visti prima, ma la differenza è che non si ha il controllo di questi dati: qualcun altro lo ha (la persona sulla cui pagina si è scritto o commentato, per esempio).

4. Dati accidentali. I dati accidentali (o casuali, o accessori, ecc.) sono quelle informazioni che altre persone scrivono su di noi. Anche in questo caso, si tratta dello stesso tipo di dati divulgati visti al punto 2, ma la differenza è che 1) non abbiamo il controllo su queste informazioni, e 2) non le abbiamo nemmeno create noi.

5. Dati comportamentali. Sono le informazioni sulle nostre abitudini che il sito di social networking raccoglie registrando quel che facciamo e con chi lo facciamo.