Grep e il problema di encoding dei caratteri

Non ho idea del perchè il “buon” MS Sql Server utilizza la codifica UTF-16 quando esporta i file di log – non è da escludere che chi ha configurato il database lo abbia impostato così di proposito (spero abbia avuto i suoi buoni motivi per farlo) o probabilmente per errore. Fatto sta che in queste condizioni andando di grep si riscontrano problemi di matching.

Naturalmente la soluzione è quella di convertire il file di log (un comune csv) da UTF-16 in UTF-8

iconv --from-code UTF-16 --to-code UTF-8 filelog.csv > newlog.csv

Date le impostazioni di codifica vi ritroverete con un file di log dalle dimensioni esattamente dimezzate e finalmente digeribile da grep.

code , , , . URL.

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

*

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>