[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[linux_var] Verificare codifica file e cambiarla

To: LinuxVar Pubblica <talking@ml.linuxvar.it>
Subject: [linux_var] Verificare codifica file e cambiarla
From: Luigi B <luigi.b@alice.it>
Date: Mon, 08 Apr 2013 16:27:20 +0200
List-archive: <http://ml.linuxvar.it/pipermail/talking>
List-help: <mailto:talking-request@ml.linuxvar.it?subject=help>
List-id: linux_var - LUG di Varese e Provincia Mailing List <talking.ml.linuxvar.it>
List-post: <mailto:talking@ml.linuxvar.it>
List-subscribe: <http://ml.linuxvar.it/cgi-bin/mailman/listinfo/talking>, <mailto:talking-request@ml.linuxvar.it?subject=subscribe>
List-unsubscribe: <http://ml.linuxvar.it/cgi-bin/mailman/options/talking>, <mailto:talking-request@ml.linuxvar.it?subject=unsubscribe>
Reply-to: linux_var - LUG di Varese e Provincia Mailing List <talking@ml.linuxvar.it>
Sender: talking-bounces@ml.linuxvar.it
User-agent: Mozilla/5.0 (X11; Linux i686; rv:17.0) Gecko/20130403 Firefox/17.0 Thunderbird/17.0.5

Condivido una cosa che è servita a me, spiegandola in modo che siacomprensibile anche a chi ha meno dimestichezza con certi meccanismi diLinux.

Nei miei sistemi non avevo impostato l'utf-8. Ho deciso di farlo, peròinevitabilmente poi mi sono trovato con alcuni file che avevano un'altracodifica, vedendoli con i classici caratteri strani.Linux offre delle soluzioni molto semplici e già perfettamente integrateper questo problema.

Per verificare la codifica di un file abbiamo il classico comando"file", con l'opzione "--mime-encoding".

Un esempio su di un file di testo che chiameremo "prova-codifiche.txt".

Il testo contenuto sarà "Prova codifica caratteri è ò à ù ì". Icaratteri accentati verranno visualizzati in modo errato nel caso che ilnostro sistema sia impostato su "utf-8" e se il file sarà codificato adesempio in "iso-8859-1".

Infatti se diamo un:

$ cat prova-codifiche.txt

(attenzione: il carattere "$" è il prompt dei comandi!)

otterremo:

Prova codifica caratteri � � � �

(spero che nella vostra lettura si vedano i punti interrogativi al postodei 5 caratteri accentati)


Se daremo un:

$ file --mime-encoding prova-codifiche.txt

il risultato sarà:

prova-codifiche.txt: iso-8859-1

Ora, se vogliamo modificarne la codifica dovremo farlo con un piccologiro. Useremo un altro tool nativo di linux: "iconv".Come prima cosa dovremo ottenere un altro file dove verrà copiato ilcontenuto di questo ma con la codifica che vogliamo noi (ATTENZIONE: nonfatelo sullo stesso file! Ma nemmeno usando il nome di un file esistentealtrimenti con la redirezione ">" lo sovrascriverete distruggendone ilcontenuto!). In questo caso la nuova codifica sarà "utf-8":

$ iconv -f iso-8859-1 -t utf-8 prova-codifiche.txt >prova-codifiche-utf-8.txt

(il file in cui verrà copiato il contenuto l'ho chiamato"prova-codifiche-utf-8.txt", ma potete chiamarlo come volete, basta chenon sia il nome del file originale e, RIPETO, nemmeno di un fileesistente altrimenti ne distruggerete il contenuto!)

Dopo potremo decidere di sovrascrivere il file originale con quellocodificato nella nuova codifica:


$ mv prova-codifiche-utf-8.txt prova-codifiche.txt

Se ora daremo di nuovo un:

$ file --mime-encoding prova-codifiche.txt

otterremo:

prova-codifiche.txt: utf-8

e se daremo un cat:

$ cat prova-codifica.txt

il risultato sarà:

Prova codifica caratteri è ò à ù ì

I caratteri accentati saranno visualizzati correttamente nel nostrosistema impostato su utf-8.

Un'ultima cosa, tutto questo volendo si potrebbe includere in uno scriptche, combinando il comando "find", potrebbe convertire tutti i filepresenti in una o più directory, o in tutto il computer, da altrecodifiche a "utf-8", o a quello che ci interessa.


Spero questa miniguida sia utile a qualcuno.

Saluti! :)
Gigi

PS: che dite, la metto sul sito?

_______________________________________________
Talking mailing list
Talking@ml.linuxvar.it
http://ml.linuxvar.it/cgi-bin/mailman/listinfo/talking

Prev by Date: Re: [linux_var] Vim
Next by Date: Re: [linux_var] Vim
Previous by thread: Re: [linux_var] Verificare codifica file e cambiarla
Next by thread: [linux_var] Incontro LIFO 8 aprile (e cavo scart)
Index(es):
- Date
- Thread