Techno-magis

Décembre 2015

Décompression ZIP et l'encode des noms de fichiers

Lundi 21 Décembre 2015

Le format ZIP est un format très rependu. Malheureusement, le nom des fichiers est encodé suivant l'encodage du système1, ce qui fait qu'une fois décompressé, on peut se retrouve avec un nom de fichier nommé de la sorte « �s����Ȑ_�l.ext », ce qui a beaucoup de chance de le rendre fichier illisible l'état par d'autres programmes, mais aussi vous-même. Il faut donc le renommer et c'est là que ça se complique vu que l'on ne connaît pas forcément le nom d'origine.

Heureusement, sous Linux, il existe convmv qui permet de déplacer en masse des fichiers en réencodant leur nom, un mélange de « mv + conversion ».

Pour tester une conversion ici du SHIFT_JIS vers l'UTF8 :

CODE :

convmv -f SHIFT_JIS -t UTF8 *

Et pour réaliser la conversion :

CODE :

convmv -f SHIFT_JIS -t UTF8 --notest *

Parfois des petites choses nous rendent la vie impossible, et d'autres nous en sauvent. 😊

  • 1 :

    ZIP ne semble pas conserver l'encodage des fichiers contrairement d'autres formats comme RAR ou TAR.GZ. En tout cas, je ne remercie pas Windows qui n'est pas fichu d'avoir le même encodage suivant la langue du système, ce qui peut rendre une installation impossible pour un logiciel chinois ou japonais sur un poste en français.


Commenter le billet...
Catégories :
Par Zéfling, le 21/12/2015 à 21:23:58
Le billet a été lue 218 fois, avec 0 commentaire publié.