Codificación Iso 8859-1 a UTF-8

Normalmente configuramos nuestro Sistema Operativo, para que los archivos estén codificados bajo el estándar ISO-8859-1, pudiendo suceder que por medio de descargas u otros métodos como la copia desde dispositivos de almacenaje externos, tengamos archivos que no tienen esa codificación.

 También puede suceder que para algún uso concreto, debamos usar archivos con la codificación utf-8 u otra.

 En linux poseemos dos herramientas instaladas por defecto que nos van a permitir por un lado, conocer que codificación se ha empleado en un archivo, y cambiar de formato de codificación de un archivo.

 Las herramientas son file e iconv.

 Con file podemos conocer que tipo de codificación se ha utilizado en un archivo, para ello usaremos la linea de comandos en el terminal de la siguiente manera:

 file -i archivo.ext

con el que obtendremos una información muy similar a esta

  archivo.ext: text/plain; charset=iso-8859-1

 Si deseáramos convertir ese archivo a otro con una codificación diferente, por ejemplo utf-8 podemos realizarlo mediante el uso de iconv de la siguiente manera

 
 iconv -f ISO-8859-1 -t UTF-8//TRANSLIT  archivo.ext -o out.file

con lo que se crearía el nuevo archivo out.file en el que los caracteres estarían bajo el estándar utf-8. 

Iconv reconoce una gran cantidad de tipos de codificación y puede utilizarse entre gran parte de las mismas.

 Con el comando iconv -l, podemos conocer el listado de codificaciones que reconoce.

No hay comentarios:

Publicar un comentario

La Luna Llena del 1 de Agosto

 El martes día uno hay luna llena y un buen momento para realizar el estudio que se indica en el siguiente enlace  Cristales No Empañados Al...