El programa iconv es un filtro que permite convertir la codificaciones de texto utilizada por fichero de texto a otra diferente.
iconv resulta especialmente útil si encuentras errores en los en la representación de caracteres extendidos, tales como vocales acentuadas, eñes, diacríticos y demás símbolos.
Cada fichero de texto plano recibe una codificación determinada, la cual especifica la manera en la cual se describen los caracteres que la componen. Cada una de dichas codificaciones por defecto se representarán de acuerdo a la codificación especificada localmente por el usuario (por ejemplo,utf-8
, etc.
El texto convertido se presenta en la salida estándar.
Ver también: Acentos y Eñes en texto-plano
Te conviene primero utilizar el programa file para conocer cuál es la codificación del fichero de texto, pues no son pocos los sistemas operativos que asignan metadatos a los mismos que permiten dilucidar cómo están codificados:
file fichero.txt
fichero.txt: Codepage CP850 extended-ASCII text
iconv convertirá desde una codificación dada con la opción de origen -f
, a otra indicada con la opción de destino -t
.
Por ejemplo, para convertir fichero.txt
en pantalla
iconf -f cp850 -t utf8 fichero.txt
Una vez que estés satisfecho con la conversión, podrás realizarla a un fichero por medio de una redirección:
iconf -f cp850 -t utf8 fichero.txt > fichero_convertido.txt
Como referencia, podrás ver un listado textual de las distintas codificaciones de texto incorporadas al sistema con:
iconv -l