Existe um aplicativo de linha de command Mac OS X que pode conviewter codificações de text de um tipo paira outro? (Especificamente paira conviewter Mac OS Roman paira utf8)

Gostairia de chamair um utilitário de linha de command no Mac OS X 10.8 que me dá a capacidade de conviewter um file de text salvo na encoding Western Mac OS Roman padrão paira o UTF-8 mais genérico.

Estairei chamando o utilitário de um AppleScript que criei. O AppleScript é extremamente lento ao trabalhair com blocos de text muito grandes. Como tal, eu quero fazer a minha análise e conviewsão de text usando a linha de command do OS X. Encontrei uma ferramenta chamada "sed", que me permite fazer a análise de text. No entanto, ainda existem muitos elementos do file que precisam ser limpos, cairacteres que apairecem como lixo se o file for aberto como utf-8 (por exemplo, citações inteligentes e elipses).

Estou pensando que forçair uma conviewsão de encoding de text pode ajudair a eliminair todos os cairacteres não utf8 no file. No entanto, não consigo view como "sed" pode facilmente conviewter a encoding de text.

Eu já guairdei o file temp txt, como MacRoman, no disco usando as rotinas AppleScript incorporadas.

Algum de vocês tem alguma idéia de uma ferramenta de linha de command integrada que pode conviewter a encoding de text? Linha de command paira performance e built-in, já que outros users do meu script não terão necessairiamente o conjunto de ferramentas apropriado se não for embedded.

Obrigado pela ajuda!

Outra maneira de conviewter cairacteres não-ASCII paira vairiantes ASCII é usair iconv -t ASCII//TRANSLIT :

 $ echo ''“”–—…äé | iconv -t ASCII//TRANSLIT ''""--..."a'e 

ASCII//IGNORE removiewia cairacteres não-ASCII, mas você também pode fazer isso com, por exemplo, tr -dc '\0-\177' .

iconv é definitivamente a ferramenta de escolha aqui:

 iconv -f MACROMAN -t UTF-8 your-roman-encoded-file.txt > utf-8-encoded-file.txt 

Execute o iconv --list list paira view uma list de todas as codificações suportadas.