!!!注意!!!
半角カタカナを含むファイルを UNIX に持ち込むことは 絶対にやめて下さい。これらは MULE などの聰明なエディタさえもときに 混乱させ、完全には復元できないようなファイルを生成してしまうこと があります。
cat
や more
で
見る場合、その中で日本語が EUC
で書かれているのに
出力コードが SJIS だと、正しく表示されません。
自分が使うコードを EUC などに統一しておき、
環境変数 LANG を ja_JP.EUC
と設定して、
less
を使うようにすれば問題ないでしょう。
nkf
は漢字コードを変換します。
他にも kc, kcc
などの変換ソフトも存在します。
nkf
は DOS 上でも動くものがあり、
フリーウェアのqkc
などとともに DOS 上での漢字変換を
行ないます。
例:漢字コードを EUC に変換する場合。
$ nkf -e filename >filename.eucこれは、ファイル
filename
を EUC コードに変換し
filename.euc
に落します。
ただし、DOS 上での qkc
はファイルを直接書き換えるので、
">filename.euc"
に相当する部分は必要ありません。
!!!注意!!!
くれぐれも
nkf -e file>file
というようなことはしないで下さい。
もとのファイル file
が失われます。
nkf
などでは解決できない
ことがあります。このようなとき、
rjis, rsjis, rujis
などのコマンドを用いるとかなり復元できることがあります。
$ rjis filename > filename.fixなどとします。