|
ENCODINGSHIFTJISさん
ありがとうございます。
>MSのテキストI/Oは BOM付きUTF-16LE(unicodeと表示されている)
>に対しては化けないと思います、sortも正常(ロケール動作は?)
>BOM付きUTF-16LE なら「カーソル位置への読み込み」もできる。
>
>UTF-8 は対応しないので、ファイル>エンコードの種類
>で 内容を維持したまま適用 はわずらわしい と思いますが。
はじめて見る用語があるのでネットで検索しながら理解しようとして
いますが、文字化けしないという条件を再現させることができません。
MSのテキストI/O とか BOM付きUTF-16LE とかよく概念がつかめて
いないので成功させることができるのに、設定が間違っているのかも
しれません。
「BOM付きUTF-16LE(unicodeと表示されている)」という点だけ見ると
私のファイルはUTF-16の日本語・韓国語混合の文書であり、「LE」と
いうのがよく分かりませんが、「BOM付き」というのは名前をつけて
保存にしてもう一度保存しようとした場合に出るウインドウで、一番
下にある「Add BOM」にチェックが入っていれば「BOM付き」という
条件になるのですよね。コード形式はUnicode(UFT-16)として保存しま
した。この状態で韓国語版XPにおいて外部プログラムで
sort < con > con
とすると結果が新規ファイルに作成されますが、その時点で文字化け
しています。新規ファイルのデフォルトのコードがSJISとなるので
文字化けするのかと思い、結果ファイルのエンコードをUTF-16にしても
文字化けは直りません。
「MSのテキストI/O」がよく分からないのでこの辺に問題があるので
しょうか。秀丸エディタの変換モジュールのソートはSJISの順に
並べ替えされるので、韓国語のとかは規則的に並び替えられないという
問題が起きるので、こういったファイルの場合だけ外部プログラムが
使えないかなと思ったわけです。
もう少し勉強してみます。
|
|