複数文字コードの混在時 - 秀丸エディタ関連ソフト会議室 - スレッド13544, 2002/11/30

複数文字コードの混在時

HRS さん　02/11/30 01:23

HPのアクセスログを記録するCGIを作成し、リファ（リンク元URL）をテキストファイ
ルに保存しています。
検索サイトから来た場合は検索文字列が分かるのですが、サイトによってはShift-JI
Sであったり、
EUCやUTF-8の場合があります。これ自体は問題無いのですが、テキストファイルを秀
丸エディタで開くと、
文字コードをUnicode(UTF-8)に指定しているにもかかわらず、途中からUTF-8の文字
が化けてしまいます。
（Shift-JISやEUCコードの文字は化けて当然ですが、逆にShift-JISの文字が正しく
読めるようになる。）

少し調べた範囲では、「基礎」とか「情報」という文字がShift-JISで保存されてい
るようなファイルを
UTF-8で開いた時に、これらの文字が現れる前のUTF-8コードの文字は正しく表示され、
これらの文字が
現れた後のUTF-8コードの文字は正しく表示されません。（Shift-JISコードで開いた
ような感じ）
動作環境で「文字コードの自動認識をする」をONにしてもOFFにしても状況は同じです。

一般的には単一の文字コードに統一するべきでしょうが、複数の文字コードを混在さ
せるのは無理でしょうか？
ちなみにこのファイルをブラウザで表示させ、エンコード（文字コードセット）をUn
icode(UTF-8)にしても
このような現象は発生しませんでした。

環境：Windows2000(SP3)
秀丸エディタ 3.17
Internet Explorer 5.01(SP2)
Netscape Navigator 4.78

RE:13544 複数文字コードの混在時

秀丸担当 さん　02/12/02 18:37

>文字コードをUnicode(UTF-8)に指定しているにもかかわらず、途中からUTF-8の文字
>が化けてしまいます。

UTF-8とShift-JISの混在はできません。
UTF-8だけのファイルであるのに、途中から文字化けしているとしたら
秀丸の不具合であるかもしれません。
混在しているのにブラウザで開けるというのは不可解なことです。
もし差し支えなければ、問題の起きるファイルを送っていただけると
助かります。調査させていただきます。