|
HPのアクセスログを記録するCGIを作成し、リファ(リンク元URL)をテキストファイ
ルに保存しています。
検索サイトから来た場合は検索文字列が分かるのですが、サイトによってはShift-JI
Sであったり、
EUCやUTF-8の場合があります。これ自体は問題無いのですが、テキストファイルを秀
丸エディタで開くと、
文字コードをUnicode(UTF-8)に指定しているにもかかわらず、途中からUTF-8の文字
が化けてしまいます。
(Shift-JISやEUCコードの文字は化けて当然ですが、逆にShift-JISの文字が正しく
読めるようになる。)
少し調べた範囲では、「基礎」とか「情報」という文字がShift-JISで保存されてい
るようなファイルを
UTF-8で開いた時に、これらの文字が現れる前のUTF-8コードの文字は正しく表示され、
これらの文字が
現れた後のUTF-8コードの文字は正しく表示されません。(Shift-JISコードで開いた
ような感じ)
動作環境で「文字コードの自動認識をする」をONにしてもOFFにしても状況は同じです。
一般的には単一の文字コードに統一するべきでしょうが、複数の文字コードを混在さ
せるのは無理でしょうか?
ちなみにこのファイルをブラウザで表示させ、エンコード(文字コードセット)をUn
icode(UTF-8)にしても
このような現象は発生しませんでした。
環境:Windows2000(SP3)
秀丸エディタ 3.17
Internet Explorer 5.01(SP2)
Netscape Navigator 4.78
|
|