複数文字コードの混在時No.13544
HRS さん 02/11/30 01:23
 
HPのアクセスログを記録するCGIを作成し、リファ(リンク元URL)をテキストファイ
ルに保存しています。
検索サイトから来た場合は検索文字列が分かるのですが、サイトによってはShift-JI
Sであったり、
EUCやUTF-8の場合があります。これ自体は問題無いのですが、テキストファイルを秀
丸エディタで開くと、
文字コードをUnicode(UTF-8)に指定しているにもかかわらず、途中からUTF-8の文字
が化けてしまいます。
(Shift-JISやEUCコードの文字は化けて当然ですが、逆にShift-JISの文字が正しく
読めるようになる。)

少し調べた範囲では、「基礎」とか「情報」という文字がShift-JISで保存されてい
るようなファイルを
UTF-8で開いた時に、これらの文字が現れる前のUTF-8コードの文字は正しく表示され、
これらの文字が
現れた後のUTF-8コードの文字は正しく表示されません。(Shift-JISコードで開いた
ような感じ)
動作環境で「文字コードの自動認識をする」をONにしてもOFFにしても状況は同じです。

一般的には単一の文字コードに統一するべきでしょうが、複数の文字コードを混在さ
せるのは無理でしょうか?
ちなみにこのファイルをブラウザで表示させ、エンコード(文字コードセット)をUn
icode(UTF-8)にしても
このような現象は発生しませんでした。

環境:Windows2000(SP3)
秀丸エディタ 3.17
Internet Explorer 5.01(SP2)
Netscape Navigator 4.78

[ ]
RE:13544 複数文字コードの混在時No.13552
秀丸担当 さん 02/12/02 18:37
 
>文字コードをUnicode(UTF-8)に指定しているにもかかわらず、途中からUTF-8の文字
>が化けてしまいます。

UTF-8とShift-JISの混在はできません。
UTF-8だけのファイルであるのに、途中から文字化けしているとしたら
秀丸の不具合であるかもしれません。
混在しているのにブラウザで開けるというのは不可解なことです。
もし差し支えなければ、問題の起きるファイルを送っていただけると
助かります。調査させていただきます。

[ ]