|
文字エンコードの自動判定は非常に便利な機能で重宝しているのですが、1点ちょっ
と困ることがあったので、その対策を要望として挙げさせていただきます。
エンコードの自動判定時、HTMLのmetaタグ中のcharset指定を見てコード判定してい
るようですが、HTMLファイルだけでなく、このmetaタグが記述されているファイルで
は同じくこれを元に判定されてしまうケースがあります。
例えば、CGIスクリプト中で
print "Content-Type: text/html\n\n";
print "<HTML><HEAD>\n";
print qq{<meta http-equiv="Content-Type" content="text/html; charset=ISO-2
022-JP">\n};
:
:
のような出力をすることは良くあると思うのですが、この部分も判定に使われてしま
うようです。
ちなみに上の例でmetaタグの行を
print "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=ISO-
2022-JP\">\n";
と、ダブルクォーテーション文字をエスケープした形にすると無視されます。
また対象がHTMLファイルだとしても、metaタグのcharsetの指定とは違うコードで保
存したい場合もあるので(例えばHTMLファイルをテンプレートファイルとして利用し
たい場合等)、このmetaタグによるコード判定を無効にできるようにしていただける
と助かります。
ご一考よろしくお願いします。
|
|