エンコード自動判定について要望No.18163
ma2ten さん 04/10/20 11:25
 
文字エンコードの自動判定は非常に便利な機能で重宝しているのですが、1点ちょっ
と困ることがあったので、その対策を要望として挙げさせていただきます。

エンコードの自動判定時、HTMLのmetaタグ中のcharset指定を見てコード判定してい
るようですが、HTMLファイルだけでなく、このmetaタグが記述されているファイルで
は同じくこれを元に判定されてしまうケースがあります。
例えば、CGIスクリプト中で

  print "Content-Type: text/html\n\n";
  print "<HTML><HEAD>\n";
  print qq{<meta http-equiv="Content-Type" content="text/html; charset=ISO-2
022-JP">\n};
          :
          :

のような出力をすることは良くあると思うのですが、この部分も判定に使われてしま
うようです。
ちなみに上の例でmetaタグの行を

  print "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=ISO-
2022-JP\">\n";

と、ダブルクォーテーション文字をエスケープした形にすると無視されます。

また対象がHTMLファイルだとしても、metaタグのcharsetの指定とは違うコードで保
存したい場合もあるので(例えばHTMLファイルをテンプレートファイルとして利用し
たい場合等)、このmetaタグによるコード判定を無効にできるようにしていただける
と助かります。

ご一考よろしくお願いします。

[ ]
RE:18163 エンコード自動判定について要望No.18164
Iranoan さん 04/10/20 16:21
 
 ma2ten さん今日は、Iranoan です。
 念の為お断りしておくと、開発者とは何の関わりも無い単なる一ユーザです。
> エンコードの自動判定時、HTMLのmetaタグ中のcharset指定を見てコード判定してい
> るようですが、HTMLファイルだけでなく、このmetaタグが記述されているファイルで
> は同じくこれを元に判定されてしまうケースがあります。
<snip>
> また対象がHTMLファイルだとしても、metaタグのcharsetの指定とは違うコードで保
> 存したい場合もあるので(例えばHTMLファイルをテンプレートファイルとして利用し
> たい場合等)、このmetaタグによるコード判定を無効にできるようにしていただける
> と助かります。
 常に meta タグによるエンコードの指定を無視したければ、[その他]→[動
作環境] で左下の「上級者向け設定」を ON にした上で、[ファイル]→[エン
コード 1] の「HTML の meta タグを認識」を OFF にします。

[ ]
RE:18164 エンコード自動判定について要望No.18165
ma2ten さん 04/10/20 16:31
 
> 常に meta タグによるエンコードの指定を無視したければ、[その他]→[動
>作環境] で左下の「上級者向け設定」を ON にした上で、[ファイル]→[エン
>コード 1] の「HTML の meta タグを認識」を OFF にします。

やや、これは…失礼しました。ちゃんとすでにこういう設定があったんですね。
良く確認もせずに申し訳ありませんでした。
ということで解決です。(^^;)

[ ]