文字コード自動判別のUIに質問と提案No.08223
なんと さん 01/04/03 19:58
 
なんとです。長くてすみません。

鶴亀の会議室の方での文字コード自動判別の話題に関連してなのです
が、試しているうちにちょっと確認したいことと、それが正しかった
場合、提案したいことがあります。

まずお聞きしたいことなんですが、「ファイルタイプの設定」「保存
・読込み」で「標準の文字コード」に「自動判別」という選択肢があ
りますね。これを選んだ場合の動作は、「動作環境」の「編集」「文
字コードの自動認識を行なう」によって変わるのでしょうか。

試した限りでは「文字コードの自動認識を行なう」が、
ONの時:Shift-JIS/EUC/JIS/UNICODE/UTF-8,7を自動判別
OFFの時:Shift-JIS/UNICODEの自動判別
というように、判別対象のコードの数が違う・・んですよね?(これ
が確認したいこと)

これが正しい場合、どうもわかりにくいのではないかと思うのですが。
つまり、「自動認識を行なう」オプションは半角カナの誤判定を避け
るためのものだと思うのですが、それならば、「動作環境」の方の
「文字コードの自動認識を行なう」オプションは廃止して、「ファイ
ルタイプ別の設定」の「標準の文字コード」の選択肢を

Shift-JIS/UNICODE自動判別
全て自動判別
Shift-JIS


とした方が、設定場所が一つですんでいいのではないでしょうか。そ
の選択欄の下に「全て自動判別の場合、半角カナを含むファイルで誤判
定する場合があります」と注を付けて。(これが提案)

「ファイルタイプ別の設定」の方の文字コード判別欄は後からついた
もののようで、「動作環境」の方のオプションは過去からの引き継ぎ
で残ってしまったために、このようなややこしさがあるのでは、と思
うのですが。できれば整理していただけるといいなあと。

#それとも、僕は思いつかないだけで、今の仕様の方が合理的な理由
#があるでしょうか。

あと、「ファイルタイプ別の設定」の方では「自動判別」だけなのに、
開くダイアログなどでは「Shift-JIS/UNICODE自動判別」となってい
るのも不統一な気がします。実際には「Shift-JIS/UNICODE」だけじゃ
ない場合もありますし。(というか、ここの動作がわからなくて調べ
ているうち、今回の提案になったのです)

もし、僕の勘違いなどありましたらご指摘下さい。

あ、あとヘルプの「ファイル形式の指定」で「JIS」と「UTF-7」が改
行がなく、くっついてしまってます。

[ ]
RE:08223 文字コード自動判別のUIに質問とNo.08225
ひろ さん 01/04/03 20:46
 
 なんとさん今日は、ひろです。
> まずお聞きしたいことなんですが、「ファイルタイプの設定」「保存
> ・読込み」で「標準の文字コード」に「自動判別」という選択肢があ
 これはあくまで、ダイアログを開いた時のデフォルトの文字コードの指定で、
> 「動作環境」の「編集」「文
> 字コードの自動認識を行なう」によって変わるのでしょうか。
は日本語文字コードの自動認識を行うかどうかの設定です。ですから
> ONの時:Shift-JIS/EUC/JIS/UNICODE/UTF-8,7を自動判別
> OFFの時:Shift-JIS/UNICODEの自動判別
> というように、判別対象のコードの数が違う・・んですよね?(これ
だと私も思います。以下これが前提です。

> つまり、「自動認識を行なう」オプションは半角カナの誤判定を避け
> るためのものだと思うのですが、それならば、「動作環境」の方の
> 「文字コードの自動認識を行なう」オプションは廃止して、「ファイ
> ルタイプ別の設定」の「標準の文字コード」の選択肢を
<中略>
> とした方が、設定場所が一つですんでいいのではないでしょうか。そ
 確かにスッキリするとは思いますが、まずダイアログのデフォルト値を設
定することと、実際に開かれたときに自動認識をするかは、本来別問題だと
思います。
 ダブルクリックなどで開かれたときは、デフォルトの設定に従って自動認
識するかどうか決めればよいとは思いますが、さてどちらがユーザに優しい
のでしょう?

> #それとも、僕は思いつかないだけで、今の仕様の方が合理的な理由
 合理的な説明というわけではなく私の想像ですが、内部的には
(1)一旦ファイル内容を読み込む
(2)文字コードの自動認識
(3)秀丸の内部コード Shift-JIS に変換
(4)ファイルタイプ別の設定に従って表示
という流れではないでしょうか?
 こう考えて理由は、表示される文字によって色付けやコメント文の処理が
異なるため、文字コードの自動認識を先に行い、ファイルタイプ別の設定は
その後になると考えた為です。これが正しければ、「ファイルタイプ別の設
定」は、後で読み込まれるので、なんとさんの提案は難しいかなと思います。

 まあこんな話はどうでも良くて、これと似た状況の設定項目として、禁則
処理もありますが、実際初心者にとってはどちらが解りやすいのでしょう?

> あと、「ファイルタイプ別の設定」の方では「自動判別」だけなのに、
> 開くダイアログなどでは「Shift-JIS/UNICODE自動判別」となってい
 こちらについては全くの同意見です。

[ ]
RE:08225 文字コード自動判別のUIに質問とNo.08226
なんと さん 01/04/03 21:26
 
なんとです。

> > ・読込み」で「標準の文字コード」に「自動判別」という選択肢があ
>  これはあくまで、ダイアログを開いた時のデフォルトの文字コードの指定で、

えーと、まずここから疑問です。ヘルプには「ダイアログ*などの*」
と書いてありますし、ダブルクリックで開いた時に実際に判別するか
どうかという動作も規定しているように思えます。

実際、「自動判別」以外(たとえばShift-JIS)にしていると、「文
字コードの自動認識を行なう」をONにしてもJISコードなどのファイ
ルをちゃんと表示できません。ね?

なので、現状すでに「単なるダイアログの初期値ではない」と僕は判
断しているんです。あ、先程のメールでは書きませんでしたが。

>  確かにスッキリするとは思いますが、まずダイアログのデフォルト値を設
> 定することと、実際に開かれたときに自動認識をするかは、本来別問題だと
> 思います。

別問題でもいいのですが、いっしょにしてあっても特に問題は起きな
い類いのことだと思うんですよ。実際、上に書いたように「現状です
でに連動している」と思われますし。

なので、これ以降のひろさんの推測やご意見は、前提が違っているた
めに、僕の提案の障害とはならないように思うんです。

> > #それとも、僕は思いつかないだけで、今の仕様の方が合理的な理由
>  合理的な説明というわけではなく私の想像ですが、内部的には
> (1)一旦ファイル内容を読み込む
> (2)文字コードの自動認識
> (3)秀丸の内部コード Shift-JIS に変換
> (4)ファイルタイプ別の設定に従って表示
> という流れではないでしょうか?


(4)が疑問です。ファイルタイプ別の設定にある項目というのは、全
てファイルが開かれた後に適用されるわけじゃないだろうと思うので
すが。少なくとも、拡張子を見てそれに対応したファイルタイプを見
つけて、「標準の文字コード」を適用して開いて、それから他の表示
項目を適用する、という動作の方が自然じゃないかなあと(^^;

や、これは秀丸担当さんなり秀まるおさんなり、ソースを見られる人
でないとわからないでしょうけど。もしひろさんのおっしゃる通りの
動作なら、なんと複雑な・・(^^;

このような技術的な問題で不可能ではないことを願います(^^;

ただ、現状すでに両オプションは連動してる(ように見える)ので、
このような技術的問題もないんじゃないかなあと。

[ ]
RE:08226 文字コード自動判別のUIに質問とNo.08228
ひろ さん 01/04/04 00:38
 
 なんとさん今日は、ひろです。
> えーと、まずここから疑問です。ヘルプには「ダイアログ*などの*」
> と書いてありますし、ダブルクリックで開いた時に実際に判別するか
> どうかという動作も規定しているように思えます。
 私の認識は完全に間違っていたようで、確かにその様ですね。
 なんとさんの仰る通りのようなので、それなら動作環境から消しても良い
と思ったのですが、やはり拙いかも。どんな場合かというと、grep を行う
場合です。<-たった今思い出した。

[ ]
RE:08228 文字コード自動判別のUIに質問とNo.08229
なんと さん 01/04/04 01:13
 
なんとです。

ひろさん、こんにちは。お付き合いいただきありがとうございます。

> と思ったのですが、やはり拙いかも。どんな場合かというと、grep を行う
> 場合です。<-たった今思い出した。

あー、なるほど。これは気づきませんでした。やはり意見交換って大
事ですね。

うーん、ただ、これを考慮しても、ファイルタイプ別の設定と動作環
境が連動しているのはわかりにくいと思うんですよね。(考え中)

やはり僕が最初に要望したようなUIにしてもらいたいです。今日は僕
はずいぶんと悩みましたから(^^;。きっと秀丸に慣れてない人はとま
どう場合も多いと思うんです。
Grepに関してはGrepのダイアログで「文字コード自動判別」をON/OFF
できるようになってもらうというのが、一番スマートなように僕は思
うんですが。

どうでしょう。

[ ]
RE:08229 文字コード自動判別のUIに質問とNo.08240
ひろ さん 01/04/04 12:36
 
 なんとさん今日は、ひろです。
> Grepに関してはGrepのダイアログで「文字コード自動判別」をON/OFF
> できるようになってもらうというのが、一番スマートなように僕は思
 他の方の意見や、秀丸担当さんの考え次第ですね。

[ ]
RE:08223 文字コード自動判別のUIに質問とNo.08259
秀丸担当 さん 01/04/04 18:20
 
>試した限りでは「文字コードの自動認識を行なう」が、
>ONの時:Shift-JIS/EUC/JIS/UNICODE/UTF-8,7を自動判別
>OFFの時:Shift-JIS/UNICODEの自動判別
>というように、判別対象のコードの数が違う・・んですよね?(これ
>が確認したいこと)

Unicodeの場合は特殊で、ファイル先頭に FF FE があるとUnicode
ということになっているので、文字コードのわからないテキストファイル
というより、一つのファイル形式であるとも言えるので特別な扱いになっ
ています。

>とした方が、設定場所が一つですんでいいのではないでしょうか。そ
>の選択欄の下に「全て自動判別の場合、半角カナを含むファイルで誤判
>定する場合があります」と注を付けて。(これが提案)

確かに、一つにまとめられれば分かりやすいと思います。

要望により「標準の文字コード」が後から付いたというのもありますが、
なにより違う点は、「ファイルタイプ別の設定」と「動作環境」の違い
で、前者は言葉の通り、ファイルタイプ別です。動作環境は全てのファ
イルタイプに影響します。

ちなみに仕様としてはだいたい以下のような感じです。

ファイルタイプ別の標準の文字コード
 ダイアログの初期設定
 起動パラメータ(ダブルクリック時など)

動作環境の自動認識
 ダイアログで自動を選んだとき
 grep
 貼り付けでJISコードが含まれるとき


grep時はgrepダイアログに「自動判別」を付けるのは良い案だと
思います。
他にもいい案がありましたら提案してください。

[ ]
RE:08259 文字コード自動判別のUIに質問とNo.08271
なんと さん 01/04/04 23:27
 
秀丸担当さん、こんにちは。なんとです。

> Unicodeの場合は特殊で、ファイル先頭に FF FE があるとUnicode
> ということになっているので、文字コードのわからないテキストファイル
> というより、一つのファイル形式であるとも言えるので特別な扱いになっ
> ています。

はい。「判別に失敗しないから」ということもあるのかなと解釈して
います。

> なにより違う点は、「ファイルタイプ別の設定」と「動作環境」の違い
> で、前者は言葉の通り、ファイルタイプ別です。動作環境は全てのファ
> イルタイプに影響します。

そうですね。で、一つの機能の設定がその二つのダイアログ両方にあ
るというのが、今回僕がわかりにくいと思った原因だと思うんです。
で、

> 動作環境の自動認識
>  ダイアログで自動を選んだとき

の役割を

> ルタイプ別の設定」の「標準の文字コード」の選択肢を
>
> Shift-JIS/UNICODE自動判別
> 全て自動判別
> Shift-JIS
> :

に移設出来ないかなあと。

> grep時はgrepダイアログに「自動判別」を付けるのは良い案だと
> 思います。

m(__)m。
もしかしたら開くダイアログにある「文字コード」リストボックスと
同じものをgrepダイアログにくっつけてもいい感じかと。

実際のところ、僕自身は動作を把握したのでもう困らないですが・・(^^;。

[ ]