多国語対応についてNo.47956
hajimet さん 15/05/08 03:26
 
いつも秀丸メール便利に活用させて頂いております
さて
掲題につき(またちょっとトリビアな話ですが)
以下ご報告を

ヘルプにはUTF-16という文字は見当たりませんでしたが、
アドレス帳ファイルの多言語対応がUTF-16のようです。
その旨、多言語対応のヘルプの記載の末尾にでも
ひと言記載して頂いても良いかなと思いました。

アドレス帳ファイルはテキストファイルであることの利点を活かし
直接秀丸エディタで編集することがあります。
先日たまたまJISにない文字を名前に持つ方を登録しました。
秀丸エディタではデフォルトでUTF-8が選択されましたので、
そのまま保存しましたところ、
秀丸エディタでのメール一覧画面のFrom欄表示が乱れました。
UTF-16で保存しなおしてメーラを起動し直して復帰しましたが、
試行錯誤が必要でした。
そこで、上記のコメントと相成ります。
ご検討いただければ幸いです。

[ ]
RE:47956 多国語対応についてNo.47957
秀まるお2 さん 15/05/08 08:55
 
 アドレス帳用のファイルですが、元々はShift-JIS形式だったんですが、いつ
ぞやのバージョンから多国語対応するようになって、Shift-JIS範囲外の文字が
1つでもあれば、UTF-16で保存するような処理になってました。

 たぶん他のファイル(テンプレート用のファイルとか)も同じような処理をし
ていたような気がします。

 とりあえず、アドレス帳用ファイルについてはヘルプに文字コードがどうなる
かの仕組みについて追加させていただきます。

 あと、UTF-8で保存したとしても、BOMありであれば判定可能なので、せっかく
なのでBOMありについては自動判定するようにします。

 BOM無しの場合は、文字コード的にShift-JIS範囲外の物があれば判定可能です
が、普通の日本語だけだと確実には判定出来なくて、ちょっと難しいです。なの
でそれはやめておこうかなぁと思います。

> アドレス帳ファイルはテキストファイルであることの利点を活かし
> 直接秀丸エディタで編集することがあります。

 一応、秀丸エディタで編集して保存する場合なら、普通にファイルを開いて編
集して保存するってだけであれば、文字コードが勝手に変わることは無いはずだ
と思います。(標準がUTF-8になってても)

 もしも勝手に文字コードが変えられて保存されてしまったのであれば、それは
逆に秀丸エディタの方の問題って可能性が高いような気がします。

[ ]
RE:47957 多国語対応についてNo.47958
hajimet さん 15/05/08 09:16
 
ご検討頂きありがとうございます。
「秀丸エディタではデフォルトでUTF-8が選択されましたので、
 そのまま保存しましたところ、」
とは、ファイルを保存しようとする際に表示される警告において
デフォルトの選択肢がUTF-8(ちなみにBOMなし)になっているので、
そのデフォルトのまま保存した、といういみです。
BOMなしなのはS-JISではBOMなしなのでその設定が引き継がれるように
なっているからかと思います。
UTF-8の場合はBOMありというのがより一般的な選択なのでしょうか。
もしそうなら、秀丸エディタの警告画面の改善をした方が親切かも
しれませんね。

[ ]
RE:47958 多国語対応についてNo.47959
秀まるお2 さん 15/05/08 09:57
 
 AdrBook.txtファイルの読み込み時の文字コード自動判定ですが、現状で、

 UTF-8(BOMあり)

 についても自動判定するようになってました。

 で、問題の、UTF-8(BOMなし)についても、とりあえず、Shift-JISとして読
み込んで不正な文字が発生しつつ、UTF-8として読み込んで不正な文字が無い場
合についてはUTF-8と解釈するようにしました。

 全角文字がいっぱいあるファイルならこれでうまく判定すると思います。次の
V6.46β2からそのようにさせていただきます。

> とは、ファイルを保存しようとする際に表示される警告において
> デフォルトの選択肢がUTF-8(ちなみにBOMなし)になっているので、
> そのデフォルトのまま保存した、といういみです。

 出来たらもうちょっと詳しい経緯を教えて欲しいですが…

 例えば、

  1.Adrbook.txtファイルを開いた。
    (この時点ではShift-JIS)
  2.Adrbook.txtファイルにユニコード文字を含むような編集を加えて
    「ファイル・上書き保存」を実行した。
  3.「文字コード変換できない文字が含まれています。」の警告が出て、
     そこの「エンコードの種類を変更して保存する」を選択して、
     「エンコードの種類」としてあえてUTF-8を選択した。

 ということなのですかね。

 一応、「3」の時点でデフォルトで出てくるエンコード種類はUnicode(UTF-
16)となってるはずなので、特に意識してUTF-8を選択しない限りは大丈夫なはず
というか、秀丸エディタの動作としておかしいことは無いかなぁと思いますけど
も。

[ ]
RE:47958 多国語対応についてNo.47960
秀まるお2 さん 15/05/08 10:00
 
 あと、UTF-8の場合はBOMなしが一般的かと思います。

 外国(英語圏)の人にとってはShift-JISなんてファイルは存在しないので、
BOMなんて付けないのが一般的になったんだと思います。

[ ]
RE:47959 多国語対応についてNo.47961
hajimet さん 15/05/08 11:00
 
ご面倒をおかけしました。
> 一応、「3」の時点でデフォルトで出てくるエンコード種類はUnicode(UTF-
>16)となってるはずなので、特に意識してUTF-8を選択しない限りは大丈夫なはず
なので私の投稿が意味不明だったのですね。申し訳ありませんでした。
メーラバージョンの問題だったかも知れません。
半年でそんなに大きくデフォルトが変更になるのでしょうか。
メーラはひと世代前を使っています(v8.42x64)。
あるいは、以前保存したエンコードを記憶していて
それをデフォルトに表示するなどと云う仕様があり得ますでしょうか。
いずれにしてもこのフォーラムの話題ではないですね。

[ ]
RE:47961 多国語対応についてNo.47963
秀まるお2 さん 15/05/08 11:14
 
> メーラバージョンの問題だったかも知れません。

 「エディタバージョンの問題」ですね。

> それをデフォルトに表示するなどと云う仕様があり得ますでしょうか。
> いずれにしてもこのフォーラムの話題ではないですね。

 僕もそこまで詳しくないので、とりあえず今現在の最新版で普通に「標準の
エンコード=utf-8」にしただけなら大丈夫なはずで、あと他の可能性として、秀
丸エディタの旧バージョンだとどうかってことと、他の設定ってことになるかと
思います。

 これ以上は僕の担当からも外れてしまうし、一応秀丸メールの方でも最新βで
出来る範囲で対応はしたので、秀丸担当の方にこういう話があるってことだけ連
絡して終了とさせていただきます。

[ ]
RE:47963 多国語対応についてNo.47965
hajimet さん 15/05/08 11:57
 
> 「エディタバージョンの問題」ですね。
重ね重ね申し訳ありません。
> これ以上は僕の担当からも外れてしまうし、一応秀丸メールの方でも最新βで
>出来る範囲で対応はしたので、秀丸担当の方にこういう話があるってことだけ連
>絡して終了とさせていただきます。
ありがとうございました。

[ ]