UTF-8 のメール検索No.01569
Iranoan さん 08/08/27 21:46
 
 秀まるおさん今日は、Iranoan です。
 UTF-8 のメールで、Shift_JIS に含まれない文字を検索するにはどうすれば
よいのでしょう? 「文字コード」では「多言語」等該当しそうなものは無さそ
うですし。「日本語」のまま行うと、今試している文字コードが 0x5733
(UNICODE), 0xE59CB3 (UTF-8) (土偏に川) を含むサンプルでは
・文字コードを簡体字中国語と解釈して検索します。
・検索対象文字列の文字コード自動判定に失敗しました。サポート対象外の言
  語や、複数言語をまぜて指定することは出来ません。
のどちらかとなります。(前者は選択部分が短い場合)

 エディタ・ウィンドウでは問題なく検索できます。

 またヘルプを見ていて気になったのですが、
> 文字コード
<snip>
> ■Windows95/98/Meの場合
>  Windows95/98/Meの場合は、文字コードを「(標準)」にしておくと、
の「(標準)」は Windows95/98/Me のみで出てくるのでしょうか? それなら構
わないのですが、ひょっとして内容が古くなっているのか? と思いお聞きした
しだいです。

 こちらの環境は、WindowsXP+IE7.0+秀丸メール Ver. 5.09beta2 です。

[ ]
RE:01569 UTF-8 のメール検索No.01573
秀まるお さん 08/08/28 09:14
 
 実は、検索で指定出来る文字は、日本語/欧文/中国語等のどれかの言語の文
字だけの集合体でなっとダメってことになっていて、例えばcopyrightの(c)マー
クと日本語ひらがなの組み合わせとか、そういう検索は現状出来ないです。

 なぜそうなったかというと、Windows95/98/Me上でもちゃんと外国語メールを
検索出来るようにするための仕組みが邪魔をしてるってことになるんですが、今
現在の内部的な作り的にはユニコード文字での検索も出来るはずではないかと思
います。ということでユニコード文字で出来るように、さらには検索ダイアログ
ボックスにある「文字コード」って所も廃止するって方向で直したい所です。

 タブが一段落したらやろうかなぁと思いますが…。とりあえず今すぐは無理と
いうことで、現状そういう仕様と理解して欲しいです。

> >  Windows95/98/Meの場合は、文字コードを「(標準)」にしておくと、
> の「(標準)」は Windows95/98/Me のみで出てくるのでしょうか?

 「(標準)」は出ないです。ヘルプが古いです。ということで修正させていただ
きます。

[ ]
RE:01573 UTF-8 のメール検索No.01575
Iranoan さん 08/08/28 13:50
 
 秀まるおさん今日は、Iranoan です。
>  タブが一段落したらやろうかなぁと思いますが…。。
 そうですね、現在大きな機能が追加された段階ですからね。
> とりあえず今すぐは無理と
> いうことで、現状そういう仕様と理解して欲しいです
 解りました。

 ただ一点、検索しようとした文字列は「・政務長官は深[*]」です。そして
[*] が 0x5733 (UNICODE), 0xE59CB3 (UTF-8) (土偏に川) なので、
> 日本語/欧文/中国語等のどれかの言語の文
> 字だけの集合体
にあたる (Shift_JIS/UTF-8 (gb2312:中国語)) 気もします。
 UNICODE なので、「・」が別扱いの気もしますが、今回の報告とはまた別の
問題かもしれないので、一応ご報告します。

[ ]
RE:01575 UTF-8 のメール検索No.01578
秀まるお さん 08/08/28 15:27
 
 検索しようとしてはねられた文字列を、例えば秀丸エディタに貼り付けて、文
字コードgb2312で保存出来るかどうか試してみるとはっきりすると思いますけど
…。

 秀丸メールの中での自動判定は、つまり、そういう、特定コードページに変換
してエラーになるかどうかって見てたと思います。(ソースコード確認まではし
てませんが)

[ ]
RE:01578 UTF-8 のメール検索No.01583
秀まるお さん 08/08/28 18:04
 
 任意のユニコード文字で検索できるようにします。(次のバージョンから)

[ ]
RE:01583 UTF-8 のメール検索No.01589
kiwikazuya さん 08/08/28 20:10
 
> 任意のユニコード文字で検索できるようにします。(次のバージョンから)

中国在住のkiwikazuyaです。
私の場合、受信メールも送信メールもすべて
UTF-8なので、0xE59CB3 (UTF-8) (土偏に川)も
特に文字コードを指定しなくても、検索できますが、
もし、変更された場合も、特に文字コードをしていしなくても、
検索できるままでしょうか?

変更後、今度は検索できなくなる方が怖いです。

よろしくお願いいたします。

[ ]
RE:01589 UTF-8 のメール検索No.01591
kiwikazuya さん 08/08/28 20:17
 
補足です。

メールが各国の文字コードの場合、
そのメールの文字コードに限定されて検索されるので、
すべてUTF-8にしているのがそもそもの原因です。

[ ]
RE:01591 UTF-8 のメール検索No.01593
秀まるお さん 08/08/29 08:56
 
 現状で検索出来る物はそのまま検索出来ます。

 現状で検索出来ない、例えばひらがなと欧文文字(copyrightのマークとか)
の組み合わせとか、そういうのも検索出来るように直します。

 検索ダイアログの「文字コード」の所を無くすとWindows98/Meで都合が悪いし、
そこを切り替えることでフォントも切り替わって見やすくなるというのもあるの
で、それはそれで現状のままにしておくことにします。

[ ]