同一視指定ファイルのユニコード対応No.11016
cho-bi さん 06/08/24 11:34
 
 以前お願いしておりました「replaceallfast」が遅い件、β39で改善されました。
どうもありがとうございました。

 さてまたまた検討のお願いで恐縮ですが、あいまい検索の同一視指定ファイルのユ
ニコード対応についてご検討いただけないでしょうか。

 最近仕事の関係で中国語のファイルを扱うことが多くなりました。いずれもユニ
コードファイルに変換して秀丸でGREPや検索など、大変便利に使わせていただいてお
ります。
 ただあいまい検索の同一視指定ファイルではユニコード特有の漢字などは使えない
ようで、たとえば歴史の「歴」という漢字などは大陸で使う簡体字、台湾や香港で使
う旧字体でなどいろんな形がありますので、「歴」で検索してもうまく検出できない
ことになります。
 それらすべてをあいまい検索でヒットさせられれば、最強の検索ツールになると思
います。
 GREPや検索ではユニコードに対応していただいて大変便利なのに、あいまい検索が
未対応ということで非常にもったいないような気もします。

 お忙しいところ申し訳ありませんが、ご検討をお願いいたします。

[ ]
RE:11016 同一視指定ファイルのユニコードNo.11017
秀まるお さん 06/08/24 14:45
 
 あいまい検索の機能ですが、内部的な作りとして、Shift-JISの文字コードに
依存して高速化するような仕組みになっています。具体的には、2バイト文字の
1バイト目が0x81〜0x9F, 0xE0〜0xFCであるという前提で、内部的な変換テーブ
ルを作って高速化しています。

 ユニコード文字は、秀丸エディタ内部ではそういマッピング外で扱うようにな
ってまして、HmJre.dll側からは、上記のような方式でうまく扱うことが出来な
いです。

 ということで、少なくとも少ない改造でなんとかするのは出来ないと思います。

 将来的に、ユニコードを前提とした改良をする時があれば、そのタイミングで
なんとか対応したいとは思いますが…。期待しないで欲しいです。

[ ]
RE:11017 同一視指定ファイルのユニコードNo.11018
cho-bi さん 06/08/24 15:14
 
 秀まるお さま、どうもありがとうございました。

 同一視指定ファイルの件、残念ですが了解いたしました。別の対策を考えたいと思
います。

 お忙しい中お返事を頂き、本当にありがとうございました。

[ ]