同一視指定ファイルのユニコード対応
No.11016
cho-bi
さん 06/08/24 11:34
以前お願いしておりました「replaceallfast」が遅い件、β39で改善されました。
どうもありがとうございました。
さてまたまた検討のお願いで恐縮ですが、あいまい検索の同一視指定ファイルのユ
ニコード対応についてご検討いただけないでしょうか。
最近仕事の関係で中国語のファイルを扱うことが多くなりました。いずれもユニ
コードファイルに変換して秀丸でGREPや検索など、大変便利に使わせていただいてお
ります。
ただあいまい検索の同一視指定ファイルではユニコード特有の漢字などは使えない
ようで、たとえば歴史の「歴」という漢字などは大陸で使う簡体字、台湾や香港で使
う旧字体でなどいろんな形がありますので、「歴」で検索してもうまく検出できない
ことになります。
それらすべてをあいまい検索でヒットさせられれば、最強の検索ツールになると思
います。
GREPや検索ではユニコードに対応していただいて大変便利なのに、あいまい検索が
未対応ということで非常にもったいないような気もします。
お忙しいところ申し訳ありませんが、ご検討をお願いいたします。
[
△
]
RE:11016 同一視指定ファイルのユニコード
No.11017
秀まるお
さん 06/08/24 14:45
あいまい検索の機能ですが、内部的な作りとして、Shift-JISの文字コードに
依存して高速化するような仕組みになっています。具体的には、2バイト文字の
1バイト目が0x81〜0x9F, 0xE0〜0xFCであるという前提で、内部的な変換テーブ
ルを作って高速化しています。
ユニコード文字は、秀丸エディタ内部ではそういマッピング外で扱うようにな
ってまして、HmJre.dll側からは、上記のような方式でうまく扱うことが出来な
いです。
ということで、少なくとも少ない改造でなんとかするのは出来ないと思います。
将来的に、ユニコードを前提とした改良をする時があれば、そのタイミングで
なんとか対応したいとは思いますが…。期待しないで欲しいです。
[
△
]
RE:11017 同一視指定ファイルのユニコード
No.11018
cho-bi
さん 06/08/24 15:14
秀まるお さま、どうもありがとうございました。
同一視指定ファイルの件、残念ですが了解いたしました。別の対策を考えたいと思
います。
お忙しい中お返事を頂き、本当にありがとうございました。
[
△
]