Hmjre.dllは、Unicodeの同一視ファイルにNo.17159
立文字 さん 04/04/28 17:23
 
 Hmjre.dllの多国語化改変と同一視ファイルのことでお尋ねします。

 検索するファイルはUnicode(Utf16)のファイルだとします。その中をあいまい検索
したいがためにHmjre.dllのソースを改変し、コードページを1200に変えて、コンパ
イルしたものを作りました。
 そして、同一視ファイルをUnicode(Utf16)ファイルで作成して、あいまい検索に上
記の同一視ファイルを設定して検索しようとしましたら、「同一視する単語が1つし
か指定されていません云々」という、あいまい検索定義ファイルの読み込みエラーが
出てしまいます。
 思うに、hmjre.dllの中で、同一視ファイルをopenするときにunicodeファイルに対
応できていないということなのだろうと思います。
 クリアできる方法がありますでしょうか。

 私が最終的にやりたいことは、Unicode化された複数のテキストファイルに対して、
Grepで同一視ファイルを参照した上でのあいまい検索を行ないたいのですが・・・。

 Sihft-JISのファイル群に対して、Shift-JISの同一視ファイルを使っての実験は、
もちろんうまくいきました。

[ ]
RE:17159 Hmjre.dllは、Unicodeの同一視フNo.17160
秀まるお2 さん 04/04/28 17:45
 
 具体的な状況が分からないのでなんですが、やろうとしてることはかなり無謀
なことだと思います。HmJre.dllのソースコードをどういじっても対応できない
と思います。

 一応、HmJre.dll自体はマルチバイト用に作ってあるので、それをUnicodeも扱
えるように改造するのは大変な改造が必要なはずです。さらに言うなら、秀丸エ
ディタから呼び出して使うということなら、Unicode用に改造してそれでうまく
動くという物でも無いです。というのは、秀丸内部はあくまでマルチバイト風の
作りになっていて、内部でのUnicode文字の扱い方も非公開となっています。

>  Unicode化された複数のテキストファイルに対して、
> Grepで同一視ファイルを参照した上でのあいまい検索を行ないたいのですが

 Unicode対応は無理だろうと思いますが、同一視ファイルが特定言語の文字
コードという前提で処理せよって話なら、それはそれでHmJre.dllのソースコー
ドをいじって対応可能だと思います。例えば韓国語とか中国語(gb2312かまたは
big5のどちらか)オンリーに対応させることは可能だと思います。

[ ]