記号のあいまい検索No.01878
ひろ さん 03/06/19 23:15
 
 秀まるおさん今日は、ひろです。
 例えば、( をあいまい検索すると、( はヒットしますが、[, { はヒットし
ません。「 にいたっては、その半角もヒットしません。
 また引用記号や句読点も同様です。
 これらのあいまいさも ON/OFF で指定可能になるか、カスタマイズ・ファイ
ルで 1 バイト文字の指定も可能にならないでしょうか?
 こちらの環境は、Windows98+IE6.0+秀丸 Ver.4.00β3 です。

[ ]
RE:01878 記号のあいまい検索No.01879
秀まるお さん 03/06/20 09:04
 
 まいどどうも。

 手元のWord95にはありとあらゆるあいまい検索オプションがありまして、
HmJre側でも対応しようかと思ったんですが、今のところ保留してます。

 たしかにこれらの指定はカスタマイズファイル上で指定可能です。なので、全
部カスタマイズファイル側で指定してもらう方式にする手もあります。ただ、そ
れだけでは少々不親切なので、標準でいくつかカスタマイズファイルを用意しよ
うかなぁと思ったりもします。どうしようかまだ決めてないです。

 その前に、改行をまたがったあいまい検索への対応をしたいと思いますが、こ
れについては秀丸本体側に修正が必要です。しかし、まだ検索関係のソースコー
ド上でいくつかバグが出てまして、おもいきった修正が出来ないです。もうちょ
っと落ち着いてバグが出なくなってから作業しようと思っている所です。

 それとは別に、例の「斉藤秀夫」と「PEH00775」を同一視する指定とかについ
て、JRE32.DLL側の動作を一度確認し、それで仕様がちゃんとしてるなら、例え
ばそういう複数文字の同一視指定については現状の方式とはまったく別に、正規
表現の(A|B)的なやり方を使って検索しようかなどとも考えてます。そうすると
またおもいきり作り直さないといけないです。

 ということで、これまたしばらくお待ちを。

[ ]
RE:01879 記号のあいまい検索No.01883
ひろ さん 03/06/20 18:10
 
 秀まるおさん今日は、ひろです。
>  手元のWord95にはありとあらゆるあいまい検索オプションがありまして、
> HmJre側でも対応しようかと思ったんですが、今のところ保留してます。
 解りました。

>  たしかにこれらの指定はカスタマイズファイル上で指定可能です。
 現状では、1 バイト文字の指定が出来ないのが難点ですね。

> 標準でいくつかカスタマイズファイルを用意しよ
> うかなぁと思ったりもします。どうしようかまだ決めてないです。
 その様に決まった場合、必要でしたらカスタマイズ・ファイルを置くリしま
す。

 ただ
> 「 にいたっては、その半角もヒットしません。
は正式版になる前に対処が必要かと思います。


>  それとは別に、例の「斉藤秀夫」と「PEH00775」を同一視する指定とかについ
> て、JRE32.DLL側の動作を一度確認し、それで仕様がちゃんとしてるなら、例え
> ばそういう複数文字の同一視指定については現状の方式とはまったく別に、正規
> 表現の(A|B)的なやり方を使って検索しようかなどとも考えてます。
 どうなるか解りませんが、楽しみに待ちます。

[ ]
RE:01883 あいまい検索で「」がヒットしなNo.01980
ひろ さん 03/06/25 18:20
 
 秀まるおさん今日は、ひろです。
> > 「 にいたっては、その半角もヒットしません。
> は正式版になる前に対処が必要かと思います。
 こちらについてフォローがありません(;_;)。
 HmJre.dll のあいまい検索で、「」は半角もヒットした方がよいと思います。
(勿論 [設定] で半角が ON の場合です。)

[ ]
RE:01980 あいまい検索で「」がヒットしなNo.01985
秀まるお さん 03/06/25 19:12
 
 すみません。完全に見逃してました。たしかにヒットしないのはバグです。

 修正させていただきます。

 ついでに、例の「斉藤秀夫」と「PEH00775」を同一視するような指定も出来る
ようにしました。その関係もあって、次のバージョンでカスタム指定用ファイル
の形式も変わってしまいます。

[ ]
RE:01985 あいまい検索で「」がヒットしなNo.01986
ひろ さん 03/06/25 19:24
 
 秀まるおさん今日は、ひろです。
>  すみません。完全に見逃してました。たしかにヒットしないのはバグです。
>
>  修正させていただきます。
 宜しくお願いします。

>  ついでに、例の「斉藤秀夫」と「PEH00775」を同一視するような指定も出来る
> ようにしました。その関係もあって、次のバージョンでカスタム指定用ファイル
> の形式も変わってしまいます。
 どうも有り難うございます。
 実際使ってみてからまた書き込むかもしれませんが、取り敢えず現状で気に
なっているのは、
{([<「『【{([<
といった複数記号で全半角記号が混在している場合のあいまい検索です。

[ ]
RE:01986 あいまい検索で「」がヒットしなNo.02029
秀まるお さん 03/06/27 16:08
 
 同一視指定については、内部的に2種類の処理を用意しました。

 同一視する単語が全部1文字だったら、検索対象文字列/検索文字列を全部変
換するやり方で処理します。(全角文字の2バイトは1文字と数えます)

 同一視する単語に1つでも2文字以上の物があったら、それはいわゆる正規表
現での(AAA|BBB)に変換する形で処理します。

 前者の処理は、以前は2バイト文字だけが対象でしたが、改良して1バイト文
字も指定できるようにしました。正規表現の記号と重なる文字も指定できるよう
にしました。

 定義ファイルの形式が変わりました。以前は単純に漢字をくっつけて指定する
物でしたが、今回から、1つ1つの単語をタブまたは空白で区切って指定してな
いとダメにしました。

 あと、「#」と「//」はコメントの開始という意味になります。なので、#の記
号そのものだけは指定できません。

 これでほぼ、JRE32.DLLを置き換えても何も問題なくなったと思います。置き
換え困難なケースがあれば教えて欲しいです。(β5の後で)

 そういうことで、次のβ5まで少々お待ちください。

■余談

 同一視する単語として、

 AAABBB XXX               (AAABBBとXXXを同一視)
 BBBCCC YYY               (BBBCCCとYYYを同一視)

 を指定した場合、

 AAABBBCCC

 という単語を検索しようとすると、それは、

 (AAABBB|XXX)CCC

 に変換されます。単純に前方から置換できる物を探して置換していく処理にし
ました。JRE32.DLLも同じ仕様だったのでそうしました。

[ ]
RE:02029 あいまい検索で「」がヒットしなNo.02038
ひろ さん 03/06/27 19:16
 
 秀まるおさん今日は、ひろです。
>  あと、「#」と「//」はコメントの開始という意味になります。なので、#の記
> 号そのものだけは指定できません。
 あまり影響は無いと思いますが、どうせβ4 までのそれと互換性がないのな
ら、「#」を特別視する必要は無かったような気がします。←単なる感想。

>  これでほぼ、JRE32.DLLを置き換えても何も問題なくなったと思います。
 有り難うございました。

> 置き
> 換え困難なケースがあれば教えて欲しいです。(β5の後で)
 了解しました。

[ ]
RE:02029 あいまい検索で「」がヒットしなNo.02056
ひろ さん 03/06/28 00:19
 
 秀まるおさん今日は、ひろです。
> 置き
> 換え困難なケースがあれば教えて欲しいです。(β5の後で)
D  海老
というように、1 文字と複数文字の同一視を指定することが出来ないようです。
この例はあまり遣らないかと思いますが、「(株)」などの指定は良く行われる
と思います。
 こちらの環境は、Windows98+IE6.0+秀丸 Ver.4.00β5 です。

[ ]
RE:02056 あいまい検索で「」がヒットしなNo.02070
秀まるお さん 03/06/30 14:38
 
 1文字の単語がいくつか出てきてから複数文字の単語が出てきた場合に1文字
単語のテーブルを複数文字単語のテーブルに変換する処理があったんですが、そ
れがバグっててうまく動いてませんでした。(つまり、その処理は一回もテスト
してなかったってことですが)

 修正させていただきます。

[ ]
RE:02070 あいまい検索で「」がヒットしなNo.02071
秀まるお さん 03/06/30 14:56
 
 ついでに、「(」などの正規表現と重なる文字についての処理も間違ってまし
た。

[ ]
RE:02070 あいまい検索で「」がヒットしなNo.02076
ひろ さん 03/06/30 17:21
 
 秀まるおさん今日は、ひろです。
>  修正させていただきます。
 宜しくお願いします。

[ ]