あいまい検索 その 3No.28378
rosegardenyk さん 10/06/08 11:56
 
rosegardenです。

V8.01 beta 6   HMJRE.DLL V3.18 で
作業ファイルに
in における
or または
were assigned〜either@orA @またはAのいずれかに割付けられた.
were assignedBeither@orA @またはAのいずれかに割付B
と 英語 →(\t) 日本語 の4件が登録されている場合

空白/タブ文字無視 ON
カスタム 1 ON
同一視ファイル 次の2件のみ登録
。 .
、 ,
カスタム 1、空白/タブ文字無視以外、最下段の「ヒープ領域使う」のみON
他は全てOFF

fuzzy 指定をいれずに
$FindPhr = "または";
searchdown2 "(?<=\t)" + $FindPhr + "(?=(\n|\t|@@))",regular,nocasesense,word,
hilight;
で意図どおり
or または
だけ1件にヒットします。

fuzzy 指定をくわえて
$FindPhr = "または";
searchdown2 "(?<=\t)" + $FindPhr + "(?=(\n|\t|@@))",regular,nocasesense,fuzz
y,word,hilight;
で検索すると次の3件にヒットしてしまいます。
or または
were assigned〜either@orA @またはAのいずれかに割付けられた.
were assignedBeither@orA @またはAのいずれかに割付B

空白/タブ文字無視 OFFにするとfuzzy 指定があっても
で意図どおり
or または
だけに1件ヒットします。

これって一応バグでしょうか?



[ ]
RE:28378 あいまい検索 その 3No.28379
秀まるお2 さん 10/06/08 12:18
 
 ちゃんと検証した訳ではないですが、空白/タブも無視ということになると、
正規表現パターンの中での空白/タブにヒットする用のパターンば全部無視され
ても仕方がないです。

 なので、空白/タブ無視で検索すると、

   "(?<=\t)または(?=(\n|\t|@@)"

 というパターンは、あたかも

   "または"

 だけになったも同然になって、結果として「または」全部にヒットしてしまう
ということのようです。

[ ]
RE:28379 あいまい検索 その 3No.28381
rosegardenyk さん 10/06/08 13:42
 
> なので、空白/タブ無視で検索すると、
>
>   "(?<=\t)または(?=(\n|\t|@@)"
>
> というパターンは、あたかも
>
>   "または"
>
> だけになったも同然になって、結果として「または」全部にヒットしてしまう
>ということのようです。

rosegardenです。
なるほど、これは先頭のタブ文字無視は当然でしたね。
バグではないということで了解です。

[ ]