変換リスト作成の心得No.08972
石田 さん 19/04/17 20:41
 
変換モジュールを利用した変換リストの作成を考えている者です。

 一年ほど前、ある書籍に出てくる重要語句のページ番号を検索する
変換リストを作りました。全体で1200行程度でした。1000行近くまでは
順調でしたが、それを超えると、上段右辺の数字が下段右辺の数字に干渉し、
正確な変換が出来なくなり、リスト作成は放棄となりました。
今考えると、半角数字だけでなく、頁と書いたり、全角数字を混ぜれば上手く
行くかも知れないと反省しています。他の方で右辺がアラビア数字のみの変換
リストを作っている方の経験を伺えれば幸いです。

(作成放棄した変換リスト右辺)
45.46.47.48.49.50.51.52.54.55.57.58.
65.118.132.136.158.159.160.162.
163.167.171.178.180.181.183.185.
186.187.188.189.190.191.194.195.
196.200.201.202.207.209.214.244.254.

[ ]
RE:08972 変換リスト作成の心得No.08979
秀丸担当 さん 19/04/19 09:04
 

外しているかもしれませんが、おそらく、置換後の結果に、再度検索対象となる文字
列が出現して何度も置換すると都合が悪いということかと思います。
例えば、"123."を"44.123.55."に置換するとして、何度も処理する場合に都合が悪い
です。
正規表現を使った全置換の場合、置換後にマークとなるような文字を入れておいて、
前方不一致でそれを除外することが考えらえます。
例:replaceall "(?<!★.*)123.", "★44.123.55.",regular;

変換リストで単純な文字列の入れ替えの場合は、検索対象とならないような文字にす
るしかないと思います。
既にやられているかもしれないですが、"44頁.123頁.55頁."とか"44.123.55.
"とかにするのはいいと思います。

[ ]
RE:08979 変換リスト作成の心得No.08983
石田 さん 19/04/19 22:20
 
ありがとうございます。

まだ構想段階であれこれ考えている最中です。
色々試してみようと思います。

>変換リストで単純な文字列の入れ替えの場合は、検索対象とならないような文字に
>するしかないと思います。
>既にやられているかもしれないですが、"44頁.123頁.55頁."とか"44.123.55.
>"とかにするのはいいと思います。

[ ]