特定の文字が検索できないNo.21805
いけたに さん 06/09/20 13:27
 
こんにちは。
秀丸エディタ、いつも便利に使わせてもらっています。

一点、要望があります。

EUCのファイル文中の「」という文字列を検索しようとすると、検索できません。

具体的には、perlのEUCファイルのコメント文中に、(ハシゴ高)を記載しているの
ですが、この文字(を含む文字列)を検索しようとしても、検索に引っかかりません。

文字コード上、EUCには存在しないため出来ないのかと思いますが、表示は行われて
いるため、検索対象となってもよいかと思いました。

ご検討いただければ幸いです。

環境:
  秀丸エディタ Ver. 6.00
  Windows XP Professional

[ ]
RE:21805 特定の文字が検索できな いNo.21807
Kaisan さん 06/09/20 14:05
 
kaisan@ユーザです。

どうも文字に変換してEUCにしているみたいです。

検索のオプションであいまい検索を有効にして、
カスタムに「メーカー別拡張漢字を同一視.txt」を
設定すれば検索できるようです。


On Wed, 20 Sep 2006 13:27:25 +0900
いけたに <64xxxxxxxxxxxxxx@maruo.co.jp> からの引用:
> こんにちは。
> 秀丸エディタ、いつも便利に使わせてもらっています。
>
> 一点、要望があります。
>
> EUCのファイル文中の「」という文字列を検索しようとすると、検索できません。
>
> 具体的には、perlのEUCファイルのコメント文中に、(ハシゴ高)を記載しているの
> ですが、この文字(を含む文字列)を検索しようとしても、検索に引っかかりません。
>
> 文字コード上、EUCには存在しないため出来ないのかと思いますが、表示は行われて
> いるため、検索対象となってもよいかと思いました。
>
> ご検討いただければ幸いです。
>
> 環境:
>   秀丸エディタ Ver. 6.00
>   Windows XP Professional




[ ]
RE:21807 特定の文字が検索できな いNo.21810
いけたに さん 06/09/20 14:37
 
いけたにです。

>どうも文字に変換してEUCにしているみたいです。
>
>検索のオプションであいまい検索を有効にして、
>カスタムに「メーカー別拡張漢字を同一視.txt」を
>設定すれば検索できるようです。

kaisanさん、ありがとうございました。
指定の手順にて、検索出来るようになりました。

[ ]
RE:21810 特定の文字が検索できな いNo.21814
秀丸担当 さん 06/09/20 16:28
 

>EUCのファイル文中の「」という文字列を検索しようとすると、検索できません。

「」という字など数十文字には Shift-JIS では、IBM選定IBM拡張文字とNEC選
定IBM拡張文字の2種類のコードがあって、見た目は同じでも違うコードの文字
があります。
Shift-JISではこれらの文字が混在できてしまいます。
この問題は、Kaisanさんが言われている通りの方法で回避できます。

EUCの場合は、これらの文字はNEC選定IBM拡張文字として解釈してきています。
ところがWindowsの変換ではこれらの文字の入力でIBM選定IBM拡張文字として入
力されてしまうので、食い違いが起きています。
秀丸エディタのEUCの解釈としていままではNEC選定でしたが、これらはIBM選定
として解釈するように変更にすると、問題が改善できるかもしれません。
V6.01では修正しませんが近いうちに検討したいと思います。

[ ]
RE:21814 特定の文字が検索できな いNo.21821
いけたに さん 06/09/20 17:49
 
いけたにです。

秀丸担当さん、詳細な説明ありがとうございました。

>V6.01では修正しませんが近いうちに検討したいと思います。
現状、kaisan さんに教えてもらった方法で対処できていますが、
期待して待っているようにします。

[ ]
RE:21814 特定の文字が検索できな いNo.21822
いいじま さん 06/09/21 12:18
 
いいじまです。

> 「」という字など数十文字には Shift-JIS では、IBM選定IBM拡張文字とNEC選
> 定IBM拡張文字の2種類のコードがあって、見た目は同じでも違うコードの文字
> があります。
> Shift-JISではこれらの文字が混在できてしまいます。
> この問題は、Kaisanさんが言われている通りの方法で回避できます。
>
> EUCの場合は、これらの文字はNEC選定IBM拡張文字として解釈してきています。
> ところがWindowsの変換ではこれらの文字の入力でIBM選定IBM拡張文字として入
> 力されてしまうので、食い違いが起きています。
> 秀丸エディタのEUCの解釈としていままではNEC選定でしたが、これらはIBM選定
> として解釈するように変更にすると、問題が改善できるかもしれません。
> V6.01では修正しませんが近いうちに検討したいと思います。


EUCではIBM選定文字はそもそも表現できません。ですので以前、IBM選定文字を
EUCやJISで保存する際にはNEC選定文字に変換して、EUCやJISとして正しい(?)
コードで表現して保存してほしい、と私が要望を出して、現在に至っています。

保存の際にIBM選定文字のまま不正なEUC/JISコードを吐くようなデグレードだけは
勘弁してください。

[ ]
RE:21822 特定の文字が検索できな いNo.21823
秀丸担当 さん 06/09/21 13:20
 

>EUCではIBM選定文字はそもそも表現できません。ですので以前、IBM選定文字を
>EUCやJISで保存する際にはNEC選定文字に変換して、EUCやJISとして正しい(?)
>コードで表現して保存してほしい、と私が要望を出して、現在に至っています。
>
>保存の際にIBM選定文字のまま不正なEUC/JISコードを吐くようなデグレードだけは
>勘弁してください。

このあたりは、たぶん大丈夫だと思います。
NEC選定に変換しているのは保存時で、IBM選定とNEC選定が混在していても、NEC
選定に統一して保存しています。

改善を検討しているのは読み込み時で、IBM選定であるとして解釈して読み込み
ます。
IBM選定として読み込まれてしまっても、保存時には再びNEC選定に戻ることにな
ります。

そうすると、Windowsの入力は常にIBM選定となってしまう問題も解決でき、不正
なエンコードにもならないはずということになると思います。

[ ]