UTF-16で作成する定義ファイルの拡張子No.09137
石田 さん 20/01/16 22:16
 
以前の MS-IME では全角波ダッシュ記号が二個、変換候補に出る時代があったと思い
ます。
ATOK は一種類のみです。異なる文字コードの字を同義語として別の文字に置き換える
定義ファイルを UTF-16 で作成する機能が秀丸にはあり以前作ったのですが、その拡
張子
を忘れてしまいました。ご存じの方がおられたらご紹介願いたいと思います。

これに気づいたのは秀丸メールはユニコードメールは charset=iso-2022-jp に変換処理
して表示するのに、 utf-8 のまま通しているメールを受信したことでした。
別に難しい漢字はないのに?≠ニ思って全文を秀丸エディタに貼り付けたら、全角
波ダッシュ記号が?マークで表示されました。プロバイダからの返信メールでした。
http://neo.vc/uploader/src/neo41334.png

[ ]
RE:09137 UTF-16で作成する定義ファイルのNo.09138
石田 さん 20/01/17 11:16
 
文字化けするといけないので、スクリーンショットを撮りました。
一行目のプロバイダーからのメールをフリーエディタにUTF-8で貼り付け、保存した
ファイルを秀丸で編集したものです。
http://neo.vc/uploader/src/neo41354.png

[ ]
RE:09138 UTF-16で作成する定義ファイルのNo.09139
秀丸担当 さん 20/01/17 12:42
 

秀丸エディタに貼り付けて?になるとしたら、[その他]→[動作環境]→[編集]→[貼り
付けでUnicodeを使用する]がOFFになっているのかもしれないです。
通常はONで、ONの場合はU+301Cの文字は貼り付け可能です。
OFFの場合は?になります。

同一視について、期待されていることと同じかわからないですが、検索でU+301CとU+
FF5Eを同一視して検索するとしたら、検索ダイアログで「あいまい検索」をONにして、
カスタムで指定する方法があります。
例えば「あ 亜」という一行を書いてUTF-16で拡張子.txtで保存して、「カスタム1」
に指定すると、「あ」と「亜」は同じ文字として検索されるようになります。

[ ]
RE:09139 UTF-16で作成する定義ファイルのNo.09140
石田 さん 20/01/17 19:45
 
失礼しました。

「編集」画面下のリセットボタンを押したら、ちゃんと
「貼り付けで Unicode を使用する」にチェックが入りました。
私が不用意に OFF にしたようです。ヘルプを見たら、 Netscape と
懐かしい言葉が出てきました。MS-IME で波ダッシュ記号が二つ出るのは
相当昔の話になるのでしょう。今とは字形も異なります。
(今も会社PCで外部持ち込みテキストで波ダッシュ記号が文字化けして?になる例が
あります。
前後の文脈から 〜 に違いないと判断し、勝手に置き換えています。「MS-IMEの持病
だよ」で一件落着)

>検索ダイアログで「あいまい検索」をONにして、カスタムで指定する方法があります。

これでした。カスタム1で設定したファイルが見つかりました。早速シフトJISにはない
全角波ダッシュ記号 U+301C を 〜 と同一視するようにファイルに追加したら、Grep
検索でも
ヒットしました。ヘルプに従い、同一視ファイルは、HMJRE.DLLと同じ場所に置くこ
とにしました。

 本当に有り難うございました。


[ ]