ユニコードの扱い^2No.11173
おしょう さん 02/01/31 08:17
 
続けてユニコード関係の質問です。

お蔭様で保存は無事できるようになり、文字(JIS にはない漢字やサンスクリット語
のローマ字表記に必要な特殊な英字)については「やったあ!」状態なのですが、今
度は頼みのダイレクトタグジャンプが機能しません。

浄土真宗の聖典(浄土三部経など。電子化されたものが本願寺からダウンロードでき
る)の本文に注をつけて、ダイレクトタグジャンプで参照できるように整備していこ
う、という構想なのです。

S-JIS で保存していたときには想定通りに動いていました。ところがユニコードで保
存し直して以降、ダイレクトタグジャンプでエラーが出るようになりました。

エラーメッセージは「tagsファイル内にその関数が見つかりませんでした」と出ます。

本文、tags ファイル、注をまとめたファイル、3本ともユニコードに置き換えてい
ます。

tags ファイル内にカーソルを置いてタグジャンプ、というのは利きます。

念のため検索をかけてみると、上記3本のファイルすべてでターゲットの言葉を拾っ
てくれますから、同じ文字コードで保存されていることも確かです。

漢字が悪いのかと思い、ダミーの英字で実験しても同じ結果になります。

何が悪いのでしょうか? また、どのような対応が考えられますか?

続けて、宜しくお願いいたします。(^||^) (←合掌)

[ ]
RE:11173 ユニコードの扱い^2No.11176
ひろ さん 02/01/31 17:19
 
 秀丸担当さん、おしょうさん今日は、ひろです。
> 今
> 度は頼みのダイレクトタグジャンプが機能しません。
 ダイレクトタグジャンプが機能しないというより、「tags ファイルの作成」
は Unicode に対応していないようですね。

> 本文、tags ファイル、注をまとめたファイル、3本ともユニコードに置き換えてい
> ます。
>
> tags ファイル内にカーソルを置いてタグジャンプ、というのは利きます。
 この tags ファイルですが、ちゃんと Unicode で保存されていて、読むこ
とが出来ますか? 私の環境 (Windows98+I.E Ver.5.5+秀丸 Ver.3.14,
Ver.3.14β6) では tags ファイルは Shift-JIS と認識されて、元のファイ
ルの日本語部分は化けてしまいます。更に出力される行数は、該当する行を
含めファイル内で見つかった個数を a とし、実際にヒットした行を b とす
ると、出力行 n=a+b となり実際の行とずれてしまいます。

> 念のため検索をかけてみると、上記3本のファイルすべてでターゲットの言葉を拾っ
> てくれますから、同じ文字コードで保存されていることも確かです。
 秀丸の内部コードは Shift-JIS で、ファイルのコード単位で検索している
わけではないので、一旦開いてしまえば、ファイルの文字コードは関係あり
ません。ファイルのコードが同じかどうか調べるのなら、「動作環境」→
「ウィンドウ」→「高度なウィンドウ」の「文字コードの種類を表示する」
を「全ての文字コード+改行コード」等にしておいて、開いたファイルのタイ
トル・バーを見てください。

> 何が悪いのでしょうか? また、どのような対応が考えられますか?
 もし tags ファイルがちゃんと読めるなら、Shift-JIS で保存し直すと良
いかもしれません。

 以下秀丸担当さんへ
 tags ファイルの出力は、少なくとも設定で文字コードの自動認識を選択し
ているなら、 Shift-JIS に変換して出力した方がよいと思うのですが、如何
でしょうか?

> エラーメッセージは「tagsファイル内にその関数が見つかりませんでした」と出ま
>す。
 そろそろ「関数」ではなく「強調行」にした方が良いのでは?

[ ]
RE:11176 ユニコードにはなりませんよねぇNo.11177
さん 02/01/31 17:59
 
秀丸担当さん、おしょうさん、ひろさん、今日は。

最近は、多言語環境で使用している人も増え、maruoの質問も増えてきたことですが、
問題の多くは秀丸内部の表現がShift-JISであることのように思えます。

乱暴な意見ですが、内部表現をUTF-8あたりになりませんかねぇ?
やっぱ無理ですか?
マクロとか、いろいろ障害はいっぱいありそうですが。

[ ]
RE:11176 ユニコードの扱い^2No.11178
秀丸担当 さん 02/01/31 18:59
 
ダイレクトタグジャンプが機能しないのはひろさんが言われていることが
原因と思われます。

> 以下秀丸担当さんへ
> tags ファイルの出力は、少なくとも設定で文字コードの自動認識を選択し
>ているなら、 Shift-JIS に変換して出力した方がよいと思うのですが、如何
>でしょうか?

なんとか対応を考えたいと思います。

>> エラーメッセージは「tagsファイル内にその関数が見つかりませんでした」と出
>ます。
> そろそろ「関数」ではなく「強調行」にした方が良いのでは?

強調行とも限らないので、「関数または強調行」のような感じにしようと思います。

[ ]
RE:11177 ユニコードにはなりませんよねぇNo.11179
秀丸担当 さん 02/01/31 18:59
 
>乱暴な意見ですが、内部表現をUTF-8あたりになりませんかねぇ?
>やっぱ無理ですか?
>マクロとか、いろいろ障害はいっぱいありそうですが。

内部をUnicodeにするのはちょっと大変そうです。
いずれやるときが来るのかもしれませんが、当面は内部は
Shift-JISでいこうと思います。

といいつつV3.14ではNTのときだけUnicodeウィンドウに
なっていて、内部的にもUnicode化していっているのかも…


[ ]
RE:11178 ユニコードの扱い^2No.11182
ひろ さん 02/01/31 20:15
 
 秀丸担当さん今日は、ひろです。
> > tags ファイルの出力は、少なくとも設定で文字コードの自動認識を選択し
> >ているなら、 Shift-JIS に変換して出力した方がよいと思うのですが、如何
> >でしょうか?
>
> なんとか対応を考えたいと思います。
 宜しくお願いします。

> 強調行とも限らないので、「関数または強調行」のような感じにしようと思います。
 確かにその通りですが、「強調行の範囲選択」「上/下の強調行」と既に変
わっているので、このメッセージだけ拘っても仕方がないのではないかと。

[ ]
RE:11176 ユニコードの扱い^2No.11186
おしょう さん 02/01/31 21:50
 
ありがとうございました。助言の通りにしたら、元通り機能するようになりました。

> この tags ファイルですが、ちゃんと Unicode で保存されていて、読むこ
>とが出来ますか? 私の環境 (Windows98+I.E Ver.5.5+秀丸 Ver.3.14,
>Ver.3.14β6) では tags ファイルは Shift-JIS と認識されて、元のファイ
>ルの日本語部分は化けてしまいます。

文字コードはタイトルバーに表示させていたので、ユニコードで間違いありません。
保存も表示も問題なくできていましたし、その後書き直したユニコード文字も表示さ
れていました。(Ver.3.13)

>更に出力される行数は、該当する行を
>含めファイル内で見つかった個数を a とし、実際にヒットした行を b とす
>ると、出力行 n=a+b となり実際の行とずれてしまいます。

どうも、それが原因だったようですね。こんなことは、使うのが精一杯の者ではちょ
っと気づきようがありません。

> 秀丸の内部コードは Shift-JIS で、ファイルのコード単位で検索している
>わけではないので、一旦開いてしまえば、ファイルの文字コードは関係あり
>ません。

そうだったのですか。私は、文字コードが変わるとこれまでの定義(?)もすべて無
駄になるものと思っておりました。これからは安心して作業できます。

> もし tags ファイルがちゃんと読めるなら、Shift-JIS で保存し直すと良
>いかもしれません。

ということで、tags ファイルだけ Shift-JIS で保存し直してみたところ、それだけ
で回復しました。こんなにあっけなく解決できるとは思っていませんでした。多謝。

>> エラーメッセージは「tagsファイル内にその関数が見つかりませんでした」と出
>ます。
> そろそろ「関数」ではなく「強調行」にした方が良いのでは?

(尻馬乗り……その方が、私のような(プログラム開発とは異なる)使い方をしてい
る者にも助かります。)

[ ]