コピー&ペイストしたURLに空白空白が挿入No.26406
hej さん 09/03/26 16:24
 
みなさん、こんにちは。いつもお世話になっています。

HP上で、URLをコピー、秀丸にペイストしたファイルを保存後、再度開くときに次の
ようなポップアップが出ます。

「NULL文字を空白に変換して読み込みました。変換した文字にジャンプしますか?」

そして、URLに半角の空白が挿入されてしまいます。こんな感じです。URLは変えてあ
ります。あと、日本語の部分は、文字化けしています。
 h t t p : / / c o m / 3 9 6 7 /  s k l m p

notepadで正常に開けて秀丸では空白挿入、逆に、notepadでは空白挿入、秀丸では正
常表示、とファイルによって現象が違います。

コピー元のHP上の表示に問題があったために、このような現象が起きてしまうのでし
ょうか。もし回避することのできる簡単な方法がありましたら、教えていただけませ
んか。

よろしくお願いします。

[ ]
RE:26406 コピー&ペイストしたURLに空白No.26407
秀丸担当 さん 09/03/26 17:05
 

おそらく、保存時のエンコードがUnicode(UTF-16)になっていて、読込むときの
エンコードの自動認識で、UTF-16であることがうまく認識されていないのだと思
います。

とりありずうまく読み込むためには、[ファイル]→[開く]で、エンコードの種類
を明示的にUnicode(UTF-16)にして読み込むとうまくできるかもしれません。


設定を確認するために、[その他]→[動作環境]のダイアログで左下の「上級者向
け設定」をONにしてみてほしいです。

そして、もし[その他]→[動作環境]→[ファイル]→[エンコード1]の、「標準の
エンコードの種類」が「Unicode(UTF-16)」になっている場合は、操作手順によ
ってはご報告にあるような問題が起きやすいことが報告されています。
大変申し訳ありませんが、ここの設定ではUTF-16は選ばないほうがいいようです。
([ファイル]→[開く]の中の「自動判定の設定...」でも同じです)

現在β版を公開中ののV7.11β2ではこのあたりの設定の改善が行われています。
V7.11β2は以下のページの下のほうからダウンロードできます。
http://hide.maruo.co.jp/software/hidemaru.html


上記のような設定で使われていない場合、Unicode(UTF-16)で保存するときは、
[ファイル]→[名前を付け保存]で、Unicode(UTF-16)を選び、されに「BOMを付け
る」をONにして保存しておくと、自動認識に失敗しにくくなります。

読み込むときにBOMを認識させるためには、
[その他]→[動作環境]→[ファイル]→[エンコード1]で「UnicodeのBOMを認識」
がONになっている必要があります。

[ ]
RE:26407 コピー&ペイストしたURLに空白No.26409
hej さん 09/03/26 19:03
 
>おそらく、保存時のエンコードがUnicode(UTF-16)になっていて、

UTF-16を使っています。標準のエンコードの種類を、Unicode(UTF-16)、自動判定もU
nicode(UTF-16)など5つほどチェックを付けています。BOMもONにしています。
V7.11β2を入れると、手元の2つのファイルの文字化けはなくなりました。
原因が分かったので一応安心しました。

ところで、現在使用中の設定では、ファイル→名前を付けて保存 で、エンコードの
種類のところには、[自動判定ーUnicode16]と表示されますが、ここはいじらないで
このまま保存すると、BOMは付くのでしょうか、付かないのでしょうか。この時[BOM
を付ける]のボタンは消えています。

この件とは別件になるのですが、今は、標準のエンコードの種類を、Unicode(UTF-1
6)にして、すべてのファイルをUnicode(UTF-16)で保存しています。このような設定
にしたのは、普段入力する言語は、日本語がほとんどなのですが、たまに、中国語、
ハングル、ヨーロッパの言語を、コピー&ペイストで保存する必要があるためです。
その都度エンコードの種類を選択するのが面倒なために、Unicodeを[標準のエンコー
ドの種類]に設定したわけです。

このような使い方の場合に、標準のエンコードの種類には、どれを選んでおくのがよ
り良いのでしょうか。UTF-8、UTF-16、なのか、それとも日本語にしておいて、その
都度、エンコードの種類を各国語に選択して保存するべきなのか、どれがよいのでし
ょうか。秀丸エディターの使い方とは直接関係ない質問ですが、教えていただけると
ありがたいです。

[ ]
RE:26409 コピー&ペイストしたURLに空白No.26412
秀丸担当 さん 09/03/27 11:14
 

>UTF-16を使っています。標準のエンコードの種類を、Unicode(UTF-16)、自動判定もU
>nicode(UTF-16)など5つほどチェックを付けています。BOMもONにしています。
>V7.11β2を入れると、手元の2つのファイルの文字化けはなくなりました。
>原因が分かったので一応安心しました。

できたようでよかったです。
ご迷惑をおかけして申し訳ありません。

>ところで、現在使用中の設定では、ファイル→名前を付けて保存 で、エンコードの
>種類のところには、[自動判定ーUnicode16]と表示されますが、ここはいじらないで
>このまま保存すると、BOMは付くのでしょうか、付かないのでしょうか。この時[BOM
>を付ける]のボタンは消えています。

新規状態では、UTF-16の場合はBOMが付き、UTF-8ではBOMは付かないです。
既存のファイルを開いた状態では、現在の状態を引き継ぎます。
既存のファイルを開いて、そのファイルにBOMがあるかどうかを確認するには、
ステータスバーに表示させることができます。
ステータスバーのエンコードが表示されているところを右クリックして、「BOM
の有無」をONにすると、表示されます。

名前を付けて保存のとき、状態がわかりくにいというご意見もいただいていて、
将来的にV8.00を出すときには名前を付けて保存ダイアログでもBOMの有無と切り
替えが簡単にできるようになる予定です。

>このような使い方の場合に、標準のエンコードの種類には、どれを選んでおくのがよ
>り良いのでしょうか。UTF-8、UTF-16、なのか、それとも日本語にしておいて、その
>都度、エンコードの種類を各国語に選択して保存するべきなのか、どれがよいのでし
>ょうか。秀丸エディターの使い方とは直接関係ない質問ですが、教えていただけると
>ありがたいです。

一番いいのは、日本語(Shift-JIS)にしておいて、警告が出たらその都度選ぶの
がいいと思います。
V7.11β2を入れられたのであれば、UTF-16でも今まで起きていたような問題は起
きにくいと思います。
UTF-8にすると、NULL文字が入ってしまうということは起きないので安全ですが、
標準でBOMは付かないので、特徴的な文字が少ない場合は自動認識に失敗する可
能性もあります。

[ ]
RE:26412 コピー&ペイストしたURLに空白No.26421
hej さん 09/03/28 00:10
 
>既存のファイルを開いて、そのファイルにBOMがあるかどうかを確認するには、
>ステータスバーに表示させることができます。
>ステータスバーのエンコードが表示されているところを右クリックして、「BOM
>の有無」をONにすると、表示されます。

「BOMの有る無し」の確認、表示の仕方が解りました。


>名前を付けて保存のとき、状態がわかりくにいというご意見もいただいていて、
>将来的にV8.00を出すときには名前を付けて保存ダイアログでもBOMの有無と切り
>替えが簡単にできるようになる予定です。

日本語(Shift-JIS)とUTF16をその都度切り換えるのが面倒(名前を付けて保存ダイヤ
ログでの選択が)で、1年くらい前から、すべてをUnicode UTF16で保存していました。
一応日本語(Shift-JIS)に戻してみようと思います。
V8.00では、保存するときの各言語の切り替えが簡単にできるとことを希望します。
【キーボードを使って簡単に】切り換えられるといいのですが。

どうもありがとうございました。

[ ]