不完全?β21の「xml宣言のencodingを解析No.15499
dszhm さん 03/10/10 16:24
 
β21をインストールして、「xml宣言のencodingを解析」を
以下のXMLをDrag&Dropで試してみましたが、
ダメなようです。

<?xml version="1.0" encoding="UTF-8"?>
<文書><章><文章>日本語文章</文章></章></文書>

[ ]
RE:15499 不完全?β21の「xml宣言のencodNo.15500
アルビレオ さん 03/10/10 17:16
 
秀丸ユーザーのアルビレオです。

>β21をインストールして、「xml宣言のencodingを解析」を
>以下のXMLをDrag&Dropで試してみましたが、
>ダメなようです。
>
><?xml version="1.0" encoding="UTF-8"?>
><文書><章><文章>日本語文章</文章></章></文書>

こちらで上記の内容をコピーして試した限りではうまくいっています。
(保存のときにもencodingに合わせてくれるので非常に嬉しいです)

[ファイルタイプ別の設定]-[保存・読み込み]の[標準の文字コード]の設定は
[自動選択]になっているでしょうか?
古い秀丸ではここがデフォルトで JIS に設定されていたので、特に変更してい
なければその設定のままになっていると思います。

[ ]
RE:15499 不完全?β21の「xml宣言のencodNo.15501
秀丸担当 さん 03/10/10 17:16
 

>β21をインストールして、「xml宣言のencodingを解析」を
>以下のXMLをDrag&Dropで試してみましたが、
>ダメなようです。

やってみたところ、認識することができました。
[動作環境]→[編]集]→[文字コードの自動認識をする]がチェックされていない
と、認識はしません。
どのような手順で行ったのか、詳しく教えていただけると助かります。

[ ]
RE:15501 不完全?β21の「xml宣言のencodNo.15504
dszhm さん 03/10/10 23:30
 
>
>>β21をインストールして、「xml宣言のencodingを解析」を
>>以下のXMLをDrag&Dropで試してみましたが、
>>ダメなようです。
>
>やってみたところ、認識することができました。
>[動作環境]→[編]集]→[文字コードの自動認識をする]がチェックされていない
>と、認識はしません。
>どのような手順で行ったのか、詳しく教えていただけると助かります。

  仰せのように、設定したら、認識するようになりました。
  (「ONにすると半角カナ…」が気になってはずしていたのですが)
 これを、ファイルタイプ別に設定できれば、
 *.xml と *.xsl に設定したいですが・・・

[ ]
RE:15500 不完全?β21の「xml宣言のencodNo.15505
dszhm さん 03/10/10 23:32
 
>秀丸ユーザーのアルビレオです。
>
>>β21をインストールして、「xml宣言のencodingを解析」を
>>以下のXMLをDrag&Dropで試してみましたが、
>>ダメなようです。
>>
>><?xml version="1.0" encoding="UTF-8"?>
>><文書><章><文章>日本語文章</文章></章></文書>
>
>こちらで上記の内容をコピーして試した限りではうまくいっています。
>(保存のときにもencodingに合わせてくれるので非常に嬉しいです)
>
>[ファイルタイプ別の設定]-[保存・読み込み]の[標準の文字コード]の設定は
>[自動選択]になっているでしょうか?
>古い秀丸ではここがデフォルトで JIS に設定されていたので、特に変更してい
>なければその設定のままになっていると思います。

  自宅PCではなっていました。
 職場PCでもなっていると思います。
 (秀丸担当さんに教わった設定で認識できるようになりました)

[ ]
RE:15504 不完全?β21の「xml宣言のencodNo.15506
アルビレオ さん 03/10/11 00:03
 
アルビレオです。

> これを、ファイルタイプ別に設定できれば、
> *.xml と *.xsl に設定したいですが・・・

[ファイルタイプ別の設定]で[設定のリスト]ボタンを押すとダイアログが開きま
す。ここで[新規]ボタンで新しいファイルタイプを自分で作ることができます。

でもたぶんHTMLファイルと似た設定になると思うので、[HTMLファイル]を選択し
てコピーボタンを押して新規のファイルタイプを作った方がいいですね。
[コピー]でファイルタイプを作成したら[閉じる]で[ファイルタイプ別の設定]ダ
イアログに戻ってからXML用の設定に変更すればできあがりです。

[ ]
RE:15506 不完全?β21の「xml宣言のencodNo.15515
dszhm さん 03/10/13 17:06
 
>> これを、ファイルタイプ別に設定できれば、
>> *.xml と *.xsl に設定したいですが・・・
>
>[ファイルタイプ別の設定]で[設定のリスト]ボタンを押すとダイアログが開きま
>す。ここで[新規]ボタンで新しいファイルタイプを自分で作ることができます。
>
>でもたぶんHTMLファイルと似た設定になると思うので、[HTMLファイル]を選択し
>てコピーボタンを押して新規のファイルタイプを作った方がいいですね。
>[コピー]でファイルタイプを作成したら[閉じる]で[ファイルタイプ別の設定]ダ
>イアログに戻ってからXML用の設定に変更すればできあがりです。

  勘違いされていると思うので・・・
 私がファイルタイプ別に設定したいt、と記したのは、
> [動作環境]→[編]集]→[文字コードの自動認識をする]
  のことです。

[ ]
RE:15515 不完全?β21の「xml宣言のencodNo.15520
秀丸担当 さん 03/10/14 16:23
 

>  勘違いされていると思うので・・・
> 私がファイルタイプ別に設定したいt、と記したのは、
>> [動作環境]→[編]集]→[文字コードの自動認識をする]
>  のことです。

ファイルタイプ別の設定で「文字コードの自動認識をする」を設定することはで
きません。
「文字コードの自動認識をする」の「詳細」でチェックを全て外すと、XML宣言
だけを認識するようになります。
ここにXML宣言を認識するかどうかのチェックボックスは無いですが、「文字
コードの自動認識をする」さえチェックしておけば常に認識します。V4.01以降
では、XML宣言を認識するかどうかのチェックボックスもつけるようにしようと
思います。

[ ]
RE:15520 不完全?β21の「xml宣言のencodNo.15523
dszhm さん 03/10/14 22:08
 
>>  勘違いされていると思うので・・・
>> 私がファイルタイプ別に設定したいt、と記したのは、
>>> [動作環境]→[編]集]→[文字コードの自動認識をする]
>>  のことです。
>
>ファイルタイプ別の設定で「文字コードの自動認識をする」を設定することはで
>きません。
>「文字コードの自動認識をする」の「詳細」でチェックを全て外すと、XML宣言
>だけを認識するようになります。
>ここにXML宣言を認識するかどうかのチェックボックスは無いですが、「文字
>コードの自動認識をする」さえチェックしておけば常に認識します。V4.01以降
>では、XML宣言を認識するかどうかのチェックボックスもつけるようにしようと
>思います。

  「文字コードを自動認識する」には
  「これをONにすると、半角カナを含んだファイルを誤認識する場合があります」
  という注記があり、半角カナを含むテキストファイルを開く可能性があるため、
  全てのファイルタイプに共通の設定となってしまうため、
  チェックすることはできません。
  また、*.xml や *.xsl  ではない、拡張子でXML形式のファイルも一部あります。
  だから、「ファイルタイプ別の設定」で「文字コードを自動認識する」を
  設定できれば、XML形式のファイルの自動認識が非常に便利に使えるのですが、
  「動作環境」にあるのでは残念ながら、私のところでは使用できません。


[ ]
RE:15523 不完全?β21の「xml宣言のencodNo.15526
アルビレオ さん 03/10/15 04:17
 
アルビレオです。

>>>  勘違いされていると思うので・・・
>>> 私がファイルタイプ別に設定したいt、と記したのは、
>>>> [動作環境]→[編]集]→[文字コードの自動認識をする]
>>>  のことです。

勘違いしていました。

>  「文字コードを自動認識する」には
>  「これをONにすると、半角カナを含んだファイルを誤認識する場合があります」
>  という注記があり、半角カナを含むテキストファイルを開く可能性があるため、
>  全てのファイルタイプに共通の設定となってしまうため、
>  チェックすることはできません。

ちょっと誤解があるようですが、半角カナを含んだファイルでもそんなに頻繁に
誤認識をするというわけではありません。
半角カナよりも前にある程度のいわゆる全角文字があれば、たいていの場合は正
しく認識することができると思います。
dszhmさんがどのようなファイルを扱っているのかはわからないので、実際に自
動認識でしばらく使った上で使えないと感じているのなら話は変わってきますが。

・秀丸担当さんへ
とはいっても誤認識することもないわけではないので、文字コードを指定して再
読み込みする機能はあった方がいいと思います。
そのためのマクロも公開されてはいますが、標準として装備して欲しい機能です。
[編集]メニューの[最初からやり直し]の下に[文字コードを指定再読み込み...]
といった感じでどうでしょう。あるいは[ファイル]メニューでもいいですよね。
再読み込みだから文字コードを選択するプルダウンメニューだけのダイアログで
いいと思います。(でも閲覧モードや読み取り専用のチェックボックスが欲しい
という人もいるかもしれませんね)

>  また、*.xml や *.xsl  ではない、拡張子でXML形式のファイルも一部ありま
>す。
>  だから、「ファイルタイプ別の設定」で「文字コードを自動認識する」を
>  設定できれば、XML形式のファイルの自動認識が非常に便利に使えるのですが、

XML形式ファイルの拡張子が特定できないのなら、[ファイルタイプ別の設定]で
特定の拡張子だけ自動認識がONになるとかえって困るのではないでしょうか?
dszhmの希望は自動認識が「特定のファイルだけON」なのか「特定のファイルだ
けOFF」なのかわからなくなってきました。

どちらにしろ過去の設定項目を引き継ぐのが難しそうなので実現できるのかどう
か私にはわかりません。
[ファイルタイプ別の設定]-[保存・読み込み]-[標準の文字コード]に[読み込み
にも適用(自動認識しない)]といったチェックボックスを増やす形ならなんとか
なるのかもしれませんが、これは1ユーザーの勝手な推測にすぎません。

[ ]
RE:15526 不完全?β21の「xml宣言のencodNo.15527
dszhm さん 03/10/15 08:32
 
>アルビレオです。
>
>>>>  勘違いされていると思うので・・・
>>>> 私がファイルタイプ別に設定したいt、と記したのは、
>>>>> [動作環境]→[編]集]→[文字コードの自動認識をする]
>>>>  のことです。
>
>勘違いしていました。
>
>>  「文字コードを自動認識する」には
>>  「これをONにすると、半角カナを含んだファイルを誤認識する場合があります」
>>  という注記があり、半角カナを含むテキストファイルを開く可能性があるため、
>>  全てのファイルタイプに共通の設定となってしまうため、
>>  チェックすることはできません。
>
>ちょっと誤解があるようですが、半角カナを含んだファイルでもそんなに頻繁に
>誤認識をするというわけではありません。

  ただ、何となく内容を眺めるのであれば「そんなに頻繁には誤認識しない」
 レベルで使用できますが、少しでも誤認識すれば使用できない用途と
  いうのもあります。
 詳しく述べることはできませんが、そのような場面で使用することも
 想定しなければならない使用方法であるとご理解ください。

>半角カナよりも前にある程度のいわゆる全角文字があれば、たいていの場合は正
>しく認識することができると思います。
>dszhmさんがどのようなファイルを扱っているのかはわからないので、実際に自
>動認識でしばらく使った上で使えないと感じているのなら話は変わってきますが。
>
>・秀丸担当さんへ
>とはいっても誤認識することもないわけではないので、文字コードを指定して再
>読み込みする機能はあった方がいいと思います。
>そのためのマクロも公開されてはいますが、標準として装備して欲しい機能です。
>[編集]メニューの[最初からやり直し]の下に[文字コードを指定再読み込み...]
>といった感じでどうでしょう。あるいは[ファイル]メニューでもいいですよね。
>再読み込みだから文字コードを選択するプルダウンメニューだけのダイアログで
>いいと思います。(でも閲覧モードや読み取り専用のチェックボックスが欲しい
>という人もいるかもしれませんね)
>
>>  また、*.xml や *.xsl  ではない、拡張子でXML形式のファイルも一部ありま
>>す。
>>  だから、「ファイルタイプ別の設定」で「文字コードを自動認識する」を
>>  設定できれば、XML形式のファイルの自動認識が非常に便利に使えるのですが、
>
>XML形式ファイルの拡張子が特定できないのなら、[ファイルタイプ別の設定]で
>特定の拡張子だけ自動認識がONになるとかえって困るのではないでしょうか?
>dszhmの希望は自動認識が「特定のファイルだけON」なのか「特定のファイルだ
>けOFF」なのかわからなくなってきました。

  個々のユーザにとって、XML形式になっているファイルの拡張子は
 特定できると思っています。私もそうです。
 ただ、一般的ではないものもあるので、
 個々のユーザが「ファイルタイプ別の設定」で指定するのが
 便利かな、と思ったわけです。

>どちらにしろ過去の設定項目を引き継ぐのが難しそうなので実現できるのかどう
>か私にはわかりません。
>[ファイルタイプ別の設定]-[保存・読み込み]-[標準の文字コード]に[読み込み
>にも適用(自動認識しない)]といったチェックボックスを増やす形ならなんとか
>なるのかもしれませんが、これは1ユーザーの勝手な推測にすぎません。

  「ファイルタイプ別の設定」の「モード」でXMLをチェックしたら、
 そのそばにある「文字コードの自動認識」が有効になる、というのが
 私の独断的な理想なのですが、突飛である、というのであれば、
 あきらめます。

[ ]
RE:15527 不完全?β21の「xml宣言のencodNo.15528
アルビレオ さん 03/10/15 11:20
 
アルビレオです。

>  ただ、何となく内容を眺めるのであれば「そんなに頻繁には誤認識しない」
> レベルで使用できますが、少しでも誤認識すれば使用できない用途と
>  いうのもあります。
> 詳しく述べることはできませんが、そのような場面で使用することも
> 想定しなければならない使用方法であるとご理解ください。

コマンドラインオプションや「開く」ダイアログで文字コードを指定して開くこ
とも可能だから、文字コードがわかっているファイルはそれを使って開けばいい
ような気がしますが、別に要望自体に反対しているわけでもないのでこれぐらい
にしておきます。
でもちょっと興味があるのであまり具体的でなくてもいいですから、バッチ/ス
クリプト/マクロで拡張子を判断して文字コードを開く方法では役に立たない or
使いにくい例を教えていただけると嬉しいです。(無理にとはいいませんが)

>  個々のユーザにとって、XML形式になっているファイルの拡張子は
> 特定できると思っています。私もそうです。
> ただ、一般的ではないものもあるので、
> 個々のユーザが「ファイルタイプ別の設定」で指定するのが
> 便利かな、と思ったわけです。

そうですよね。
ただ秀丸担当さんのXMLのcharset指定の話は.xmlや.xslに限った話でもないのに
>>>  また、*.xml や *.xsl  ではない、拡張子でXML形式のファイルも一部ありま
>>>す。
とわざわざ書かれていたので混乱してしまいました。
自分でファイルタイプの拡張子を指定するというだけのことなら、この話の流れ
で今さら理由としてあげるようなものではないと思ったので。

>  「ファイルタイプ別の設定」の「モード」でXMLをチェックしたら、
> そのそばにある「文字コードの自動認識」が有効になる、というのが
> 私の独断的な理想なのですが、突飛である、というのであれば、
> あきらめます。

ファイルタイプ別の自動認識のON/OFFならばそれほど突飛とは思いませんが、
XML形式以外は自動認識なしで満足できる人はそれほど多くはないと思います。
仕様としても読み込み時の文字コードの指定方法のうち、XMLのcharset認識だけ
ファイルタイプ別で設定するというのは混乱を招くでしょう。
そろそろ正式リリースに向けてバグ以外の修正はしない方向に進んでいるような
ので、現在の設定項目と矛盾しない「ファイルタイプ別の自動認識」が実現する
かどうかは「今の時点では」微妙な気がします。

[ ]
RE:15528 不完全?β21の「xml宣言のencodNo.15530
秀丸担当 さん 03/10/15 15:52
 

半角カナを誤認識する可能性があるのは、「文字コードを使用可能にする」の
「詳細」で各チェックが入っている時だけです。
全てのチェックが外れていれば、半角カナを誤認識することはなく、XML宣言だ
けを識別するようになります。

ファイルタイプ別の設定で個別に設定できるようにするかどうかは、今後のバー
ジョンで検討させていただきます。V4.00ではやりません。

[ ]
RE:15530 不完全?β21の「xml宣言のencodNo.15548
dszhm さん 03/10/17 14:19
 
>半角カナを誤認識する可能性があるのは、「文字コードを使用可能にする」の
>「詳細」で各チェックが入っている時だけです。
>全てのチェックが外れていれば、半角カナを誤認識することはなく、XML宣言だ
>けを識別するようになります。

  仰せのとおりにやってみました。

<?xml version="1.0" encoding="UTF-8"?>
<文書><章><文章>日本語文章</文章></章></文書>

  というXMLファイルを作成し、
 UTF-8 でBOM 付きでセーブして、
 新規秀丸を開き、Explorer から Drap & Drop すると
 UTF-8 として認識してくれません。
 BOM 無しだと認識してくれます。

秀丸:beta21
OS:Win2K PRO SP4
IE:5.5
です。

>ファイルタイプ別の設定で個別に設定できるようにするかどうかは、今後のバー
>ジョンで検討させていただきます。V4.00ではやりません。

[ ]
RE:15548 不完全?β21の「xml宣言のencodNo.15549
dszhm さん 03/10/17 14:21
 
>>半角カナを誤認識する可能性があるのは、「文字コードを使用可能にする」の
>>「詳細」で各チェックが入っている時だけです。
>>全てのチェックが外れていれば、半角カナを誤認識することはなく、XML宣言だ
>>けを識別するようになります。
>
>  仰せのとおりにやってみました。
>
><?xml version="1.0" encoding="UTF-8"?>
><文書><章><文章>日本語文章</文章></章></文書>
>
>  というXMLファイルを作成し、
> UTF-8 でBOM 付きでセーブして、
> 新規秀丸を開き、Explorer から Drap & Drop すると
> UTF-8 として認識してくれません。
> BOM 無しだと認識してくれます。
>
>秀丸:beta21
>OS:Win2K PRO SP4
>IE:5.5
>です。

  追加情報です。
 UTF-16  だと、全滅です。
 (BOM 有無、LE/BEによらず)

>>ファイルタイプ別の設定で個別に設定できるようにするかどうかは、今後のバー
>>ジョンで検討させていただきます。V4.00ではやりません。

[ ]
RE:15548 不完全?β21の「xml宣言のencodNo.15552
アルビレオ さん 03/10/17 16:48
 
アルビレオです。

> UTF-8 でBOM 付きでセーブして、
> 新規秀丸を開き、Explorer から Drap & Drop すると
> UTF-8 として認識してくれません。
> BOM 無しだと認識してくれます。

ファイル先頭にBOMのついたファイルは
「encoding指定より前にASCII以外の文字がある」
ということになるのでXML違反なんですけどね…

「文字コードは自動認識しない、XMLのencoding指定は有効」
という実装は他にあまり存在しないので問題になることは少ないですが。

もしも秀丸がBOMを付加する位置をファイル先頭ではなく、ASCII以外の文字が最
初に使われる直前にすれば、少なくとも秀丸で保存したBOMつきファイルは正し
く認識されると思います。

[ ]
RE:15549 不完全?β21の「xml宣言のencodNo.15553
秀丸担当 さん 03/10/17 16:57
 
>> UTF-8 でBOM 付きでセーブして、
>> 新規秀丸を開き、Explorer から Drap & Drop すると
>> UTF-8 として認識してくれません。
>> BOM 無しだと認識してくれます。

UTF-8のBOMがあるとしたら、その時点でUTF-8で確定で、encodingは無意味なの
で判定する必要がありません。
秀丸の動作環境では、UTF-8の自動認識をチェックしておかなくてはいけません。
UTF-8の自動認識をすると、誤認識の可能性はあります。

ちなみにBOM付きUTF-8のXMLファイルはイレギュラーのような気がするのですが、
メモ帳がBOMを付けてるのでなんとも・・ですが。

>  追加情報です。
> UTF-16  だと、全滅です。
> (BOM 有無、LE/BEによらず)

動作環境でUnicode(=UTF-16)の自動認識を明示的にオフにしていれば、UTF-
16は認識しません。
UTF-16であればBOMの認識で確定するので、encodingは判定する必要がありませ
ん。
Unicode(=UTF-16)の自動認識をしても、誤認識の可能性は無いので、これだ
けはチェックしておいても問題ないです。

いずれも正しい動作と言えますが、ようは、誤認識の可能性のある自動認識であ
れば使えないってことだろうと思います。

[ ]
RE:15553 不完全?β21の「xml宣言のencodNo.15554
dszhm さん 03/10/17 17:38
 
>>> UTF-8 でBOM 付きでセーブして、
>>> 新規秀丸を開き、Explorer から Drap & Drop すると
>>> UTF-8 として認識してくれません。
>>> BOM 無しだと認識してくれます。
>
>UTF-8のBOMがあるとしたら、その時点でUTF-8で確定で、encodingは無意味なの
>で判定する必要がありません。
>秀丸の動作環境では、UTF-8の自動認識をチェックしておかなくてはいけません。
>UTF-8の自動認識をすると、誤認識の可能性はあります。
>
>ちなみにBOM付きUTF-8のXMLファイルはイレギュラーのような気がするのですが、
>メモ帳がBOMを付けてるのでなんとも・・ですが。
>
>>  追加情報です。
>> UTF-16  だと、全滅です。
>> (BOM 有無、LE/BEによらず)
>
>動作環境でUnicode(=UTF-16)の自動認識を明示的にオフにしていれば、UTF-
>16は認識しません。
>UTF-16であればBOMの認識で確定するので、encodingは判定する必要がありませ
>ん。
>Unicode(=UTF-16)の自動認識をしても、誤認識の可能性は無いので、これだ
>けはチェックしておいても問題ないです。
>
>いずれも正しい動作と言えますが、ようは、誤認識の可能性のある自動認識であ
>れば使えないってことだろうと思います。

「動作環境でUnicode(=UTF-16)の自動認識」を明示的にオンに
しましたが、BEのBOM 無し、だけ認識しないようです。
Drag & Drop、ファイル/開く、ファイルの履歴、
いずれもだめです。


[ ]
RE:15554 不完全?β21の「xml宣言のencodNo.15557
秀丸担当 さん 03/10/17 19:06
 

>「動作環境でUnicode(=UTF-16)の自動認識」を明示的にオンに
>しましたが、BEのBOM 無し、だけ認識しないようです。
>Drag & Drop、ファイル/開く、ファイルの履歴、
>いずれもだめです。

もともと、全てのバイナリ値が考えられるUTF-16(BOM無し)は自動認識に対応し
ていません。
また、XMLでは原則としてBOMはつけなければならないようです。
ですが、BOM無しUTF-16としてXML宣言が書かれていれば、他のエンコードと誤認
識することなくエンコードを特定できるので、V4.01で対応させていただきます。

[ ]
RE:15557 不完全?β21の「xml宣言のencodNo.15558
dszhm さん 03/10/17 19:21
 
>
>>「動作環境でUnicode(=UTF-16)の自動認識」を明示的にオンに
>>しましたが、BEのBOM 無し、だけ認識しないようです。
>>Drag & Drop、ファイル/開く、ファイルの履歴、
>>いずれもだめです。
>
>もともと、全てのバイナリ値が考えられるUTF-16(BOM無し)は自動認識に対応し
>ていません。
>また、XMLでは原則としてBOMはつけなければならないようです。
>ですが、BOM無しUTF-16としてXML宣言が書かれていれば、他のエンコードと誤認
>識することなくエンコードを特定できるので、V4.01で対応させていただきます。

  よろしくお願いします。

[ ]