UTR-8 ファイルを APPENDCOPYTEXT No.07335
onga^n さん 14/01/27 23:32
 
田楽DLL を便利に利用させていただいています。

UTF-8 (BOM付) の文字コードで記録されたファイルを
田楽DLL の “APPENDCOPYTEXT”を使って追記すると
結果がおかしくなります。
 
たとえば
  ファイル1 : AAA東京
  ファイル2 : BBB大阪
というファイルがあったとして,ファイル2をファイル1に
APPENDCOPYTEXT して,結果(ファイル1)の内容を見ると
AAA東京
B BB大阪
のようになります。
「B BB大阪」の空白の部分は 単純な空白ではなく,削除しようと
すると予測できない変な結果になります。
どうやらこれは ファイル2の BOM がそのままコピーされて
しまったためではないかと考えています。

この問題を回避するために,現在は
 ・ファイル1を開き
 ・ファイル2を開き
 ・ファイル2をコピーして
 ・ファイル1に追記して
 ・ファイル1を閉じる
というマクロで代用していますが,APPENDCOPYTEXT の数倍の
時間がかかるようで,なんとか高速化したいのですが,
基本的に 田楽DLL は,UTF-8 ファイルには対応できない
のでしょうか。


[ ]
RE:07335 UTR-8ファイルを APPENDCOPYTEXTNo.07336
h-tom さん 14/01/28 00:34
 

h-tom です。

>基本的に 田楽DLL は,UTF-8 ファイルには対応できない
>のでしょうか。
念のため、ソースを見てみましたが、"APPENDCOPYTEXT"は、BOMのチェックは
やってないです。
ということで、UTF-8 (BOM付)でも、そのままBOMごと追加されすはずです。

>この問題を回避するために,現在は
> ・ファイル1を開き
ファイルの最後に移動して、ファイル2を「カーソル位置へ読み込み」
> ・ファイル1を閉じる
とすれば、多少は早くなるかもしれないです。

[ ]
RE:07336 UTR-8ファイルを APPENDCOPYTEXTNo.07337
杉浦 まさき さん 14/01/28 00:54
 
こんばんは。田楽DLL作者の杉浦です。

h-tom さんが既に回答されているように、
田楽DLLの APPENDCOPYTEXT() は UTF-8 の BOM は除去しません。
また、申し訳ありませんが
現時点で UTF-8 への対応予定もありません。

>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>とすれば、多少は早くなるかもしれないです。

[ ]
RE:07337 UTR-8ファイルを APPENDCOPYTEXTNo.07338
onga^n さん 14/01/29 17:07
 
早速ご回答をいただき,ありがとうございました。
そうですか。作者から「対応予定なし」といわれては,どうしようもありません。あ
きらめます。

田楽DLLには 特に適用範囲は書かれていないように思いますが,全体として UTF-8
には対応していないということでしょうか。
また 秀丸マクロ自体も UTF-8 はサポート範囲外なのでしょうか。全角文字のバイト
数の違いなど 微妙な点がいろいろありそうですね。



[ ]
RE:07338 UTR-8ファイルを APPENDCOPYTEXTNo.07339
山紫水明 さん 14/01/29 21:20
 
 onga^nさん,

>また 秀丸マクロ自体も UTF-8 はサポート範囲外なのでしょうか。全角文字の
>バイト数の違いなど 微妙な点がいろいろありそうですね。

  MmJre.dll のヘルプ(秀丸エディタのシステムフォルダの中にある HmJre.chm)
にはユニコード文字を扱う際の注意などが書いてあります。
 
                          山紫水明
                          SANSHISUIMEI

[ ]