UTF-8でエンコードされた添付ファイルが化No.22969
jizo さん 05/05/26 15:06
 
はじめまして。鶴亀を便利に使わせて頂いております。

早速ですが、過去記事にUTF-8で書かれたメールが化ける、というものがありました
が、こちらではUTF-8で書かれたファイルを添付すると日本語部分が文字化けする現
象が起きています。過去にAVG(アンチウイルスソフト)との相性で添付ファイルが
化ける現象が報告されていたようなので、念の為アンチウィルスの安全動作モードで
の送信、さらにはAVGを起動しない状態での送信を行なってみましたが結果は同様で
した。

鶴亀メール:Version4.15
AVG Free Edition:Version7.0.322

問題となった添付ファイルはXMLで、ポイントはどうやらXMLのヘッダとして定義する
エンコーディング情報

  <?xml version="1.0" encoding="UTF-8"?>

にあるようです。例えば秀丸エディタで

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <tag1>日本語のテスト</tag1>
</root>

というようなテキストファイル(エンコードはUTF-8)をセーブしこれを添付ファイ
ルとした場合、送信後のファイルを開くと化けています。ヘッダ部分を取り除くと問
題なく(Shift-JIS扱いで)開きます。おそらく送信されたときに内部でShift-JISに
変換されてしまっているが、UTF-8で開こうとするため化ける、といった動作のよう
に見受けられます。

参考までに、鶴亀Version4.09から送られてきた同じUTF-8エンコーディングの添付フ
ァイルは正常に(UTF-8として)開くことができました。

以上、宜しくお願い致します。

[ ]
RE:22969 UTF-8でエンコードされた添付フNo.22970
秀まるお2 さん 05/05/26 15:45
 
 現象はまだ確認していませんが、一応これが原因というのが思いつきました。

 とりあえず、「全般的な設定・上級者向け・デコード」の「受信したテキスト
形式添付ファイルをShift-JISに自動変換する」をOFFにすれば回避できると思い
ます。

-----------経緯についての説明---------------
 たしかこれはNetscape系のメールソフトでの動作としてですが、Shift-JIS文
字コードで書かれたテキストファイルを添付すると、それが自動的にJIS文字
コードに変換されて送信されてしまうというのがありました。それを鶴亀メール
で受信すると、元はShift-JISだったのにJISになってしまっているとかなんとか
って話があって、それで、とにかくJISとかなんとかって指定された
テキストファイルは全部Shift-JISに変換してしまう仕様にしたのだったと思い
ます。
-----------で、どうするか-------------------
 鶴亀メールで仕様変更するとしたら、そもそもこの「自動変換する」の
オプションをデフォルトOFFにするって手もあるんですが、それではたぶん別の
ケースで問題が起きる可能性があります。なので、変換するのは「JIS->Shift-
JIS」のみに限定して、utf-8とかのやつはそのままにするという手がありますが
…。

 そうするって方向で修正してみます。(次のV4.16β3にて)

 あ、確認テストも行います。

[ ]
RE:22970 UTF-8でエンコードされた添付フNo.22971
jizo さん 05/05/26 16:35
 
お返事ありがとうございます。

> とりあえず、「全般的な設定・上級者向け・デコード」の「受信したテキスト
>形式添付ファイルをShift-JISに自動変換する」をOFFにすれば回避できると思い
>ます。

このオプションがあることに気付きませんでした。きっとどこかにShift-JIS変換の
スイッチがあるはず、とは思いつつ、丁寧に調べておりませんで大変失礼致しました。

> 鶴亀メールで仕様変更するとしたら、そもそもこの「自動変換する」の
>オプションをデフォルトOFFにするって手もあるんですが、それではたぶん別の
>ケースで問題が起きる可能性があります。なので、変換するのは「JIS->Shift-
>JIS」のみに限定して、utf-8とかのやつはそのままにするという手がありますが
>…。

この辺りの問題には悩まされたことがあります。あちらを立てればこちらが立たずの
世界ですね(苦笑)設定がわかっただけでも充分なのですが、上記のように変更して
頂けるのならデフォルトでもUTF-8ファイルの扱いに気遣う必要もなく助かります。

迅速なご回答ありがとうございました。

[ ]
RE:22970 UTF-8でエンコードされた添付フNo.22976
おひ さん 05/05/27 02:00
 
おひと申します.
いつもお世話になっております.


私は OFF なのですが,ちょっと気になったのでご確認させて下さい.

鶴亀メールの仕組みとして,添付ファイルは個別に保存されているので
添付ファイルの書き換え云々は全然意識していなかったのですが,

  受信したテキスト形式添付ファイルをShift-JISに自動変換する:OFF

にすれば,”送られてきた(送った)添付データはそのまま”という理解
で宜しいのでしょうか.

個人的には,添付ファイルが SJIS/EUC/UTF-8 だったり,UNIX改行コー
ドだったりすることが多いので,もしも書き換えられる場合はそれなり
に考えます.


尚,鶴亀メールでは「添付ファイル」として認識しない,

  Content-Type: Text/Plain; charset=utf-8
  Content-Transfer-Encoding: 7bit

みたいなマルチパートであれば,文字コードを強制的に統一して表示す
るのは,鶴亀メールの仕組み的に理解できます.
(でも "--- inline ----" ぐらいの境界線は表示して欲しい気もします)


もし私がこのスレッドを読み違えている場合はご指摘願います.

[ ]
RE:22976 UTF-8でエンコードされた添付フNo.22978
秀まるお2 さん 05/05/27 08:36
 
>   受信したテキスト形式添付ファイルをShift-JISに自動変換する:OFF
>
> にすれば,”送られてきた(送った)添付データはそのまま”という理解
> で宜しいのでしょうか.

 そういうことになります。

> 尚,鶴亀メールでは「添付ファイル」として認識しない,
>
>   Content-Type: Text/Plain; charset=utf-8
>   Content-Transfer-Encoding: 7bit
>
> みたいなマルチパートであれば,文字コードを強制的に統一して表示す
> るのは,鶴亀メールの仕組み的に理解できます.
> (でも "--- inline ----" ぐらいの境界線は表示して欲しい気もします)

 境界線は入れてるようです。例えば「Content-Description: comment」みたい
なパートがあれば、

-----------------comment------------------

 みたいな区切り線が出るようにしているようです。Content-Description
ヘッダが無ければ、Contenet-type:ヘッダを使うようですが…。

 具体的にダメな例があれば、その受信ログを送っていただくことで検討課題と
出来ます。よかったら、 maruo@mitene.or.jp 宛に送って下さい。

[ ]
RE:22978 UTF-8でエンコードされた添付フNo.22979
おひ さん 05/05/27 09:21
 
おひと申します.

いつもお世話になっております.
ご回答有難うございます.

>  そういうことになります。

そうですか.良かったです.安心しました.

>  境界線は入れてるようです。例えば「Content-Description: comment」みたい
> なパートがあれば、
>
> -----------------comment------------------

個人的には,本文途中でこのパターンを目にした記憶はありませんでした.
逆に区切り線がでないパターンの方が多いので,その辺のパターンは後で
適当に送らせて頂きます.

でも,適当に見て頂いて,受信解析(や表示)で速度的に影響がでるよう
でしたらサクッと却下頂いて構いませんです.
多分,恩恵を受けるのはごく一部の人達だけだと思いますので,もった
いないです.

[ ]
RE:22979 UTF-8でエンコードされた添付フNo.23023
おひ さん 05/05/30 22:37
 
おひと申します.
いつもお世話になっております.

4.17 β1 で区切り線が出ることを確認致しました.
細かい点追加頂き有難うございました.m(_ _)m

#スレッドと違う話で申し訳ありません.

[ ]