X-Body-Content-Type: text/plain;charset="utf-7"を認識しない。No.00661
かかし さん 01/04/11 13:12
 
かかしです、こんにちは。

あるメーラで、以下のヘッダを含むメールを受信しました。

X-Body-Content-Type: text/plain;charset="utf-7"

そのメーラでは、Subject、本文ともに正しく認識しなかったので、
メールを鶴亀メールにインポートしました。(.mbx形式からインポート)

ところが、本文はうまくデコードされませんでした。

本文をコピーして、テキストファイルを作り、秀丸で utf-7 で開いたら
うまく読めました。

一発で鶴亀メールにインポートはできないものでしょうか?

---かかし

[ ]
RE:00661 X-Body-Content-Type:text/plain;charset="utf-7"を認識しNo.00667
なんと さん 01/04/11 13:38
 
なんとです。

> X-Body-Content-Type: text/plain;charset="utf-7"

このヘッダはどういう理由で付いたのでしょうね?それと
Content-Type:
ヘッダはありませんでしたか?

X-が付くヘッダは任意の情報を示すというくらいの意味合いなので、
メールソフトがそこから情報を得ることは滅多にありません。本来、
本文中の形式や文字コードを示すのは
Content-Type:
ヘッダなので、それが無いか間違っているのでは?

その場合、受信したメールソフトやインポートされた鶴亀が本文を表
示できなくても無理ないです。

そのあたりの情報をご自分で修正するしかないのではないかと。

[ ]
RE:00667 X-Body-Content-Type:text/plain;charset="utf-7"を認識しNo.00668
かかし さん 01/04/11 14:00
 
かかしです、こんにちは。

なんとさん、こんにちは。

>> X-Body-Content-Type: text/plain;charset="utf-7"
  :
>X-が付くヘッダは任意の情報を示すというくらいの意味合いなので、
>メールソフトがそこから情報を得ることは滅多にありません。本来、
>本文中の形式や文字コードを示すのは
>Content-Type:
>ヘッダなので、それが無いか間違っているのでは?

確かに、おっしゃるとおりだなあ・・と思って、見直しました。
-----
(前略)
Content-Type: multipart/alternative;
boundary="----=_NextPart_000_000B_01C0C20D.DEF90900"
X-Priority: 3
X-MSMail-Priority: Normal
X-Mailer: Microsoft Outlook Express 5.50.4133.2400
X-MimeOLE: Produced By Microsoft MimeOLE V5.50.4133.2400
X-UIDL: 71fe267002f7daefa8237ac2c5f1322d

This is a multi-part message in MIME format.

------=_NextPart_000_000B_01C0C20D.DEF90900
Content-Type: text/plain;
charset="utf-7"
Content-Transfer-Encoding: 7bit
(以下本文略)
----
マルチパートになっていて、HTMLが添付されていました。
これを見るとContent-Typeは、正しいようですが、
まだ、何かヘッダでおかしな部分はありますでしょうか?

>その場合、受信したメールソフトやインポートされた鶴亀が本文を表
>示できなくても無理ないです。
>
>そのあたりの情報をご自分で修正するしかないのではないかと。

まあ、送信元が規格にのっとっていなければ、無理矢理にでも
デコードするしかないと思っていますが・・・。

#本文が化けていた場合、無理矢理デコードするって鶴亀メールだけでは
#できませんよね。秀丸エディタなら「閉じて開く」で文字コード変えれば
#いいだけなのに・・・。

---かかし

[ ]
RE:00668 X-Body-Content-Type:text/plain;charset="utf-7"を認識しNo.00669
なんと さん 01/04/11 14:11
 
なんとです。

> Content-Type: text/plain;
> charset="utf-7"

 この2行の間に改行が入ってしまっているようですが。ここを1行
につなげたらちゃんと表示できないでしょうかね。

> #本文が化けていた場合、無理矢理デコードするって鶴亀メールだけでは
> #できませんよね。秀丸エディタなら「閉じて開く」で文字コード変えれば
> #いいだけなのに・・・。

 あー、情報が間違っているメールもたまにはありますねえ、確かに。
そういう場合は、ログを修正して改めて取り込みかな?ログを残して
ないと駄目だとか、知識が無いと直せないとか、けっきょく難しいで
すが。

[ ]
RE:00667 X-Body-Content-Type:text/plain;charset="utf-7"を認識しNo.00673
ひろ さん 01/04/11 14:20
 
 かかしさん、なんとさん今日は、ひろです。
> X-が付くヘッダは任意の情報を示すというくらいの意味合いなので、
> メールソフトがそこから情報を得ることは滅多にありません。本来、
> 本文中の形式や文字コードを示すのは
> Content-Type:
> ヘッダなので、それが無いか間違っているのでは?
 鶴亀自信は、X-Body-Content-Type から情報を得ることはありません。ただし
> Content-Type: multipart/mixed; boundary="AAAAAAAAAAAA"
というように、添付付きの場合は本文の文字コードを X-Body-Content-Type
に保存する仕様です。これはβの時に私が要望を出し、採用していただきました。

 ですから今回のかかしさんのメールは添付ファイル付きで、本文が UTF-7
で書いてあるのだと思います。

 問題の UTF-7 については、現状で鶴亀が対応している言語は、日本語と
英語、charaset でいうと、iso-2022-jp, us-ascii ぐらい (ひょっとした
ら、sjis, x_jis, euc-jp 等も OK かもしれませんが未確認) だと思います。

 ですから、現状では無理です。一応要望リストに、
> 多国語対応。(困難)
> デコードしないメールの保存。(たぶん無理)
という関連しそうな項目が含まれています。

[ ]
RE:00669 X-Body-Content-Type:text/plain;charset="utf-7"を認識しNo.00676
かかし さん 01/04/11 15:07
 
かかしです、こんにちは。

ひろさん、なんとさん、こんにちは。

>> Content-Type: text/plain;
>> charset="utf-7"
>
> この2行の間に改行が入ってしまっているようですが。ここを1行
>につなげたらちゃんと表示できないでしょうかね。

うーん、現象は変わらず、失敗してしまいました。

> あー、情報が間違っているメールもたまにはありますねえ、確かに。
>そういう場合は、ログを修正して改めて取り込みかな?ログを残して
>ないと駄目だとか、知識が無いと直せないとか、けっきょく難しいで
>すが。

まあ、知識がないと、「文字化けしてよめなーい」
で終わってしまいますね。
charsetを知っていてかつ秀丸でutf-7をデコードできることを知っていないと・・。

#初めてutf-7というフォーマットに触れました。

#まあ、デコードできたので、問題はないのですが、
#一応現象だけ報告しておきます。
#以下をa.mbxとして保存して、インポートしてみてください。

>From <xxx@baa.co.jp> Tue, 10 Apr 2001 22:30:39 +0900
X-snip:-----------------------------------
From: xxx@baa.co.jp
To: xxxx@too.co.jp
Subject: =?utf-7?B?K1hER0FkekJYTUg0d1Z6QmZNQUkt?=
Date: Tue, 10 Apr 2001 22:30:39 +0900
MIME-Version: 1.0
Content-Type: multipart/alternative;
boundary="----=_NextPart_000_000B_01C0C20D.DEF90900"
X-Priority: 3
X-MSMail-Priority: Normal
X-Mailer: Microsoft Outlook Express 5.50.4133.2400
X-MimeOLE: Produced By Microsoft MimeOLE V5.50.4133.2400
X-UIDL: 71fe267002f7daefa8237ac2c5f1322d

This is a multi-part message in MIME format.

------=_NextPart_000_000B_01C0C20D.DEF90900
Content-Type: text/plain;charset="utf-7"
Content-Transfer-Encoding: 7bit

+MFMwjDBvMAEwxjC5MMgwZzBZMAI-

------=_NextPart_000_000B_01C0C20D.DEF90900
Content-Type: text/html;charset="utf-7"
Content-Transfer-Encoding: quoted-printable


+MFMwjDBvMAEwxjC5MMgwZzBZMAI-

------=_NextPart_000_000B_01C0C20D.DEF90900--






---かかし

[ ]
RE:00673 X-Body-Content-Type:text/plain;charset="utf-7"を認識しNo.00677
かかし さん 01/04/11 15:09
 
かかしです、こんにちは。

ひろさん、こんにちは。

> 問題の UTF-7 については、現状で鶴亀が対応している言語は、日本語と
>英語、charaset でいうと、iso-2022-jp, us-ascii ぐらい (ひょっとした
>ら、sjis, x_jis, euc-jp 等も OK かもしれませんが未確認) だと思います。

あれ?そうだったんですか。
utf-7は対応していなかったんですね。
失礼しました。
でも、せっかく、秀丸でデコードできるのに鶴亀でサポートしないのは、ちょっと
惜しい気がします。

#別メールで、症状が出るメールを添付しましたが、Subjectは、utf-7でも
#ちゃんとデコードできました。

---かかし

[ ]
RE:00673 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00682
秀まるお2 さん 01/04/11 15:28
 
 鶴亀メールはutf-7にも対応しているはずです。少なくとも今ソースコードを確認
した限りはUTF-7をShiftJISに変換する処理が入っています。

 うまくいかない原因についてはバグの可能性が高いです。少々お待ちを。

[ ]
RE:00682 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00693
かかし さん 01/04/11 18:57
 
かかしです、こんにちは。

秀まるおさん、こんにちは。

> 鶴亀メールはutf-7にも対応しているはずです。少なくとも今ソースコードを確認
>した限りはUTF-7をShiftJISに変換する処理が入っています。
>
> うまくいかない原因についてはバグの可能性が高いです。少々お待ちを。

よろしくお願いいたします。

---かかし

[ ]
RE:00682 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00698
ひろ さん 01/04/11 19:43
 
 秀まるおさん、かかしさん今日は、ひろです。
>  鶴亀メールはutf-7にも対応しているはずです。少なくとも今ソースコードを確認
> した限りはUTF-7をShiftJISに変換する処理が入っています。
 「turukame.2:03102| RE 03101 めざせグループA」で秀まるおさんが、
>  UTF-7/UTF-8と日本語エンコードには対応してますが、他のエンコードに対
> 応してないって問題があるけど、
とおっしゃっているのは気付いたのですが、「デコード」に対応していたの
ですね。失礼しました。
 というわけで、先の投稿は完全に虚報ですm(_|_)m。->ALL

 ただエンコード可能なら、ヘッダは
Content-Type: text/plain; charset=utf-7
と記載しなければならないけれど、そういった設定はなかったような気がす
るのですが、何か記載されている文字によって、自動認識するのでしょうか?
それとも、「turukame.2:03102」文章は「エンコード」と「デコード」の記
載ミスでしょうか?

[ ]
RE:00698 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00715
秀まるお2 さん 01/04/12 08:55
 
> それとも、「turukame.2:03102」文章は「エンコード」と「デコード」の記
> 載ミスでしょうか?

 デコードの間違いのようです。失礼しました。

 でもって、このUTF-7の本文が変換されないバグは今直った所です。

[ ]
RE:00715 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00724
かかし さん 01/04/12 10:17
 
かかしです、こんにちは。

> でもって、このUTF-7の本文が変換されないバグは今直った所です。

おおー(歓声)、ありがとうございました。

---かかし

[ ]
RE:00715 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00730
ひろ さん 01/04/12 12:08
 
 秀まるおさん今日は、ひろです。
> > それとも、「turukame.2:03102」文章は「エンコード」と「デコード」の記
> > 載ミスでしょうか?
>
>  デコードの間違いのようです。
 これでスッキリしました。

>  でもって、このUTF-7の本文が変換されないバグは今直った所です。
 修正有り難うございます。

[ ]
RE:00715 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00742
かかし さん 01/04/12 14:08
 
かかしです、こんにちは。

>> それとも、「turukame.2:03102」文章は「エンコード」と「デコード」の記
>> 載ミスでしょうか?
>
> デコードの間違いのようです。失礼しました。
>
> でもって、このUTF-7の本文が変換されないバグは今直った所です。

確認しました、ありがとうございます。

---かかし

[ ]
RE:00667 X-Body-Content-Type:text/plain;charset="utf-7"を認識しNo.00812
Firak さん 01/04/12 22:37
 
>なんとです。
>
>> X-Body-Content-Type: text/plain;charset="utf-7"
>
 すこしタイミングがずれましたが、本日、僕も似たような事例で文字化
けがおきました。

 Al-mail側で文字化けしたファイルをファイルに吐き出して、中を見
るとこんな状態です

From: xxxxx@tg7.so-net.ne.jp
To: <xxx@ml.asahi-net.or.jp>
Subject: =?utf-8?B?Rnc6ICDlrozlhajjgarjgovnlLfmgKfjg7vlrozlhajjgarjgovlpbPmg
Kc=?=
Date: Thu, 12 Apr 2001 18:30:26 +0900
MIME-Version: 1.0
Content-Type: multipart/alternative;
boundary="----=_NextPart_000_0014_01C0C37E.A5247760"
X-Priority: 3
X-MSMail-Priority: Normal
X-Mailer: Microsoft Outlook Express 5.50.4133.2400
X-MimeOLE: Produced By Microsoft MimeOLE V5.50.4133.2400

This is a multi-part message in MIME format.

------=_NextPart_000_0014_01C0C37E.A5247760
Content-Type: text/plain;
charset="utf-8"
Content-Transfer-Encoding: 8bit


縲 罐鬼k 葛ソ・燿蒭活璽竇瓮≦燿紂・礇球礇ュ礇桁c 紜医礇у礇桁祺紜皸紕諷燿虍豪爛≦`
∝・ウ諤ァ縺昴l縺槭l縺ョ縲√Μ繝吶Ξ繝シ
繧キ繝ァ繝ウ・郁ァ」謾セ縺ョ縺溘a縺ョ・峨・繧ー繝ォ繝シ繝励r陦後>縺セ縺吶aE


Subject: =?utf-8?B?Rnc6ICDlrozlhajjgarjgovnlLfmgKfjg7vlrozlhajjgarjgovlpbPmg
Kc=?=

 となっていて、サブジェクトはutf-8であることが明示されていますが
Content-Typeは、以下のようにマルチパートであることを示していま
す。

Content-Type: multipart/alternative;

 で、具体的なキャラクタータイプの指定は、各パートの先頭に
以下のように明示されています。

Content-Type: text/plain;
charset="utf-8"

 もし各パートでちゃんとデコードしてくれると、ちゃんと読めるはずなんですが、
Al-mailはutf-8に対応していないようなのでダメ、しかし鶴亀にインポート
すると

Subject:  完全なる男性・完全なる女性

 という具合にサブジェクトは、正常に読めます、しかし本文は文字化けしたままで
す。

 困ったことに鶴亀のヘッダ情報を全て表示させてみると、

------=_NextPart_000_0014_01C0C37E.A5247760
Content-Type: text/plain;
charset="utf-8"
Content-Transfer-Encoding: 8bit

 の部分は消えてなくなっています、ついでのこの後、HTMLのパート
が続いているのも消えてなくなっていました。

 サブジェクトが正常に表示されるので、次のバージョンでは対応し
てもらえるのかなと期待しています。

 でも、こんな変なメールを作るのは Outlookだけでしょうけどね
困ったことに一番普及している、しかも使っている人はこんな変な
状態でメールを送っている自覚が全く無いし、送信時のコードを固定
する方法もない、困ったもんです。

 Outlookにドロップしてみたら表示できました。

 ふぃらく 

[ ]
RE:00812 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00821
秀まるお2 さん 01/04/13 09:15
 
 鶴亀メールはUTF-8にも対応しています。今、Outlook ExpressでUTF-8文字コード
のHTMLメールを作って試してみましたが、正しく認識しました。

 Firakさんの所でダメだったのは、AL-Mailで受信したデータを鶴亀でインポートし
たからだと思います。utf-8は8bit文字コードのコード系なので、エクスポート/イン
ポートのどこかの段階で文字化けしたんだと思います。

>  でも、こんな変なメールを作るのは Outlookだけでしょうけどね

 UTF-7とUTF-8自体は特に変な文字コードという訳ではなくて、対応して当然の文字
コードだと思います。AL-Mailが対応してないなら是非対応をお願いしたらいいと思
います。

[ ]
RE:00821 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00833
Firak さん 01/04/13 11:05
 
>
> Firakさんの所でダメだったのは、AL-Mailで受信したデータを鶴亀でインポートし
>たからだと思います。utf-8は8bit文字コードのコード系なので、エクスポート/イン
>ポートのどこかの段階で文字化けしたんだと思います。
>
 OutLookでインポートしたら見れたのですから、文字化けはしていない
と思いますよ。
 それよりマルチパートの処理の方が気になってますけど、二つ目に
HTMLのファイルがついていたのも消えていますから、やっぱりな
んか変です。

念のため、ヘッダ情報は、

Content-Type: multipart/alternative;
boundary="----=_NextPart_000_0014_01C0C37E.A5247760"

となっていて文字コードの定義はなし

各パートの頭は、

------=_NextPart_000_0014_01C0C37E.A5247760
Content-Type: text/plain;
charset="utf-8"
Content-Transfer-Encoding: 8bit

 となっていて、utf-8 が定義されています、取り込むとこの情報
が消えてしまうのも気になっています。
 Content-Transfer-Encoding: 8bit ととなっているのも気持ちが
わるいですね。 
 それに、パートは2ついていて、二つ目はHTMLになっているん
ですが、これは丸ごときえてしまっています。

 再現したいのですが、Outlookは、どんなタイミングでこ
んなマルチパートを生成するのかわからないからテストもできない
のです困ったもんです。

 もし、必要ならメールでエクスポートしたファイルを送ります。

ふぃらく

 

[ ]
RE:00833 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00840
秀まるお2 さん 01/04/13 12:09
 
 秀ネット上ではタブ文字が通らないのでなんですが、ヘッダ部分は特におかしいこ
とは無くて、僕が先ほどテストしたメールも同じような感じでした。

 (charset=の前にたぶんタブ文字が入っているんでしょうけど、秀ネット上ではそ
のタブ文字が消えてしまいます)

 あと、UTF-7も含めて、マルチパートでしかもUTF-8に対応している(バグ修正して
いる)のはV1.03からなので、V1.02では相変わらずダメです。

 V1.05なら大丈夫なはずですけど、ダメでしたらすみませんがメールでその内容く
ださい。

 僕のメールアドレスは、 maruo@mitene.or.jp です。

[ ]
RE:00840 X-Body-Content-Type:text/plain;charset="utf-7"を認No.00860
Firak さん 01/04/13 15:32
 
>
> V1.05なら大丈夫なはずですけど、ダメでしたらすみませんがメールでその内容く
>ださい。
>
 大丈夫でした。おつかれさま。

 ふぃらく

[ ]