gb2312文字コードのメールが勝手にUTF-8にNo.26179
kiwikazuya さん 06/02/03 16:25
 
中国からのKIWIです。お世話になります。
最近ですが、gb2312文字コードのメールが秀丸メールの
方で勝手にutf-8文字コードに書き換えられてしまい
困ってます。
なぜ困るかというと、このように文字コードが指定されている
にもかかわらず勝手にutf-8に書き換えられてしまった
メールの表示にものすごく時間がかかり、一瞬、
PCが応答しなくなってしまったのかと思うからです。

文字コードが指定されている場合、
勝手に文字コードを変えないようにできないでしょうか?

よろしくお願いいたします。

[ ]
RE:26179 gb2312文字コードのメールが勝手No.26215
秀まるお2 さん 06/02/05 17:25
 
 gb2312文字コード指定のはずのメールが秀丸メール上でutf-8になってしまう
のは、たぶん、メールの中に、gb2312とは別の文字コードで書かれた部分がある
からだと思います。例えば、From:ヘッダとかの中に、

 =?iso-2022-jp?b?....?=

 みたいなのが入っているとか。

 「関連するメールを開く・このメールのログ」とやって受信ログを見ていただ
ければはっきりすると思います。

 しいて、そういう部分だけ化けてもいいってことなら、本来のgb2312での表示
するようなオプションを追加するとかって作戦もありかもしれません。

[ ]
RE:26215 gb2312文字コードのメールが勝手No.26225
kiwikazuya さん 06/02/05 23:18
 
お世話になります。
問題のメールの受信ログをお送りしますので、
ご検証をお願いできるでしょうか?

20060108.emlが問題で、開くときにものすごく時間がかかるものです。
同じメルマガからのメールですが、20050723.emlの方は、
問題なくgb2312コードで開きます。

以前、同じではないですが、
 No.24218 「charsetがgb2312に指定してあるのにutf-8になってしまう。」
 の投稿の時には、修正していただいたおかげで、
 現在では問題なく受信して、閲覧できます。
 ありがとうございました。
 
 お忙しいところすみませんが、よろしくお願いいたします。

> しいて、そういう部分だけ化けてもいいってことなら、本来のgb2312での表示
>するようなオプションを追加するとかって作戦もありかもしれません。

文字化けはさけたいです。

[ ]
RE:26225 gb2312文字コードのメールが勝手No.26231
秀まるお2 さん 06/02/06 09:50
 
 調べてみたら、htmlメールの中に「™」の文字があるために、utf-8へ変
換しているようです。

 ™ の文字というのは、「TM」みたいな文字でして、この文字を、
gb2312に変換しようとするとエラーになるようです。

 ということでなんですが、しいてこういう少数の文字だけ化けてもかまわない
ってことならば、例えば、「全般的な設定・上級者向け・デコード」の「HTML
メールのテキスト形式への変換」の中に、

   &#xxxx;で指定された文字が多少化けても無視する

 みたいなオプションを追加してもいいですけど。例えばそういう化ける文字が
少数ならば、utf-8化せずにそのまま本来の文字コードで表示するとか。

 あと、メールの表示が非常に遅い理由も調べてみます。

[ ]
RE:26231 gb2312文字コードのメールが勝手No.26233
kiwikazuya さん 06/02/06 10:22
 
調査していただいて、ありがとうございます。

>ってことならば、例えば、「全般的な設定・上級者向け・デコード」の「HTML
>メールのテキスト形式への変換」の中に、
>
>   &#xxxx;で指定された文字が多少化けても無視する
>
> みたいなオプションを追加してもいいですけど。例えばそういう化ける文字が少
>数ならば、utf-8化せずにそのまま本来の文字コードで表示するとか。

これでOK牧場です。その後、自分でその文字を削除するか、
別の文字に置換すればいいですよね。
非常に助かります。
それか、&#xxxx;で指定された文字に対応する文字を自分で
指定できるようにするとかできたら最高です。

> あと、メールの表示が非常に遅い理由も調べてみます。
そうなんです。本当に遅いんです。
これが遅くないのであれば、utf-8化していてもいいんですけど。。。

よろしくお願いいたします。

[ ]
RE:26233 gb2312文字コードのメールが勝手No.26234
秀まるお2 さん 06/02/06 11:01
 
 遅い原因を調べてみたら、どうも、プロポーショナルフォントでの折り返し位
置の計算にとんでもなく時間がかかっていることが分かりました。折り返し位置
を計算させるために、特定のWindows API(GetTabbedTextExtent関数)を何回も
呼び出すんですが、これがなぜか中国語の時に極端に遅いみたいです。

 秀丸担当によると、プロポーショナルフォントの時の折り返し桁数計算の高速
化を以前トライしたことがあるけども、GetTabbedTextExtentを使わずにうまく
やろうとした所、別の問題が発生し、とりあえず保留になったようです。

 ということで今すぐ直すことは出来なさそうです。

 とりあえず、HTMLメールをテキスト変換する時に&#xxx;の変換ミスについての
オプションを追加するので、それで回避お願いします。

 次のβ版まで少々お待ち下さい。

 (β版の案内は、 http://www.maruo.co.jp/turukame/ の方に掲載します)

[ ]
RE:26234 gb2312文字コードのメールが勝手No.26236
kiwikazuya さん 06/02/06 12:19
 
> 遅い原因を調べてみたら、どうも、プロポーショナルフォントでの折り返し位
>置の計算にとんでもなく時間がかかっていることが分かりました。折り返し位置
>を計算させるために、特定のWindows API(GetTabbedTextExtent関数)を何回も
>呼び出すんですが、これがなぜか中国語の時に極端に遅いみたいです。
>
> 秀丸担当によると、プロポーショナルフォントの時の折り返し桁数計算の高速
>化を以前トライしたことがあるけども、GetTabbedTextExtentを使わずにうまく
>やろうとした所、別の問題が発生し、とりあえず保留になったようです。
>
> ということで今すぐ直すことは出来なさそうです。
プロポーショナルフォントを使わなければいいのですか?
今後に期待します。

> とりあえず、HTMLメールをテキスト変換する時に&#xxx;の変換ミスについての
>オプションを追加するので、それで回避お願いします。
>
> 次のβ版まで少々お待ち下さい。
ご対応ありがとうございます。
待ってま〜す!

[ ]
RE:26236 gb2312文字コードのメールが勝手No.26241
秀まるお2 さん 06/02/06 13:59
 
 「全般的な設定・上級者向け・多国語対応」の所でUnicode用のフォントを、
例えばMSゴシックとかにすれば高速になると思いますが、この場合、中国語がう
まく表示されないかもしれません。

 あと、プロポーショナルフォントでの折り返し桁数の計算処理を、僕の方で多
少改良しまして、結果、問題のメールでの表示が倍くらい速くはなりました。
(それでもまだ、メールを選択してから表示まで1秒くらいかかりますが)

 ということで次のバージョンにご期待(?)ください。

[ ]
RE:26241 gb2312文字コードのメールが勝手No.26254
kiwikazuya さん 06/02/06 16:04
 
> 「全般的な設定・上級者向け・多国語対応」の所でUnicode用のフォントを、
>例えばMSゴシックとかにすれば高速になると思いますが、この場合、中国語がう
>まく表示されないかもしれません。
>
> あと、プロポーショナルフォントでの折り返し桁数の計算処理を、僕の方で多
>少改良しまして、結果、問題のメールでの表示が倍くらい速くはなりました。
>(それでもまだ、メールを選択してから表示まで1秒くらいかかりますが)
>
> ということで次のバージョンにご期待(?)ください。

重ね重ねありがとうございます。
次のバージョンへの期待ですが、本格的にUnicodeに対応して
いただけませんか?添付ファイル名を外国語たとえば中国語でも
そのまま扱えたりできるとうれしいです。
Win95等と別物でお願いします。


[ ]
RE:26254 gb2312文字コードのメールが勝手No.26259
秀まるお2 さん 06/02/06 16:48
 
 添付ファイル・ファイル名についてだけならなんとか対応したいと思っていま
すが、Windows95/98/Meをサポート対象外とした別バージョンを提供するという
のは無理があります。(今現在でさえ、音声化バージョンで2種類出してるし)

 とにかくいろいろ要望の嵐で頭がこんがらがる毎日なので、気長にお待ちくだ
さい。

[ ]