メールのインポート時すべて文字コードutfNo.30629
kiwikazuya さん 07/03/14 23:43
 
中国在住のkiwikazuyaです。
秀丸エディタでChangLogマクロを使って、
日々の行動を記録しています。
それらを秀丸メール形式に加工して、
一括で秀丸メールにインポートしたいのですが、
このメモ(記録)はひとつのテキストファイルで、
日本語もあり、中国語もありで、utf8でインポートしたく、
Content-Type: text/plain; charset=utf-8
X-TuruKame-CharSet: utf-8
というヘッダを追加してインポートさせたところ、
日本語のメールは、sift-jisあるいは、utf8でインポートされます。
utf8の場合は、表示では文字化けをしていて、
文字コードをutf8にし直すと、正常表示されます。
中国語のメールの場合は、ほとんど文字化けのままで、
文字コードを変更してもだめです。

そこで、インポートさせる時のオプションとして、
すべてutf8でインポートさせるみたいなものは追加して
いただけないでしょうか?

行動をすべて秀丸メールから新規作成で記録すると、
ちょっと時間がかかってしまうことから、
秀丸エディタをつかっています。

ChangLog形式なので、HTMLにしてしまえばいいのですが、
あとから検索とか修正したい場合、できないこと、
秀丸メールのスレッド表示や検索の速さから、
やっぱり、秀丸メールが一番です。

お手数ですが、ご検討をよろしくお願いいたします。

[ ]
RE:30629 メールのインポート時すべて文字No.30640
秀まるお2 さん 07/03/15 16:57
 
 おっしゃってることがちょっとおおざっぱすぎて、具体的に何を要望されてい
るのかよく分かりません。というか、しいて分かったつもりだとしても、具体的
にkiwikazuyaさんが持っておられるデータがうまくインポート出来るようになる
かどうかは、その具体的なデータをもらってテストでもしないと分かりません。

 そもそもなんとなくやろうとしてることに無理があるような気もします。メー
ル用のファイルのContent-Type:ヘッダを無理矢理utf-8に書き換えて、それで
メールがutf-8としてインポート出来るという、そんな単純な話にはならないよ
うな気がしますけど。

 今の段階ではちょっとその程度のお返事しか出来ません。

[ ]
RE:30640 メールのインポート時すべて文字No.30646
kiwikazuya さん 07/03/15 19:07
 
>ル用のファイルのContent-Type:ヘッダを無理矢理utf-8に書き換えて、それで
>メールがutf-8としてインポート出来るという、そんな単純な話にはならないよ
>うな気がしますけど。

いつもすみません。単純に考えていました。
ちなみに文字コードに関するヘッダを追加せず、
本文に中国語と日本語を交ぜておくと、Subjectの言語に関係なく
すべてutf-8としてインポートできます。
わたしの使い方が本来のメールソフトから離れてしまっている
ようで、お恥ずかしい限りです。


[ ]
RE:30646 メールのインポート時すべて文字No.30649
アルビレオ さん 07/03/15 19:39
 
ユーザーのアルビレオです。

>ちなみに文字コードに関するヘッダを追加せず、
>本文に中国語と日本語を交ぜておくと、Subjectの言語に関係なく
>すべてutf-8としてインポートできます。
>わたしの使い方が本来のメールソフトから離れてしまっている
>ようで、お恥ずかしい限りです。

インポート時にutf-8に変換するより、インポートする元テキストをuft-8にして
おく方が簡単ではないでしょうか。
>秀丸エディタでChangLogマクロを使って、
>日々の行動を記録しています。
とのことなので、このマクロでファイルを保存するときに必ずutf-8で保存する
ように改造するのは比較的簡単だと思います。

[ ]
RE:30649 メールのインポート時すべて文字No.30650
kiwikazuya さん 07/03/15 20:44
 
>インポート時にutf-8に変換するより、インポートする元テキストをuft-8
>にしておく方が簡単ではないでしょうか。

はい、すでにそうしているのですが、インポートすると、
自動的に文字コードが判断されるみたいで、
utf-8でインポートできないのです。


[ ]
RE:30650 メールのインポート時すべて文字No.30652
秀まるお2 さん 07/03/15 21:33
 
 秀丸メール側で、utf-8文字コードとしてエクスポートした物がうまくイン
ポート出来ない、というのは理解出来るというか、そういう動作になってしまう
ような気はします。つまり、インポートの処理の中にはインポート元のファイル
がutf-8とかutf-16とかで保存されてることを想定してないような気がします。
あくまで「エンコードされた7bit-asciiのメール」でないとうまくインポート出
来ないと思います。

 その辺検証するにもテストが面倒でして…。今ちょっとアドレス帳のユニコー
ド対応とかいろいろやることがあるので、また暇な時にその辺テストして、対応
すべき所は対応したいと思います。

[ ]
RE:30652 メールのインポート時すべて文字No.30677
秀まるお2 さん 07/03/16 15:33
 
 ってことでテストしてみたら、つまり、メール本文はうまくインポート出来る
けどもヘッダの中が化けてしまうようでして…。

 Outlook Expressで似たようなテストをしたら化けません。

 ソースコードを調べてみたら、たしかにバグがありました。

 ということで次のV4.74β16にて修正させていただきます。

 あと、そもそもutf-8でエクスポートする時の動作として、Content-Type:ヘッ
ダは無理矢理utf-8って書き換えてエクスポートするようにしようと思います。

[ ]
RE:30677 メールのインポート時すべて文字No.30684
kiwikazuya さん 07/03/16 17:50
 
お忙しい中、ご対応をいつもありがとうございます。
楽しみにしております。
これで作業効率が一段とあがります。


[ ]