[要望]マクロでユニコード、メールエディNo.30441
kiwikazuya さん 07/02/27 09:19
 
中国在住のkiwikazuyaです。
仕事上メールでは日本語、中国語、英語を扱っています。
秀丸メールでは、多言語でメールの処理ができるので、
大変重宝しています。ただし以下の点で要望があります。

1、マクロでユニコード
 マクロでSubjectを取り出したり、添付ファイル名を
 取り出したりする際、中国語は文字化けします。
 これをなんとか文字化けしないようにできないでしょうか?
 現在は、マクロでなく手動であれば文字化けしませんよね。

2、メールエディタでの文字コード変換
 a)返信元、転送元の文字コードが自動的に設定されて、
 元メールが中国語でもきちんと表示されますが、
 標準テンプレートからの文字列は文字化けします。
 なんとか文字化けしないようにできないでしょうか?
 b)返信元、転送元のテンプレートをUnicodeに設定すると、
 元メールが中国語だと文字化けします。これも文字化け
 しないようにできないでしょうか?
 c)メールエディタで日本語で書いていたメールに、
 どうしても中国語をいれたいとき、文字コードをUnicodeに
 変えますが、日本語も文字化けします。これを秀丸エディタ
 では文字コードを変えたときにテキストを維持できるので、
 そのようにはできないでしょうか?

よろしくお願いいたします。

[ ]
RE:30441 [要望]マクロでユニコード、メーNo.30443
kiwikazuya さん 07/02/27 09:28
 
もうひとつ、これは教えていただきたいことなのですが、
添付ファイルのファイル名が中国語だと
メール一覧では、添付ファイル名が中国語で表示されていますが、
ヘッダでは、gbからはじまる意味不明な英字になっています。
これは、仕様で仕方ないのかもしれませんが、
そのヘッダのX-Attachの意味不明な文字列をマクロで
元の中国語に戻せないでしょうか。
たとえば、クリップボード経由や、メールエディタの
本文に表示できたらうれしいです。

[ ]
RE:30443 [要望]マクロでユニコード、メーNo.30446
秀まるお2 さん 07/02/27 11:57
 
 マクロで外国語メールを扱うのは難しいです。

 添付ファイル・ファイル名の、「$gb_{....}」みたいな文字列をデコードした
文字列を返すような関数を用意することは出来ますけど、返ってくる文字列は中
国語文字コードそのままなので、例えばそれをmessage文に渡しても、メッセー
ジとして出てくる文字列は化けた形になってしまいます。

 ちゃんとマクロで扱えるようにするためには、たぶんですが、

 1.メールの文字コードを取得する関数。
 2.文字コードの変換をする関数。例えば中国語gb2312文字コードを
    秀丸メール内部用のユニコード文字列に変換する関数。

 が最低限必要で、それをユーザーさんがうまく使いこなしてもらわないといけ
ないです。

 いろいろ要望されてもいっぺんに対応するのは無理なので、とりあえず今一番
やりたいことを1つだけ、具体的に教えて欲しいです。

 そういう処理をマクロでやるとして必要な関数が何かとか、そういう方向で対
応するのならなんとか出来るかと思います。それか、テンプレートの多国語対応
を先にやって欲しいということなら、そっちの方を先に考えますけど。


[ ]
RE:30446 [要望]マクロでユニコード、メーNo.30448
kiwikazuya さん 07/02/27 12:25
 
>テンプレートの多国語対応を先にやって欲しいということなら、
>そっちの方を先に考えますけど。
お願いします。

今一番ほしい機能としては、
メールエディタで秀丸メールの「エンコード切り替え」で
「内容を維持したまま適用」ができるようになってほしいです。

マクロでの多言語対応は、先でもいいのですが、例として、
$gb_200612{BCC6BBAE}という文字列は中国語コードで{}内の
英文字が4つずつ一組だと思いますが、このコードと中国語の
対応表がありましたら、教えてほしいです。
自分で検索しながらもとの中国語にしたいと思います。

よろしくお願いいたします。

[ ]
RE:30448 [要望]マクロでユニコード、メーNo.30450
秀まるお2 さん 07/02/27 12:47
 
> メールエディタで秀丸メールの「エンコード切り替え」で
> 「内容を維持したまま適用」ができるようになってほしいです。

 これの意味が実はよく分かりませんでした。例えば「新規メール」とした所で
適当な日本語を入力して、「設定・文字コード・多国語混在ユニコード」を実行
した場合には、入力してた日本語は化けずにそのままユニコードになるはずだと
思います。

 日本語を入力してから「設定・文字コード・簡体字中国語(GB2312)」を入力し
た場合でも、その後に出てくる問い合わせメッセージで

 「テキストの内容を維持したまま変換する」

 を選択してOKしてやれば、それなりにうまく文字コード変換してくれて、例え
ばひらがななんかはそのまま化けずに中国語文字コードでのひらがなに変換され
てくれるはずだと思いますけど…。

 何かうまくいかないケースがあるとしたら、それの具体的な操作例を教えて欲
しいです。

> マクロでの多言語対応は、先でもいいのですが、例として、
> $gb_200612{BCC6BBAE}という文字列は中国語コードで{}内の
> 英文字が4つずつ一組だと思いますが、このコードと中国語の
> 対応表がありましたら、教えてほしいです。

 {...}の中は単純に16進数で文字コードを表しているだけです。

 {BCC6BBAE}なら、0xBCC6 0xBBAE ってことで、GB2312文字コードだと、

 0xBCC6は「汁」に似た字、
 0xBBAEは、左側が「犬」とちょっと似てて左側が「リ」になってる字みたいで
すけど。

[ ]
RE:30450 [要望]マクロでユニコード、メーNo.30451
kiwikazuya さん 07/02/27 16:00
 
> 何かうまくいかないケースがあるとしたら、それの具体的な操作例を教
>えて欲しいです。
すみませんでした。テンプレートからのものでした。
自分で作成したテンプレート
$(AddHeader,"X-TuruKame-CharSet","utf-8")$-
$(SetHeader,"Content-Type","text/plain; charset=utf-8")$-
$(SetHeader,Subject,$(RootHeader,Subject)+"[wk]")$-
$c$(QuotedRootBody)
で中国語コードのメールに返信すると
文字化けしてしまうということでした。
なので、テンプレートでの多言語対応をお願いしたいのですが、
大丈夫でしょうか?
よろしくお願いいたします。

> 0xBCC6は「汁」に似た字、
> 0xBBAEは、左側が「犬」とちょっと似てて左側が「リ」になってる字み
それはおかしいですね。上は「報」の中国漢字、
下は「表」の中国漢字です。

[ ]
RE:30451 [要望]マクロでユニコード、メーNo.30456
秀まるお2 さん 07/02/27 17:59
 
 テンプレート命令でContent-Type:ヘッダを書き換える場合について、文字列
の文字コード変換が働かないようです。これはこれで直そうと思います。

 あと、返信元メールと返信メールとで文字コードが違っていると、RootHeader
とかRootBodyとかのテンプレート命令も全滅のようです。何も変換されないので
全部化けます。それも直そうと思います。

 (かなり面倒なのでちょっと時間がかかりそうですが)

 それと、添付ファイル・ファイル名の{...}部分ですが、ソースコードを見た
限りでは、単純に16進数で文字コードを表現してるだけだと思います。

 $gb_{...} なら、コードページ936での文字コード、$u8_{...}ならutf-8文字
コードでってことになります。

 文字コード表とか、秀丸エディタの中で文字コード表示するとかいろいろやっ
てみ欲しいです。今ちょっと僕の方で中国語ファイル名を使って自分から自分に
メールを送るテストをした限りはうまくいっているようですけど。

[ ]
RE:30456 [要望]マクロでユニコード、メーNo.30457
kiwikazuya さん 07/02/27 18:47
 
> (かなり面倒なのでちょっと時間がかかりそうですが)
お待ちしておりますので、よろしくお願いいたします。

> 文字コード表とか、秀丸エディタの中で文字コード表示するとかいろい
>ろやってみ欲しいです。
どうやらもとのファイル名が文字化けしていたようです。
というか原因はわかりませんが、例に提示したものはだめですが、
他のものは大丈夫でした。

ありがとうございました。

[ ]
RE:30456 [要望]マクロでユニコード、メーNo.30463
kiwikazuya さん 07/02/27 23:01
 
申し訳ないのですが、コードページ936のBCC6のようなコードと
その対応文字の表はどこで入手できますでしょうか?
秀丸エディタで文字から文字コードはわかりますが、
その逆はできないので、結局$gb_{...}のなかのコードからは、
自分で対応文字をさがすことができませんでした。

よろしくおねがいいたします。

[ ]
RE:30463 [要望]マクロでユニコード、メーNo.30464
EA11R さん 07/02/27 23:20
 

EA11R@一般ユーザです。

>申し訳ないのですが、コードページ936のBCC6のようなコードと
>その対応文字の表はどこで入手できますでしょうか?
>秀丸エディタで文字から文字コードはわかりますが、
>その逆はできないので、結局$gb_{...}のなかのコードからは、
>自分で対応文字をさがすことができませんでした。
>
>よろしくおねがいいたします。

Googleで検索するのが、一番早いと思いますが…。

「中国語 文字コード コード表」の日本語の検索結果
http://www.google.co.jp/search?sourceid=navclient-ff&ie=UTF-8&rls=GGGL,GGGL:2006-33,GGGL:ja&q=%E4%B8%AD%E5%9B%BD%E8%AA%9E+%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89+%E3%82%B3%E3%83%BC%E3%83%89%E8%A1%A8

で、下のサイトでは、お望みのものかは不明ですが、コードと文字の対応表
もあります。
http://ash.jp/code/code_zh.htm

繁体字中国語(Traditional Chinese) charset=big5
簡体字中国語(Simplified Chinese)  charset=GB2312
をはじめ、IANAに登録されているmのだけが対象のようですが…。


[ ]
RE:30464 [要望]マクロでユニコード、メーNo.30465
秀まるお2 さん 07/02/28 08:47
 
 僕は単純に、Windows付属の文字コード表を使いました。

 charmap.exeってソフトです。文字セットを「Windows: 簡体字中国語」にして
フォントも中国語フォントにしてやればいいです。文字コードはステータスバー
部分に表示されて、文字コード小さい順なので、後はだいたいこの辺かって感じ
で探してやればいいと思います。

[ ]
RE:30465 [要望]マクロでユニコード、メーNo.30466
kiwikazuya さん 07/02/28 09:04
 
ありがとうございます。
このへんで「えいやー」的な探し方は
思いつきませんでした。


[ ]