中国語BGコードの認識No.06951
山紫水明 さん 00/11/30 23:10
 
  秀丸担当さん,識者のみなさん,こんにちは。

 中国の人民日報(http://www.peopledaily.com.cn/)の記事をコピーして,秀丸
の画面に張り付けます。そのままでは読めませんので,フォントを MS Song にし
ます。そうすると秀丸 Ver3.05 では中国語の簡体字(つまり人民日報で使われて
いる文字)が表示でき,編集もできました。
 ところが Ver.3.06β3 ではこれができなくて,意味不明の文字になってしまい
ます。Ver.3.05 に戻す以外に何か対策はありませんか。
 なお,MS Song は MicroSoft の Update で入手できます。

                山紫水明

[ ]
RE:06951 中国語BGコードの認識No.06954
ENCODINGSHIFTJIS さん 00/12/01 10:56
 
> ところが Ver.3.06β3 ではこれができなくて,意味不明の文字になってしまい
こんにちは、
ファイル保存、読み出しの ところの 文字コード指定を UNICODE/UTF-8 などで
固定化すると、できそうな気がします、まだスムースな手順を発見できないが。

新規面を開いて、そこにペーストするとMSxxフォントで表示される
次に、ファイルタイプ別設定>表示を MS song に保存しないで更新で OK表示

ここからの保存の文字コードの扱いが鍵でしょう。
自動とかSJISにすると unicode→JIS系 変換の警告ダイアログが出て 失敗する
UTF-8 で保存 し、ファイルを開く ではなく{カーソル位置への読み込みUTF-8 }
にすると できた、成功する組み合わせは 他にもあるかもしれないが。とりあえず


[ ]
RE:06951 中国語BGコードの認識No.06957
ひろ さん 00/12/01 11:53
 
 山紫水明さん今日は、ひろです。
>  中国の人民日報(http://www.peopledaily.com.cn/)の記事をコピーして,秀丸
> の画面に張り付けます。そのままでは読めませんので,フォントを MS Song にし
 確かに再現します。どうやらこれは clipboard の貼り付け関係を変更し
たためのようです。もし code を UTF-7, UTF-8, unicode にしておけば、8
割りぐらいは問題なく貼り付けで来ます。ただ一旦 HTML file を保存して
から閲覧すれば、確実です。

[ ]
RE:06954 中国語GBコードの認識No.06958
ENCODINGSHIFTJIS さん 00/12/01 11:57
 
>> ところが Ver.3.06β3 ではこれができなくて,意味不明の文字になってしまい
>こんにちは、2
推定の動作は
HTTPサーバーは BGコードで送出→IEは内部でunicode動作で表示
unicodeをクリップボードに置く
秀丸は貼り付ける面の設定している文字コードに変換して表示
新規面はunicodeをそのまま受け付ける、unicodeの面もunicodeクリップボードの
データをそのまま受ける。 UTF-8,unicode で保存/読み出しするとOK
「メモ帳はSJIS化するので化ける」
のように見える。  content='text/html;charset=GB2312'>
はIE内部でunicode変換されてしまうのでは?

[ ]
RE:06951 中国語BGコードの認識No.06966
秀丸担当 さん 00/12/01 18:54
 
> 中国の人民日報(http://www.peopledaily.com.cn/)の記事をコピーして,秀丸
>の画面に張り付けます。そのままでは読めませんので,フォントを MS Song にし

いろいろダウンロードして試してみました。
V3.05では貼り付けると中国語だけが ? になりました。
V3.06Beta3では、その他→ファイルタイプ別の設定→その他 で、
Unicodeを有効にしているときは表示できました。

V3.05で表示できてしまうのはなぜ?

Win98SE+IE5.0です。

[ ]
RE:06966 中国語BGコードの認識No.06969
山紫水明 さん 00/12/01 21:46
 
 ENCODINGSHIFTJISさん,ひろさん,秀丸担当さん こんばんは。
 いろいろ教えていただいてありがとうございます。

 こちらの環境書くのを忘れていました。
 Windows98 + Netscape Navigator 4.73です。

》いろいろダウンロードして試してみました。

 どうもお手数おかけしました。

》V3.05では貼り付けると中国語だけが ? になりました。
》V3.06Beta3では、その他→ファイルタイプ別の設定→その他 で、
》Unicodeを有効にしているときは表示できました。

  こちらでは Ver3.05 と Ver.3.06β3 の現れ方が全く逆です。
 ブラウザの違いのせいでしょうか?
  IE4.0 はありますが,これでやってもだめです。
 IE5.5 のCD-ROM はあるのですが,どうもインストールは危険を伴いそうで。

》秀丸は貼り付ける面の設定している文字コードに変換して表示新規面はunicode
》をそのまま受け付ける、unicodeの面もunicodeクリップボードのデータをそのま
》ま受ける。 UTF-8,unicode で保存/読み出しするとOK

 今まで何気なくコピーして支障なく使っていましたが,こういうしかけがあった
のですか。勉強になります。

》 確かに再現します。どうやらこれは clipboard の貼り付け関係を変更し
》たためのようです。もし code を UTF-7, UTF-8, unicode にしておけば、8
》割りぐらいは問題なく貼り付けで来ます。

 8割くらいではちょっと(^^;

》ただ一旦 HTML file を保存してから閲覧すれば、確実です。

 そうですね,html で保存して,それを秀丸で読み込んで,タグ類を削除して整
形すればテキストとして編集できます。

 なお,中国語については台湾,香港を中心に使われている BIG5 Code がありま
す。これは MingLiu というフォント(やはりMicrosoft提供)で表示できます。
(たとえば,台湾の中央日報 http://www.cdn.com.tw/ )。これについても GB Code
と同じ現象があるようです。

 では, (^^)/~
                                        山紫水明


[ ]
RE:06969 中国語BGコードの認識No.06979
秀丸担当 さん 00/12/05 17:29
 
>  こちらでは Ver3.05 と Ver.3.06β3 の現れ方が全く逆です。
> ブラウザの違いのせいでしょうか?
>  IE4.0 はありますが,これでやってもだめです。
> IE5.5 のCD-ROM はあるのですが,どうもインストールは危険を伴いそうで。

どうもそのようでした。ネスケで試してみたところ、V3.06β3のときは
文字化けがありました。
Unicodeを使わない設定にすると、V3.05と同様になりました。
調査しておきます。


[ ]
RE:06979 中国語BGコードの認識No.06982
山紫水明 さん 00/12/05 20:53
 
    秀丸担当さん こんばんは。

》Unicodeを使わない設定にすると、V3.05と同様になりました。
》調査しておきます。

 そうなりました。
 はじめから Unicode を使わない画面を準備しておいて,そこに張り付ければい
いですね。
 いったん,Unicode を使う画面に読み込んでしまうと,あとはどうにもならない
ようです。この辺のところの仕組みはよく理解できないのですが,ともあれ,
V3.06β3 で張り付けられるようになり,よかったと思います。どうもありがとう
ございました。

 では, (^^)/~
                                        山紫水明


[ ]
RE:06982 中国語BGコードの認識No.06983
なむnomoto さん 00/12/05 23:15
 

 山紫水明さん
   
 ご無沙汰しておりまする。
                 なむnomotoです

 ちいいいと、横道にそれる邪道ですが。
 GBコードのデータを、jisコードに変換すると、変換不能漢字は
 どうなるんだか解りませんが、参考までに。

  私はBIG5コードデータ7000ファイルほどを一挙にjisコードに
 変換してしまったjperlを使っています。
  元の変換スクリプトは、Kctrans.exe です。これをjperlで、
 フォルダ内ファイル全部を変換させてしまいます。
 (ひょっとしてご存じでしょうか。)
 これを、「秀丸」エディタで検索してます。

 GBコードもjisに変換できます(とマニュアルに書かれてます)。
 私はGBコードを持ってないので試してませんが、使って見ようと
 思われるなら、送信します。
               あ、余計なちゃちゃだったかな。

[ ]
RE:06983 中国語BGコードの認識No.06989
山紫水明 さん 00/12/06 22:57
 
    なむnomotoさん こんばんは。

》 ご無沙汰しておりまする。

 こちらこそ。
 例のお仕事,一段落で,後はできあがりを待つというところですか? それと
も・・・

》 GBコードのデータを、jisコードに変換すると、変換不能漢字は
》 どうなるんだか解りませんが、

 Kctrans で対応する文字に置き換えることはできます。できない文字は,コード
をそのまま出して,擬似文字に置き換えるにようになっている点も,BIG-5 と同じ
扱いです。
 もっとも,あまり使う機会はありませんが。

 では, (^^)/~
                                        山紫水明


[ ]