|
> UTF-8で保存した文章を、UTF-16で保存したファイルへ挿入するとどのような現象が
> 起こりますか?
UTF-8で保存したファイルの中にUTF-16で保存したファイルを挿入する作業を
秀丸エディタ上で実行されるのであれば、何も問題なく、普通に挿入出来るはず
です。具体的には、
1.UTF-8で保存したファイルを開く。
2.UTF-16で保存したファイルを開く。
3.UTF-16で保存したファイル上で、「編集・すべてを選択」を実行してから
「編集・コピー」を実行する。
4.UTF-8で保存したファイルの方をアクティブにして、そこで
「編集・貼り付け」を実行する。
5.UTF-8で保存した方のファイルを保存する。
とすることで、UTF-8のファイルの中にUTF-16で保存したファイルの内容を挿
入することが出来ます。
---------------------------------------
UTF-8で保存してもUTF-16で保存しても、どっちも、いわゆる「ユニコード」
という分類のファイルということになりまして、中で扱える文字の種類について
はまったく違いが無いです。
例えばShift-JISとかの日本語の文字コードでは、中国語の漢字なんかが表現
出来ないです。なので、例えばユニコードのファイルを開いてそれをShift-JIS
形式で保存しようとすると、もしも元々のユニコードファイルに中国語の文字な
んかが入っていると、「変換出来ない」ということでいろいろややこしい問題が
発生します。
ユニコードは、日本語も中国語もヨーロッパの欧文文字もなんでも表すことが
出来る万能の文字コードなので、そういうややこしい問題は発生しないです。
UTF-8とUTF-16はどちらもユニコードということになりまして、例えばUTF-8で
保存したファイルをUTF-16で保存しなおしたり、またUTF-8に戻したりといった
ことをしても、中身が化けたりすることはありません。
(UTF-16/UTF-8双方にちゃんと対応したソフトを使えば、の話ではあります
けども)
---------------------------------------
>UTF-8とUTF-16とでは、保存時にどのように異なるのですか?
UTF-8もUTF-16も基本的には「ユニコード」ということでは同じなんですが、
内部的な形式がちょっと違います。
元々はutf-16という形式しか無かったんですが、utf-16の場合だと英文を中心
とした内容を保存した時にサイズが極端に大きくなってしまうということで嫌わ
れて、それで、英文を中心とした内容でもサイズが大きくならないようにという
ことでutf-8が後で開発された、ということではないとか思います。
utf-8だと、英文の場合はサイズが小さくなるんですが、その代わり、日本語
や中国語が中心の内容の場合にファイルサイズが(utf-16に比べて)1.5倍く
らい大きくなってしまうと思います。
そういう違いがあるだけかと思います。
あと、utf-8は後から追加された仕組みなので、utf-16には対応してるけどutf
-8には対応してない、というようなソフトも世の中にはあります。秀丸エディタ
も、utf-8に対応したのはだいぶ後になってからです。
|
|