エンコードNo.29981
Cyber さん 11/07/04 13:35
 
"UTF-8"と"UTF-16"に違いはありますか?

[ ]
RE:29981 エンコードNo.29983
秀丸担当 さん 11/07/04 16:46
 

>"UTF-8"と"UTF-16"に違いはありますか?

UTF-8とUTF-16は扱える文字は同じですが、ファイルにしたときの形式が違いま
す。
名前を付けて保存するとき、BOMを付けるかどうかによって、ファイル先頭の形
式が変わってきます。
BOMを付けるとエンコードの種類の判別がほぼ確実に成功しますが、UTF-8でBOM
付きでは他のソフトが読み込みに対応していない場合もあるようです。

BOMが無いとファイル内容によってはエンコードの種類の判別に失敗する可能性
があります。
英数字だけのBOMなしUTF-8は、Shift-JISなどと全く同じファイルになるので区
別することができなくなってしまうということもあります。

完全にプライベートで自分だけが見るファイルの場合、UTF-16でBOMありが間違
いが起きにくいです。
他のソフトが読み込んだりする場合は、UTF-8にする必要があったりBOMの有無を
考慮する必要があると思います。

[ ]
RE:29983 エンコードNo.29987
Cyber さん 11/07/05 10:56
 
>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>考慮する必要があると思います。



ありがとうございます。

HPを開設するにあたり、下準備のため、文章をどのエンコードで保存すべきか思案中
なのです。文章の保存はUTF-16 BOM付きにして、それら文章をコピー&ペーストでHP
を作っていけばいいのですか?


[ ]
RE:29987 エンコードNo.29988
秀丸担当 さん 11/07/05 11:19
 

>HPを開設するにあたり、下準備のため、文章をどのエンコードで保存すべきか思案中
>なのです。文章の保存はUTF-16 BOM付きにして、それら文章をコピー&ペーストでHP
>を作っていけばいいのですか?

秀丸エディタは下書きとして本文だけを書いて、ホームページを作成するソフト
に貼り付けるという場合、UTF-16 BOM付きでもいいと思います。
コピー貼り付けにはエンコードは関係ないので、特殊な文字を使わず日本語のだ
けということであれば秀丸エディタの初期状態の日本語(Shift-JIS)でも大丈夫
だと思います。

そういうことではなく、もしhtmlファイルを秀丸エディタで作ってタグを直接入
力して作るという場合、UTF-8のBOM無しにしておくのがいいと思います。

[ ]
RE:29988 エンコードNo.29990
Cyber さん 11/07/05 11:51
 
>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>力して作るという場合、UTF-8のBOM無しにしておくのがいいと思います。




現在の設定はUTF-16 BOM付きとなっています。この設定のまま、htmlファイルを秀丸
で作成したら、なにか不具合が発生するのでしょうか?

[ ]
RE:29990 エンコードNo.29992
秀丸担当 さん 11/07/05 13:12
 

>現在の設定はUTF-16 BOM付きとなっています。この設定のまま、htmlファイルを秀丸
>で作成したら、なにか不具合が発生するのでしょうか?

秀丸エディタだけで読み込むのであればいいですが、ブラウザやHTML編集ソフト
やWeb上を徘徊するソフトなど、いろいろあると思いますが他のソフトで問題が
起きる可能性があるようです。
UTF-8 UTF-16 BOM HTML といったキーワードでGoogle検索するといろいろ情報が
得られると思います。

UTF-8にしてBOMなしにするのが現時点ではいいと思われます。
さらにmetaタグで
meta http-equiv="content-type" content="text/html; charset=utf-8"
といったものも入れておくといいようです。
GoogleもYahooもUTF-8でmetaタグが入っているようです。

[ ]
RE:29992 エンコードNo.29994
Cyber さん 11/07/05 15:50
 
>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>GoogleもYahooもUTF-8でmetaタグが入っているようです。


ということは、現在はUTF-16 BOM付き設定にしていますが、HP用に作成した秀丸ファ
イルのみをUTF-8 BOM無に変更すればいいですか?その変更方法はどのようにすれば
いいですか?

[ ]
RE:29994 エンコードNo.29997
Cyber さん 11/07/05 17:19
 
>>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>ということは、現在はUTF-16 BOM付き設定にしていますが、HP用に作成した秀丸フ
>ァイルのみをUTF-8 BOM無に変更すればいいですか?その変更方法はどのようにすれ
>ばいいですか?


ということは、現在はUTF-16 BOM付き設定にしていますが、HP用に作成した秀丸ファ
イルのみをUTF-8 BOM無に変更すればいいですか?その変更方法はどのようにすれば
いいですか?

[ ]
RE:29997 エンコードNo.29998
Iranoan さん 11/07/05 17:43
 
 Cyber さん今日は、一ユーザの Iranoan です。
> UTF-8 BOM無に変更すればいいですか?その変更方法はどのようにすれば
> いいですか?
 「名前を付けて保存」で「エンコードの種類」を変えればよいでしょう。

[ ]
RE:29994 エンコードNo.29999
秀丸担当 さん 11/07/05 17:49
 

>ということは、現在はUTF-16 BOM付き設定にしていますが、HP用に作成した秀丸ファ
>イルのみをUTF-8 BOM無に変更すればいいですか?その変更方法はどのようにすれば
>いいですか?

UTF-8のBOMなしでmetaタグを入れるといいというのは一般的に言えることで、そ
うしなくてはいけないということではないです。
metaタグが無いと自動認識に失敗する可能性や、文字化けの可能性があるので、
そのことを考えるとUTF-16のBOMありのほうがむしろ安全とも言えると思います。
今IEとFireFoxで試してみたところではBOM付きであればUTF-16でも大丈夫でした。

秀丸エディタの操作としては、UTF-8のBOMなしにする場合は、いったんファイル
を開いて、[ファイル]→[名前を付けて保存]で、エンコードと「BOMを付ける」
をOFFにして同じ名前で保存するという操作になります。

[ ]
RE:29999 エンコードNo.30001
Cyber さん 11/07/05 21:40
 
>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>をOFFにして同じ名前で保存するという操作になります。


ありがとうございます。UTF-16 BOM付きで試みてみます。

[ ]
RE:30001 エンコードNo.30006
Cyber さん 11/07/06 11:09
 
>>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>ありがとうございます。UTF-16 BOM付きで試みてみます。


メタタグでは

meta http-equiv="content-type" content="text/html; charset=utf-16 BOM"

と、すればよいのですか?

それとも、UTF-16 BOM付き秀丸エディタで作成した文章を


meta http-equiv="content-type" content="text/html; charset=utf-8"


へ、書いていけばいいのですか?

[ ]
RE:30006 エンコードNo.30008
秀丸担当 さん 11/07/06 11:42
 

>メタタグでは
>
>meta http-equiv="content-type" content="text/html; charset=utf-16 BOM"
>
>と、すればよいのですか?

UTF-16で書く場合は charset=UTF-16 でいいのではないかと思いますが、ブラウ
ザや他のソフトが判断することになります。
できるかどうかは秀丸エディタとしてはわからないので、IEなどのブラウザで試
してみてほしいです。
「meta utf-16」や「meta エンコード」といったキーワードで検索してみるとい
ろいろ情報が得られるようです。


>それとも、UTF-16 BOM付き秀丸エディタで作成した文章を
>
>meta http-equiv="content-type" content="text/html; charset=utf-8"
>
>へ、書いていけばいいのですか?

UTF-16でBOM付きのhtmlファイルをcharset=utf-8と書くのは実際のエンコードと
記述のエンコードが違うので、誤認識される可能性がある気がします。
これもブラウザがどのように判断することなので、秀丸エディタとしてはわから
ないです。

[ ]
RE:30008 エンコードNo.30011
Cyber さん 11/07/06 12:20
 
>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>ないです。

もっぱら、Chromeを使用しております。ChromeではUTF-16LEというものがありました。
秀丸ではUTF-16とかUTF-16 Big Endianとかあります。どのように異なるのでしょうか?

[ ]
RE:30011 エンコードNo.30013
秀丸担当 さん 11/07/06 13:16
 

>もっぱら、Chromeを使用しております。ChromeではUTF-16LEというものがありました。
>秀丸ではUTF-16とかUTF-16 Big Endianとかあります。どのように異なるのでしょう
>か?

Unicode(UTF-16)とUTF-16LEは同じです。
Unicode(UTF-16)とUnicode(UTF-16,Big-Endian)は、ファイルにしたときのバイ
トの並びの順番が異なります。

[ ]
RE:30013 エンコードNo.30540
sary さん 11/11/05 13:28
 
>
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>トの並びの順番が異なります。

http://www.unicode.org/faq/utf_bom.html
Q: What are some of the differences between the UTFs?


上記によるとUTF-16には、BOMありの無印とUTF-16BEとUTF-16LEの
3種類があるようですが、秀丸においてはUTF-16LEをUnicode(UTF-16)と表記していて、
無印のUTF-16形式では保存できないということなのでしょうか?

[ ]
RE:30540 エンコードNo.30541
アルビレオ さん 11/11/05 13:57
 
ユーザーのアルビレオです。

>http://www.unicode.org/faq/utf_bom.html
>Q: What are some of the differences between the UTFs?
>
>
>上記によるとUTF-16には、BOMありの無印とUTF-16BEとUTF-16LEの
>3種類があるようですが、秀丸においてはUTF-16LEをUnicode(UTF-16)と表記していて、
>無印のUTF-16形式では保存できないということなのでしょうか?

BOMはあくまでLEとBEを識別するための目印なので、細かく区別すれば
・LE(BOMあり)
・BE(BOMあり)
・LE(BOMなし)
・BE(BOMなし)
の4種類ってことになりますが、普通はLEとBEの二種類と考えることが多いです。

つまり無印のUTF-16というものがLEやBEとは別にあるわけじゃなく、UTF-16は必
ずLEかBEのどちらになります。
BOMのありなしはそれとは独立した要素ってことになります。

[ ]
RE:30541 エンコードNo.30545
秀丸担当 さん 11/11/07 09:52
 

>上記によるとUTF-16には、BOMありの無印とUTF-16BEとUTF-16LEの
>3種類があるようですが、秀丸においてはUTF-16LEをUnicode(UTF-16)と表記していて、
>無印のUTF-16形式では保存できないということなのでしょうか?

秀丸エディタで表現している「Unicode(UTF-16)」は、他のソフトでは「UTF-
16LE」「UTF-16 Little Endian」または単に「Unicode」と表現されることがあ
りますが、全く同じです。
「Unicode(UTF-16,Big-Endian)」は、他のソフトでは「UTF-16BE」「Unicode
big endian」と表現されることがありますが、これも同じです。

アルビレオさんも言われている通り、UTF-16LEとUTF-16BEのどちらかということ
と、BOMの有無は別のことで、4つの組み合わせがあることになります。
サイトの説明では、「UTF-16LE」と表現されたらはLEに決まっている、「UTF-
16BE」と表現されたらBEに決まっている、「UTF-16」と表現されたらどちらかわ
からない(BOMによって決まるから2通り)ということだと思います。

秀丸エディタでは、[ファイル]→[名前を付けて保存]のダイアログで「BOMを付
ける」のチェックのON/OFFを切り替えることでBOMの有無を変更できます。

一般的に無印のUTF-16という場合は、BOM有りのことを指している場合が多いと
思います。
秀丸エディタの場合は、名前を付けて保存で、「Unicode(UTF-16)」を指定して
「BOMを付ける」をONにすると保存できます。

[ ]