文字化けを正す方法No.27700
eigodoo1 さん 10/02/24 11:43
 
文字化けを正す方法を教えてください。

例:


哩迸釶鼈・鼈闖芍・?・絖・・謎・

[ ]
RE:27700 文字化けを正す方法No.27701
秀まるお2 さん 10/02/24 12:07
 
 文字化けしないようにするために、ファイルを開く時に出てくる「認識エ
ラー」のダイアログボックスでエンコード種類をいろいろ試すか、または、ファ
イルを開いた後に、「ファイル」メニューの「エンコードの種類」サブメニュー
の中の各種エンコード種類をいろいろ試してみるしか無いと思います。

 どのエンコード種類で試してみても化けるということでしたら、何か他のソフ
トで作成された形式のファイルではないかと思います。例えばMicrosoft Wordで
作成されたデータであれば、秀丸エディタで開いて見ることは出来なくて、Word
で開いて見るしか無いです。

 ファイルの拡張子を見れば、それでだいたい何の形式が憶測することも出来ま
す。拡張子を表示させるには、WindowsXPの場合だと、「コントロールパネル・
フォルダオプション」の「表示」ページ中の「登録されている拡張子は表示しな
い」をOFFにするといいです。そうすると、例えば秀丸エディタの「ファイル・
開く...」のダイアログボックスの中のファイル一覧の所に「.txt」とか
「.doc」とかの拡張子も表示されるようになります。

 例えば拡張子が.docだったらMicrosoft Wordで作成されたデータだと思います。
.lzhとか.lzhとかだったら、圧縮されたデータということになるので、解凍ソフ
トの類で解凍しないと中身のファイルが出てこないです。


 もしもそのファイルを作成したのが他の人だということでしたら、そのファイ
ルを作成した人に、ファイルの形式が何か聞くのが手っ取り早いんじゃないかと
思います。

[ ]
RE:27701 文字化けを正す方法No.27702
eigodoo1 さん 10/02/24 13:21
 
> 文字化けしないようにするために、ファイルを開く時に出てくる「認識エ
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>思います。

下記のリンクにアクセスして、それをコピーして秀丸に張り付けると文字が化けたの
です。なぜですか?きちんと見えるようにするにはどうすればいいですか?

http://www.shogi.net/shogivocab/vocabhtml.html#1

[ ]
RE:27702 文字化けを正す方法No.27703
秀まるお2 さん 10/02/24 13:53
 
 そこのページは、基本的には欧文文字になっているようですが、JISの文字
(Esc $ B のような制御コード)も無理矢理入っているようです。

 そこの内容をテキスト形式で保存しておきたいということでしたら、Webブラ
ウザの画面上で「すべて選択」、「コピー」としてから秀丸エディタに貼り付け
て、それを「ファイル・名前を付けて保存...」で、エンコード種類をutf-16に
して保存すれば一応大丈夫だと思います。utf-16で保存すれば、ファイルを読み
込む時に「認識エラー」が出ることは無いです。

 utf-16じゃなくてutf-8で保存すると、ファイルを開く時に「認識エラー」が
出てきてしまいますが、その場合は、とにかくエンコード種類をutf-8に指定し
て読み込むしか無いです。

 少なくとも僕の所ではそれで、Webブラウザで見たのと同じような内容が画面
に出てきます。

------------------------------------------------------------------------
 もしかして、ブラウザから秀丸エディタに貼り付けた段階で化けてしまうとい
う話でしたら、秀丸エディタの「全般的な設定...」の「編集」ページにある
「貼り付けでJISコードの自動認識をする」をOFFにして欲しいです。そうすれば
うまく貼り付け出来ると思います。
------------------------------------------------------------------------



 ちなみにですが、そのファイルの中の「Esc $ B ...」のようになっている部
分は、実は本当はJISコードで日本語を表しています。例えば最初の部分は
「将棋」という文字を表しています。

 もしもそういった部分を日本語に変換したいということでしたら面倒ではあり
ますが可能ではあります。もしそういう話でしたらまたご相談ください。

[ ]
RE:27703 文字化けを正す方法No.27704
eigodoo1 さん 10/02/24 14:12
 
> そこのページは、基本的には欧文文字になっているようですが、JISの文字
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>ますが可能ではあります。もしそういう話でしたらまたご相談ください。




何か少し噛み合っていないような気がします。

1.私の秀丸は新規ファイルを開けばUTF-16コードになるように設定されています。上
記のサイトをコピーして、ファイルへ張り付けるとサイトの行頭の部分が英語から日
本語に変換されている部分もあれば、訳のわからない言葉になっている部分もありま
す。


2.上記の「訳のわからない部分」を読める日本語にしたいのです。

よろしくお願いします。その問題ファイルをメールしました.






[ ]
RE:27703 文字化けを正す方法No.27705
秀まるお2 さん 10/02/24 14:15
 
 「Esc $ B....」となってる部分を日本語にした上でうまく秀丸に貼り付ける、
簡単な方法がありました。

 ブラウザ上で、エンコードを「日本語」に切り替えてからコピー/貼り付けす
ればうまくいくようです。

 Internet Explorer 8の場合なら、「表示」メニューの「エンコード」サブメ
ニューの「日本語(自動選択)」にしてやると、「将棋」のような漢字も正しく
表示されるようになって、それから「コピー」して秀丸に貼り付けとすれば、文
字化けすることなく貼り付けられるようです。

[ ]
RE:27704 文字化けを正す方法No.27706
秀まるお2 さん 10/02/24 14:17
 
> 2.上記の「訳のわからない部分」を読める日本語にしたいのです。

 それが僕の言う「Esc $ B ....」の部分な訳ですが、先ほどコメントさせてい
ただいたように、ブラウザ上でエンコード種類を「日本語(自動判定)」にすれ
ば、ブラウザ上でも正しく表示されるし、秀丸エディタに貼り付けても同じよう
に正しい日本語で出てくるようです。

[ ]
RE:27706 文字化けを正す方法No.27707
秀まるお2 さん 10/02/24 14:33
 
 送っていただいたファイルも見てみたんですが、これを文字化けしないように
修復することは、すみませんが出来ないです。

 ブラウザ上で化けてしまってるので、それを(元々化けた物を)コピーして貼
り付けた物の文字化けは解消不能、ということになります。

 ブラウザ上で「日本語(自動判定)」としてからコピー/貼り付けしなおさな
いとダメなようです。

 ということでお願いします。

[ ]
RE:27707 文字化けを正す方法No.27708
eigodoo1 さん 10/02/24 14:39
 
> 送っていただいたファイルも見てみたんですが、これを文字化けしないように
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
> ということでお願いします。


それでは、ブラウザ上でエンコード種類を「日本語(自動判定)」にする方法を教え
てください。

[ ]
RE:27708 文字化けを正す方法No.27709
秀まるお2 さん 10/02/24 14:46
 
 Internet Explorer 8の場合なら、「表示」メニューの「エンコード」サブメ
ニューの「日本語(自動選択)」を選択する、という操作になります。または、
ツールバーの中にある「ページ(P)」という所をクリックして出てくるメニュー
の中から「エンコード」サブメニューを表示させても同じことが出来ます。

 Firefoxの場合なら「表示・文字エンコーディング・日本語(ISO-2022-JP)」を
選択すると正しく表示されます。

 他のブラウザの場合でも、大抵は「表示」というメニューの中に「エンコー
ド」とか「エンコーディング」のような感じのサブメニューがあると思います。

[ ]
RE:27709 文字化けを正す方法No.27710
eigodoo1 さん 10/02/24 15:03
 
> Internet Explorer 8の場合なら、「表示」メニューの「エンコード」サブメ
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
>ド」とか「エンコーディング」のような感じのサブメニューがあると思います。


貴方は天才だ。

もうひとつ質問があります。
日本語 改行
英語 改行
英語 改行

上記のセットを「日本語タブ英語タブ英語」のセットにする正規表現を教えてくださ
い。

例文:

岡目八目
Okame hachimoku
The bystander sees the best of the game (Lookers-on always see more than the
 players)
攻めは飛角銀桂
Seme wa hi kaku gin kei
Attack with rook, bishop, silver and knight
寄せは俗手で
Yose wa zokute de
In the endgame a vulgar move is alright
詰みより必死
Tsumi yori hisshi
Hisshi (brinkmate) is better than mate







[ ]
RE:27710 文字化けを正す方法No.27711
秀まるお2 さん 10/02/24 15:18
 
 日本語の行というのは、正規表現で書く場合、「日本語の全角文字を1つでも
含む行」ということで表すのがいいと思います。

 英語の行は、ちょっと判定が難しいので、とにかく文字のある行全般、みたい
な扱いにするしか無いと思います。

 それで正規表現を書くとしたら、

 検索(S):  ^(.*[\x81\x40-\xFC\xFF].*)\n(.+)\n(.+)$
 置換(E):  \1\t\2\t\3

 ってな具合でいいと思います。

[ ]
RE:27711 文字化けを正す方法No.27712
eigodoo1 さん 10/02/24 15:31
 
> 日本語の行というのは、正規表現で書く場合、「日本語の全角文字を1つでも
≪全文引用されていたのでコミュニテックス会議室システムが引用部分を省略処理し
ました。≫
> ってな具合でいいと思います。


ありがとうございます。

[ ]