タブマークを挿入するにはどうすればいいNo.25801
eigodoo1 さん 08/12/17 09:23
 
英文と和文のペアが次のようなパターンで数万文あるとします。

英文と和文の間にタブマークを入れたい場合、どのようにすればいいですか?おそら
く、置換で出来ると思いますが、どのような記号を使えばよろしいですか?

1)英日

例)abcdeあいうえお

2)英 日

例)abcde あいうえお

3)英.日

例)abcde.あいうえお

4)英. 日

例)abcde. あいうえお




[ ]
RE:25801 タブマークを挿入するにはどうすNo.25805
ENCODINGSHIFTJIS さん 08/12/17 10:15
 
ポイントは
英文と和文の間
を認識する事 ですね。
一つの正解はない、状況によっていろいろ

置換の前に、誤りの無い 検索パターンを得ることです
正規表現検索を いろいろ試しましょう、検索箇所の強調をon にして。

1) 英字 非英字
2) 英字 スペース
3) 英字 ピリオド
4) 英字 ピリオド スペース
と別々に置換したり

英字+スペース+ピリオド+ピリオドスペース 直後 に非英字
とか 置換範囲や順序も微妙です。

[ ]
RE:25805 タブマークを挿入するにはどうすNo.25809
ENCODINGSHIFTJIS さん 08/12/17 10:57
 
一例です

([a-z][. ]*)([^a-z])

\1\t\2

英字一文字、ピリオドスペースが0以上、非英字一文字を
の間に TAB

[ ]
RE:25805 タブマークを挿入するにはどうすNo.25814
eigodoo1 さん 08/12/17 11:49
 
>ポイントは
>英文と和文の間
>を認識する事 ですね。
>一つの正解はない、状況によっていろいろ
>
>置換の前に、誤りの無い 検索パターンを得ることです
>正規表現検索を いろいろ試しましょう、検索箇所の強調をon にして。
>
>1) 英字 非英字
>2) 英字 スペース
>3) 英字 ピリオド
>4) 英字 ピリオド スペース
>と別々に置換したり
>
>英字+スペース+ピリオド+ピリオドスペース 直後 に非英字
>とか 置換範囲や順序も微妙です。


正規表現の時に「検索箇所の強調をon にして。」とはどういう意味ですか?

[ ]
RE:25814 タブマークを挿入するにはどうすNo.25820
ENCODINGSHIFTJIS さん 08/12/17 12:14
 
>正規表現の時に「検索箇所の強調をon にして。」とはどういう意味で

検索ダイアログの
検索文字列を強調(I)
の ことです、一時的に強調になる、マッチした範囲を確認するのに便利

[ ]
RE:25820 タブマークを挿入するにはどうすNo.25823
eigodoo1 さん 08/12/17 12:51
 
>>正規表現の時に「検索箇所の強調をon にして。」とはどういう意味で
>
>検索ダイアログの
>検索文字列を強調(I)
>の ことです、一時的に強調になる、マッチした範囲を確認するのに便利



検索ダイアログの 検索文字列の強調(I)をチェックマークして置換しても、何にもか
わりません。なぜですか?

[ ]
RE:25823 タブマークを挿入するにはどうすNo.25824
秀まるお2 さん 08/12/17 13:04
 
 「検索文字列の強調をONにするといい」という話は、つまり、正規表現でヒッ
トする部分がどこになるのか分かりやすくなって便利である、という話だと思い
ます。

 そこをONにしたりOFFにしたりすることで検索結果や置換結果が変わるという
訳ではないです。

[ ]
RE:25805 タブマークを挿入するにはどうすNo.25826
eigodoo1 さん 08/12/17 13:57
 
>ポイントは
>英文と和文の間
>を認識する事 ですね。
>一つの正解はない、状況によっていろいろ
>
>置換の前に、誤りの無い 検索パターンを得ることです
>正規表現検索を いろいろ試しましょう、検索箇所の強調をon にして。
>
>1) 英字 非英字
>2) 英字 スペース
>3) 英字 ピリオド
>4) 英字 ピリオド スペース
>と別々に置換したり
>
>英字+スペース+ピリオド+ピリオドスペース 直後 に非英字
>とか 置換範囲や順序も微妙です。


非英字の記号は何ですか?

[ ]
RE:25826 タブマークを挿入するにはどうすNo.25829
秀まるお2 さん 08/12/17 14:34
 
> 非英字の記号は何ですか?

 Windowsのスタートメニューの「ファイル名を指定して実行...」の所に
「charmap」と入力してOKすると、Windows付属の「文字コード表」というソフト
が起動します。

 それを見ると、具体的に、「非英字の記号」が何か、ご自身で見て「あぁこう
いう記号があるのだなぁ…」ってことが理解いただけるのではないかと思います。

 例えば具体的な例としては、

 !  (びっくりマーク)
 ?  (はてなマーク)
 $  (ドルマーク)

 とかですけど。

 例えばこういう文字を正規表現を使って検索したい場合は、

 [!-/]+

 とか指定するとかって感じになるかなぁと思いますけど…。

 この辺の記号は、英語の文章の中で使う以外に日本語の文章の中でも使うこと
がありますので、その辺を柔軟にうまく「英語だけ検索したい」とかいうニーズ
があるとしても、それは難しいんじゃないかと思います。

 ある程度は正規表現を使って自動化出来るかもしれませんが、より正確なこと
をやるなら、やはり最終的には手作業でやっていただくしか無いのではないかと
思います。

[ ]