単語単位の選択についてNo.09103
Buckeye さん 06/02/15 10:56
 
お世話になっています。

前に、単語単位の選択について、音引き(ー)の処理をお願いして直していただ
いたことがありますが、また、何点か、気になる点が出てきました。()「」な
どのカッコと句読点の関係、および漢数字の〇(ゼロ)の取り扱いです。

◎()「」などのカッコと句読点などの関係

カッコに漢字やカナが入って(こんな感じ)になっていると、単語選択をすると、
カッコと漢字やカナの間に切れ目ができます。これは感覚どおりでいいと思いま
す。で、このカッコの前や後ろに句読点が入ると、句読点とカッコが同じ単語ブ
ロックとみなされてしまいます。(こんな感じ。)とすると、最後の「。)」が
ひとまとまりになるんです。これ、感覚的には分離すべきなんじゃないでしょう
か。(〜なんです。)なんてやってしまうと、「〜なんです。」を書き換えたい
と思って単語単位で選択しようとすると、「。(〜なんです。)」が選択されて
しまいます。こういうときの句読点をカッコ外に出すというフォーマットのとき
はいいんですが、中に入れるときにけっこう不便なので、直していただけると助
かります。

処理としては、()「」。、は、ひとつひとつ、ばらばらの単語であるという処
理にしていただくのが、物書きをしている人の感覚に合うんじゃないかと思いま
す。

◎漢数字の〇(ゼロ)の取り扱い

漢数字の「一」や「二」などは、すべていわゆる漢字として取り扱われているよ
うです。これはいいんですが……そこに「漢数字の〇(ゼロ)」も入れてもらえ
ないでしょうか。縦書きで文章を書いていると、「二〇〇六年」なんていうのが
よく出てきます。これを書き換えたり動かしたりするとき、単語単位で選択しよ
うとすると、「二」「〇〇」「六年」と三分割になります。気づけば、範囲選択
を広げればいいだけなんですが、実際には、ついうっかり、「〇〇六年」だけコ
ピーするなんてことをよくやります。

Best regards,
Buckeye

[ ]
RE:09103 単語単位の選択についてNo.09104
秀丸担当 さん 06/02/15 15:37
 

>◎()「」などのカッコと句読点などの関係

確かに言われている通りのほうが直感的で良いように思います。
互換性なども心配ですが、変更しても問題無いかもしれないので、次期バージョ
ンで変更してみようと思います。

>◎漢数字の〇(ゼロ)の取り扱い

これは確かに変でした。修正しようと思います。

[ ]
RE:09104 単語単位の選択についてNo.09154
Buckeye さん 06/02/17 16:07
 
秀丸担当さん、

修正、よろしくお願いします。

ところで、漢字に絡んだ単語区切りの取り扱いで、もう1点、気づいたものが出
てきました。

「々」です。「人々」など、くり返しで使うものですが、これ、フォント的には
記号なんですが、単語区切りとしては漢字と同等扱いにしていただいたほうが、
物書きの感覚にはあうと思います。「人々が」みたいにふつうの文章内に出てき
たときはあまり気にならないのですが、その後ろにテンやカッコなどが来ると、
単語区切りでは思ったところで切れてくれず(短すぎるか長すぎるかになる)、
選択しなおすなど二度手間になってしまいます。

単語単位で選択というのは、細かく範囲を選択しなくてもすむようにという無精
根性でよく使うものなので、その結果、かえって手間が増えることがあると、け
っこうイライラしてしまいます(って、他のときまで総合すれば、単語単位の選
択で手間が省けているんですけど^^;)

Best regards,
Buckeye

[ ]
RE:09154 単語単位の選択についてNo.09168
秀丸担当 さん 06/02/17 18:19
 

>「々」です。「人々」など、くり返しで使うものですが、これ、フォント的には
>記号なんですが、単語区切りとしては漢字と同等扱いにしていただいたほうが、
>物書きの感覚にはあうと思います。「人々が」みたいにふつうの文章内に出てき
>たときはあまり気にならないのですが、その後ろにテンやカッコなどが来ると、
>単語区切りでは思ったところで切れてくれず(短すぎるか長すぎるかになる)、
>選択しなおすなど二度手間になってしまいます。

「々」も漢数字の〇と同様に漢字とみなすようにしてみようと思います。
漢数字の〇や句読点などはV6.00β1で修正してみたのでもしよろしければ試して
みてください。

[ ]
RE:09168 単語単位の選択についてNo.09256
Buckeye さん 06/02/21 10:00
 
秀丸担当さん、

>漢数字の〇や句読点などはV6.00β1で修正してみたのでもしよろしければ試して
>みてください。

はい、いい感じになったと思います。これで、ダブルクリックからの選択で無精
しようとして二度手間になることが大幅に減ります。ありがとうございます。
「々」が「〇」と同じになれば完璧でしょう。

ところで……V6.00β1をインストールした後、もし、V5.xxに戻したいときって
どうしたらいいんでしょうか。今回は、βのまま使っていってもいい思えるサブ
マシンでテストしたのですが、ここが直っているのなら、仕事で使うメインマシ
ン側でも早く使いたいなと思うんです。でも、仕事で必要などこか別のところに
不具合があったら元に戻したいと思うはずで……仕事マシンにβをインストール
してしまっていいか、迷っています。戻せるなら、迷わずインストールしちゃう
んですけど。

Best regards,
Buckeye

[ ]
RE:09256 単語単位の選択についてNo.09273
秀丸担当 さん 06/02/21 14:25
 

>ところで……V6.00β1をインストールした後、もし、V5.xxに戻したいときって
>どうしたらいいんでしょうか。今回は、βのまま使っていってもいい思えるサブ
>マシンでテストしたのですが、ここが直っているのなら、仕事で使うメインマシ
>ン側でも早く使いたいなと思うんです。でも、仕事で必要などこか別のところに
>不具合があったら元に戻したいと思うはずで……仕事マシンにβをインストール
>してしまっていいか、迷っています。戻せるなら、迷わずインストールしちゃう
>んですけど。

基本的には、互換性は維持されるように作ってあり、そのまま古いバージョンを
上書きインストールすると戻すことができます。

新しい機能では[ファイルタイプ別の設定]→[表示とカラー]で透明色を指定して
いると、その色がV5.xx以下では灰色になったりします。
ここは完全な互換とはいえない部分です。

他にも問題が無いとは言い切れませんが、完全に安全にするためには、元に戻し
たい時点での[その他]→[設定内容の保存/復元]で設定を保存しておけば、V6.00
βを入れてみて、やっぱりアンインストールしてV5.xxを新規インストールなど
をしてまた復元するとかできるようになります。

[ ]
RE:09273 単語単位の選択についてNo.09274
Buckeye さん 06/02/21 15:10
 
秀丸担当さん、

了解です。やってみます。

Best regards,
Buckeye

[ ]
RE:09256 単語単位の選択についてNo.09305
Buckeye さん 06/02/22 08:51
 
秀丸担当さん、

>「々」が「〇」と同じになれば完璧でしょう。

β2で、「々」も漢字と同じ扱いになったことを確認しました。いや〜、いいで
すね。ありがとうございました。

Best regards,
Buckeye

[ ]
RE:09305 単語単位の選択についてNo.09503
Buckeye さん 06/02/27 09:08
 
秀丸担当さん、

お世話になっています。

またまた単語単位の選択というか文字種の判別についてなんですが……文字とし
て有効な範囲外にあるものを別扱いにすることはできないでしょうか。

今回、具体的に出てきたのは、F620という文字コードのものです(ファイルは
sjis)。sjisでは定義されていない文字コードなんですが、これが秀丸では漢字
と同じと判定されてしまい、漢字と隣り合っていると単語単位選択ではまとめて
選択されてしまいます。

    PDFファイルから書き出したテキストなので、本来はありえないものがいろ
    いろと入っていて、秀丸の問題では本来ないんですが。なお、「漢字と隣り
    合っていると」と書いていますが、実は、隣り合うことがとても多いのです。

具体的には、漢字・カナ・英数字・記号などとは別に、「未定義」のような分類
を設け、未定義だったら、ひとつひとつ、バラバラに単語であると処理するか
(カッコなんかと同じような処理になる???)、あるいは、未定義は未定義で
ひとまとめに選択されるような処理にするのがユーザーから見るといいのではな
いかと想像します。

なお、この文字コード、検索・置換の対象にはならないようで、この部分を選択
して置換ダイアログに入れ、別のナニかに置換しようとしてもできません(前に
も同じようなことを何度も経験しています。文字コードが同じだったかどうかは
不明です)。こちらはこちらで、もし、検索・置換の対象にできるようなら、こ
ちらもしていただけると大変助かります。PDFのナニかがおかしな文字コードと
して出力されているので、置換コマンドが使えれば一気に修正ができますから。

Best regards,
Buckeye

[ ]
RE:09503 単語単位の選択についてNo.09553
秀丸担当 さん 06/02/28 17:08
 

>またまた単語単位の選択というか文字種の判別についてなんですが……文字とし
>て有効な範囲外にあるものを別扱いにすることはできないでしょうか。

F620という文字を無理やり入れてみて確認することができました。
これはあるはずの無い文字のようなので、ここまでくると単語の選択はせずに通
常の選択で選択したほうがいいように思います。

この文字をコピーして検索ダイアログに貼り付けて検索できないのも確認できま
した。
これはおそらくUnicodeとShift-JISのマッピングがうまくいっていないためで、
検索ダイアログでなくても、普通にコピー、貼り付けするだけでも違う文字に変
化してしまいました。
正規表現で"\xf6\x20"とやると検索できると思いますが、これでどうでしょうか。


[ ]
RE:09553 単語単位の選択についてNo.09562
Buckeye さん 06/02/28 18:43
 
秀丸担当さん、

>これはあるはずの無い文字のようなので、ここまでくると単語の選択はせずに通
>常の選択で選択したほうがいいように思います。

そうなんです。あるはずのない文字なんです。AcrobatでPDFから書き出したファ
イルには、F620かどうかは確認していないのですが、こういう文字が出てくるこ
とがけっこうよくあるんです。最近は、私のギョーカイ(翻訳)では元原稿が
PDFで届くことが増えており、今後、この手の文字が出てくることは増えること
こそあれ、減ることはないように思います。

あるはずのない文字なんですが、秀丸上では「・」と中黒に見えてしまうことも
あり、間違ってコピーしてしまうとあとあとトラブルになったりすることもある
という、意外にくせ者というか、扱っていてイライラする文字です。

なので、「あるはずのない文字」は「あるはずの文字」と別扱いにできないかな
と思うんですけど。文字コードはきれいにひとかたまりでないので難しいかなと
も思いますが。

    ぜいたくを言うなら、こういう「あるはずのない文字」は特別な記号で表示
    していただけると助かります。私はこういうことがあることを知っているか
    らいいけど、よく知らない人だと、中黒だと勘違いしてコピーしてしまい、
    あとあと、お客さんとトラブルになったりするおそれもありますから。

>正規表現で"\xf6\x20"とやると検索できると思いますが、これでどうでしょうか。

たしかに、文字コードを指定して正規表現とすれば検索できますね。これは気づ
いていませんでした。私自身は、とりあえず、範囲選択しておいたら文字コード
を取得して置換するマクロを作って対応しておきます。

ただ、PDFから書き出したファイルを扱う人は少なくとも私のギョーカイにはた
くさんいますし、他にもいるかもしれないしなので、そのうち、対応していただ
けると助かります。まあ、逆に言えば、PDFから書き出したファイルを扱う人以
外にはあまり関係がないはずだとも言えるので、β版が完成に近づいたころ、あ
るいは、正式版になったあとでゆっくりでもかまいませんから。

Best regards,
Buckeye

[ ]
RE:09562 単語単位の選択についてNo.09564
Iranoan さん 06/02/28 18:55
 
 Buckeye さん今日は、Iranoan です。
> なので、「あるはずのない文字」は「あるはずの文字」と別扱いにできないかな
> と思うんですけど。文字コードはきれいにひとかたまりでないので難しいかなと
> も思いますが。
 いっそのこと、強調表示しておいてはどうでしょう?
> 「あるはずのない文字」は特別な記号で表示
>     していただけると助かります。
に近い印象を与えることは出来ると思います。

[ ]