|
いいじまです。
初歩的な話ですが…
選択範囲の「文字数・バイト数」をカウントするにはどうするのが
簡単なんでしょうか?
「文字数・バイト数」の定義は、次のいずれかを実行時に選択です。
1.どの文字も1文字を1と数える。(UTF-32)
2.サロゲートペアの文字は2と数え、BMPの文字は1と数える。(UTF-16)
3.画面のエンコーディングにかかわらず、Shift_JIS、EUC、UTF-8での
バイト数を数える。
4.改行は1または2と数える。どちらにするのかは実行時に選択。
そもそもこの計数をする動機は、ツイッターの文字数制限や2ちゃんねるの
バイト数制限、レポート類の字数制限をクリアできるかどうかの確認なので、
速度はそれほど必要ありません。10kB程度までを実用的な速度でカウント
したいと考えています。
…単純に先頭からシーケンシャルに見ていくのが、副作用がなくて
確実でしょうか?(これだと全部の数値を一気にカウントできますし。)
|
|