【要望】改行コードの文字コードについてNo.22744
HIDEO さん 07/03/19 22:49
 
現在の秀丸で、改行コードの文字コードが表示されません。
改行コードも文字コード表示出来るようにしてほしいです。
あと、マークを以下のようにしてほしいです。
  CRLF: | ※エンターマークみたいなの
       ←
  LF :←
  CR :↓

【要望の理由】
以前、EXCELのセル内の文字をコピーして秀丸に貼り付けた
て、色々して、また、EXCELに貼り付け直したらおかしく
なりました。原因は改行コードの問題でした。
EXCELのセル内改行(ALT+ENTER)をした文字列は
CSVでは以下のようになります。
"AAAAAA
BBBBBB"

この最後のAの後の改行はLFだったのです。
これが問題の原因でした。てっきりCRLF
だと思っていたからです。
これが見てすぐ分かるように、改行コードの
マークを使い分けるのと、改行コードの文字コード
も出してほしいです。

すみませんが、是非ご検討よろしくお願いします。

[ ]
RE:22744 【要望】改行コードの文字コードNo.22745
EA11R さん 07/03/19 23:10
 

EA11R@一般ユーザ。

>現在の秀丸で、改行コードの文字コードが表示されません。
>改行コードも文字コード表示出来るようにしてほしいです。
>あと、マークを以下のようにしてほしいです。
>  CRLF: | ※エンターマークみたいなの
>       ←
>  LF :←
>  CR :↓
<snip>
>すみませんが、是非ご検討よろしくお願いします。
今は、[CR][LF][CRLF]は、エディタの文字コードがらみの所で指定している
改行コードに自動コンバートしている、と、HELPに…件の事象の原因かと。

内容から、[CR][LF][CRLF]を区別化する、と言う要望と思われるので、もし、
実現可能なら、保存したらアウト、デも構わないので、僕も便乗したいです。
# 現時点では、保存時にも…とは要望しませんが、まず間違いなく出てくる
# でしょうけど…

[ ]
RE:22744 【要望】改行コードの文字コードNo.22746
Iranoan さん 07/03/20 00:43
 
 HIDEO さん今日は、Iranoan です。
 念の為お断りしておくと、開発者とは何の関わりも無い単なる一ユーザです。
> EXCELのセル内改行(ALT+ENTER)をした文字列は
> CSVでは以下のようになります。
> "AAAAAA
> BBBBBB"
>
> この最後のAの後の改行はLFだったのです。
> これが問題の原因でした。てっきりCRLF
> だと思っていたからです。
 秀丸エディタは改行コードが混在している/していないに関わらず、どんな
改行コードも内部的には同じ改行コード (確か CR+LF) トして扱っていたと思
います。よって例えばある行の改行コードが CR で、ある別の行は LF として
コピーは出来ないと思います。詳しくは後ほど秀丸担当さんから回答があると
思います。

> 改行コードの文字コード
> も出してほしいです。
 混在している場合 CR+LF の扱いになるようですが、動作環境」
・「ウィンドウ」→「ステイタスバー」の [詳細]
・「上級者向け設定」を ON にした上で、「ウィンドウ」→「高度なウィンド
  ウ」の「エンコードの種類」
のどちらでも表示できます。

[ ]
RE:22746 【要望】改行コードの文字コードNo.22747
HIDEO さん 07/03/20 02:18
 
ご回答ありがとうございます。
すみません、もっと正確に記載しまうす。

EXCELからコピーしたデータを秀丸に
貼り付けて、一括置換等の作業をしたあとに
再度EXCELに貼り付け直すとLFからCRLFに
変換されて貼り付けられるため本来LF改行
のEXCELデータがCRLFになってしまい、セル内
改行の箇所で「・」のような変な文字が入って
しまうんです。

ですので、その場合、サクラエディタで作業
を実施していました。
ですが、基本的に秀丸だけで作業をしているの
でその部分が出来なかったのが残念に思い、
要望に記載させていただきました。

使い分けろ!と言われればそれまでですが、
私の中では秀丸が最強なので是非お願いしたい
と思い投稿しました。



[ ]
RE:22747 【要望】改行コードの文字コードNo.22749
秀丸担当 さん 07/03/20 11:00
 

いまのところIranoanさんの言われる通りLFとCR+LFを混在させて保存することは
できないです。
以前にも要望があり、やるべきことの1つです。
先行開発中のV6.50βか、またはV6.50は無理かもしれないですがそれ以降のバー
ジョンかでできるように検討したいと思います。

[ ]
RE:22749 【要望】改行コードの文字コードNo.22750
いいじま さん 07/03/20 13:08
 
いいじまです。

秀丸担当 wrote:
> いまのところIranoanさんの言われる通りLFとCR+LFを混在させて保存することは
> できないです。
> 以前にも要望があり、やるべきことの1つです。
> 先行開発中のV6.50βか、またはV6.50は無理かもしれないですがそれ以降のバー
> ジョンかでできるように検討したいと思います。

内部コードで何とかするというのはどうでしょう。
たとえば今回のExcelのCSVファイルの場合、「行末をあらわすCRLF」は内部的には
U+000D U+000A で保持するとしたら、U+FEFF と U+FFFE あたりが内部コード用と
しては空いています(BOMのため、このコードには文字を割り当てないことになって
います)からそれを使うとか。

[ ]
RE:22750 【要望】改行コードの文字コードNo.22751
秀丸担当 さん 07/03/20 18:10
 

>内部コードで何とかするというのはどうでしょう。
>たとえば今回のExcelのCSVファイルの場合、「行末をあらわすCRLF」は内部的には
>U+000D U+000A で保持するとしたら、U+FEFF と U+FFFE あたりが内部コード用と
>しては空いています(BOMのため、このコードには文字を割り当てないことになって
>います)からそれを使うとか。

案をありがとうございます。
内部的な形式としては、行ごとに管理する情報を使ってなんとかできるかもしれ
ません。それが難しい場合は言われているように内部的なコードを埋め込んでお
く方法でもできると思います。
変更に伴ってクリップボードやマクロ、アンドゥ、エンコードの指定など様々な
ところに影響が出てくるので、それらの配慮が必要になってくると思います。
互換性も維持する必要があります。
というような感じで検討していきたいと思います。

[ ]
RE:22751 【要望】改行コードの文字コードNo.22752
HIDEO さん 07/03/20 23:15
 
秀丸担当さん、そして皆さんありがとう
ございます。

内部的に簡単なことではなさそうなこと
は多少理解できました。
今度の、いや次の次のバージョンでも良
いです。
気長く待たせてもらいます。よろしくお
願いします。
お体ご自愛しつつ頑張ってください。



[ ]
RE:22744 【要望】改行コードの文字コードNo.22899
HIDEO さん 07/04/27 00:26
 
お久しぶりです。現在の先行バージョンにて
「改行コードがCR,LF,CR+LFが混在するファイルを扱うこと
  ができるように」
上記を確認しました。すごく嬉しいです。本当に
ありがとうございました。

1つ気になることがあります。
それは、EXCELのセル内改行したセルをコピーして,
秀丸に貼り付けても(クリップボードを経由)、改行が正確に
反映されていませんでした。

実際は以下のような改行コードが入っていますが、
  ああああ[LF]
  いいいいい

秀丸にペーストすると以下になってしまいます。
  ああああ[CRLF]
  いいいいい

EXCELでは出来ない正規表現を使った置換等を秀丸で
実施して、EXCELに貼り付け直す作業をすることが出来
ないのがすごく残念です。
是非この点についてもご考慮お願いいただけたらと
思い投稿させていただきました。

すみませんが、どうかよろしくお願いいたします。

[ ]
RE:22899 【要望】改行コードの文字コードNo.22901
秀丸担当 さん 07/04/27 10:15
 

>1つ気になることがあります。
>それは、EXCELのセル内改行したセルをコピーして,
>秀丸に貼り付けても(クリップボードを経由)、改行が正確に
>反映されていませんでした。

クリップボードも考えましたが、クリップボードは全てのアプリケーションで共
通のフォーマットなので、基本的にはやるわけにはいかないです。

たとえば「Shift-JIS/CR+LF」のファイルと、「EUC/LF」のファイルを同時に
開いて相互にコピー貼り付けをすると、互いに改行コードが混在してとんでもな
いことが起きます。
改行=LFのテキストとメモ帳に貼り付けると改行が消えてとても長い一行になっ
てしまいます。

それが大前提として、どうしてもしたいという場合に[その他]→[動作環境]→
[編集]→[コピー&貼り付け]のあたりに、コピーで改行を区別するか、貼り付け
で改行を区別するか、の2つのオプションを追加したほうがいいかなとは思いま
した。

ちなみに
・「貼り付けでJISコードの自動認識をする」
・「貼り付けでUnicodeを使用する」をOFFにできる
というのが存在するのも、OutlookExpressやNetscapeでイレギュラーなコピーを
するものだから仕方なく付けたものです。

[ ]