html文のテキスト変換ソフトNo.03772
鮎美 さん 03/06/22 14:00
 
以前から、HTML2TXT.MACを使わせていただいています。
でも、生意気をいうようですが、処理が遅くていらいらします。
もっとほかに処理の早いものはないでしょうか。
おたずねします。

[ ]
RE:03772 html文のテキスト変換ソフトNo.03773
ゆきち さん 03/06/22 16:06
 
H2Tconv
http://member.nifty.ne.jp/nekomimi/lzh/h2tconv.htm
なら、どうですか?
秀丸じゃないんですけど。

On Sun, 22 Jun 2003 14:00:52 +0900
鮎美 <64xxxxxxxxxxxxxx@maruo.co.jp> wrote:

> 以前から、HTML2TXT.MACを使わせていただいています。
> でも、生意気をいうようですが、処理が遅くていらいらします。
> もっとほかに処理の早いものはないでしょうか。
> おたずねします。

[ ]
RE:03773 html文のテキスト変換ソフトNo.03774
鮎美 さん 03/06/22 18:23
 
すみません。できたら秀丸のマクロがいいんですが...。
無理でしょうか。

>H2Tconv
>http://member.nifty.ne.jp/nekomimi/lzh/h2tconv.htm
>なら、どうですか?
>秀丸じゃないんですけど。

[ ]
RE:03774 html文のテキスト変換ソフトNo.03775
encodingshiftjis さん 03/06/22 22:55
 
>すみません。できたら秀丸のマクロがいいんですが...。

タグの形が単純なら、正規表現で高速処理できるのですが
そうも行かないので。本格的パーサーで早いのはちょっと

http://w3m.sourceforge.net/MANUAL
あたりも、Cygwin版のバイナリーがあります。

[ ]
RE:03774 html文のテキスト変換ソフトNo.03776
アルビレオ さん 03/06/23 05:49
 
アルビレオです。

>すみません。できたら秀丸のマクロがいいんですが...。
>無理でしょうか。

無理も何も、遅いとはいえ実現してますから…

大きなテキストを加工したいなら、秀丸のようなテキストエディタ本来の目的と
違うので荷が重いです。

実現したいのは秀丸のマクロを使うことじゃなくて、秀丸で開いているテキスト
を処理することですよね?
コマンドライン版の変換ツールがあれば標準入出力を利用して秀丸から外部ツー
ルにテキストを渡して処理することも可能です。

encodingshiftjisさんが紹介している w3m もそういうツールとして利用するこ
とが可能ですが、Cygwinも必要なことがネックですね。
あまりまじめに探していませんが、windowsのコマンドラインで変換できるツー
ルを見つけることはできませんでした。
いいものを知っている方がいれば紹介してください。

[ ]
RE:03776 html文のテキスト変換ソフトNo.03777
ひろ さん 03/06/23 12:18
 
 鮎美さん、アルビレオさん今日は、ひろです。
> あまりまじめに探していませんが、windowsのコマンドラインで変換できるツー
> ルを見つけることはできませんでした。
> いいものを知っている方がいれば紹介してください。
 http://int.parfait.ne.jp/arc/lynx285j-dev5.zip
等で入手できる lynx は如何でしょう?

 秀丸から利用するなら、マクロにも出来ますが、全て範囲選択した後、「プ
ログラム実行」で
c:\lynx\lynx.exe -cfg=c:\lynx\lynx.cfg -dump "%b" > con
等とすればよいです。

[ ]
RE:03777 html文のテキスト変換ソフトNo.03778
鮎美 さん 03/06/23 16:43
 
ひろさん、ありがとうございます。
さっそくダウンロードして使ってみました。
分からないところもいくつかありますが、
とにかく早いです。しばらく遊んでみます。

> http://int.parfait.ne.jp/arc/lynx285j-dev5.zip
>等で入手できる lynx は如何でしょう?
> 秀丸から利用するなら、マクロにも出来ますが、全て範囲選択した後、「プログ
>ラム実行」で
>c:\lynx\lynx.exe -cfg=c:\lynx\lynx.cfg -dump "%b" > con
>等とすればよいです。

[ ]
RE:03778 html文のテキスト変換ソフトNo.03779
vickwei さん 03/06/23 18:15
 
 既に解決なさったことかと思いますが、ひろさんが紹介されたのとは別のツー
ル利用ということで……。

 私は、「HtoX」(http://win32lab.com/fsw/htox.html)というソフトを利用さ
せて頂き、次のようなマクロを使っています。Windows2000を使っていますので
、「cmd」となっていますが、Win98系なら「command.com」となるかと思います


//---------------------
//htm2txt.mac
//htmlファイルを「C:\Temp\htm.$$$」に名前を変え、それをHtoxで処理してそ
の結果
//を「C:\Temp\txt.$$$」に出力する。

$FILE = filename;
if ( updated == 1) {
    save;
}

$filename1 = "C:\\Temp\\htm.$$$";
$filename2 = "C:\\Temp\\txt.$$$";
saveas $filename1;
runsync2 "cmd /c htox.exe " + $filename1 + " > " + $filename2;
openfile $FILE;
openfile $filename2;
#a = findhidemaru( $filename1 );
closehidemaru #a;
runsync2 "cmd /c del " + $filename1;
endmacro;
//---------------------

[ ]
RE:03779 html文のテキスト変換ソフトNo.03780
鮎美 さん 03/06/24 17:25
 
vickweiさん、ありがとうございます。
欲張ってこれも使ってみました。早いですね。感激です。
マクロの使い方が分からないので、ひろさんに教わったとおり、
「プログラムの実行」からよびだしてます。

> 私は、「HtoX」(http://win32lab.com/fsw/htox.html)というソフトを利用さ
>せて頂き、次のようなマクロを使っています。Windows2000を使っていますので
>、「cmd」となっていますが、Win98系なら「command.com」となるかと思います


[ ]