|
>WideCharToMultiByte相当の変換をしています。
>seterrormode 3,0x20;
>saveas "xxxx.txt",sjis;
>といった感じで保存するとこれに近い結果が得られることになると思います。
上はSJISで、強制保存し場合と同じですよね。
一応マクロで試してみました。
左端にあるのが、unicodeを
seterrormode 3,0x20;
saveas "SJIS類似保存.txt",sjis;
で保存後読み直した記号です。
? 0x2122 &trade 小さな "TM"
R 0x00AE ® ○の中に 大文字の R
? 0x2013 endash 短いダッシュ
? 0x2014 emdash 長いダッシュ
A 00C4 capital letter A with diaeresis, いわゆる独語のAのウムラウト
e 0x00E9 latin small letter e with acute (人名Preziosi等 の "e" 上に "`" が
付いたような文字、仏語か),
"?" 0x00A0 no-break space = non-breaking space kakususpace 見かけspace " "
と同じ
"!" 0x00A1 inverted exclamation mark (!) をさかさまにしたもの
"¢" 0x00A2 cent sign "c" に "/" が刺さったような通貨のセント
"£" 0x00A3 pound sign
"?" 0x00A4 currency sign 小さい○を囲む四角の四隅から短い線の出ている記号
"\" 0x00A5 Yen
"|" 0x00A6 → 0x007C broken bar = broken vertical bar
"§" 0x00A7 SJISにもある
"¨" SJISにあり 0x00A8 diaeresis = spacing diaeresis ウムラウトの点2個部分
"c" 0x00A9 © ○の中に 小文字の c
"a" 0x00AA feminine ordinal indicator 小さいaにアンダーライン
"A" 0x00C2 Latin capital letter A with circumflex
"A" 0x00C3 latin capital letter A with tilde
"?" 0x2264 ≤ less-than or equal to ≦の=部分が一本線の記号
"?" 0x2265 ≥ greater-than or equal to ≧の=部分が一本線の記号
"±" 0x00B1 plus-minus sign = plus-or-minus sign はSJISの±と同じ
""
以上は、ほんの一部ですが、"?" のついたもののうち、医学論文に出てきそうなもの
にだけ、適当な変換を自分のマクロで独自に用意すればよいということになりますね。
例えば、no-break spaceは見かけspaceと同じなので "?"ではなく、SJIS のspace
にしておけばいいし2種類のダッシュもハイフンと全角ダッシュにしておけばよさそ
うです。currency signはまず出てこないので無視し、 &le, &ge はそれぞれ ≦、
≧にしておけばよさそうです。、
また、タグにも使われる "<"や">"はHTMLからの取り出し では"<z"、">"とな
って表示されるので直接変換します。
このやり方で十分ですので、特に変換テーブルは必要なくなりました。
ありがとうございました。
|
|