機種依存文字について(Ver8.22対応版)
目次− 検索系コマンド− 正規表現− 機種依存文字について ●IBM拡張文字 Shift-JISの文字コードで 0xFA40〜0xFC4B の文字と 0xEEEF〜0xEEEC の文字はIBM拡張文字と呼ばれ、IBM選定のものとNEC選定のもので全く同じ文字であるのに違う文字コードが割り振られているものがあります。 これは機種依存文字といわれ、Windows以外では表示できないかもしれない文字です。 これらの文字は検索するとうまく検索できない場合があります。 HmJre.dllであいまい検索を使用して、同一視指定ファイルを指定することによってこれらの文字を同じ文字として解釈して検索を可能にすることもできます。 同一視指定ファイルは別途ダウンロードなどをして入手していただく必要があります。 このページ(http://hide.maruo.co.jp/software/hidemaru.html)の「HMJRE.DLL用のカスタム同一視指定ファイル」からダウンロード可能です。(2009年9月現在) EUCの補助漢字(3バイトの文字コード)にも同じ文字が割り当てられていて、これもうまく検索できない場合があります。 これをうまく解決する方法はいまのところありません。 正規表現を使って無理矢理検索する方法もあります。 例: 1.正規表現を使ってUnicode独自文字を探す。[^\x01-K] 2.「文字コード表示」コマンドなどを使ってUnicodeの文字コードを調べる。 3.[彅\u5f45]という感じで記述する。 または、Shift-JISの機種依存文字,EUCの補助漢字のいずれであっても、全てコピーしてから貼り付けすると文字コードが統一され、検索が可能になるという方法もあります。 Shift_JIS-2004(JIS X 0213版のShift-JIS)には全く別のコードにこれらの文字が割り当てられていますが、秀丸エディタはいまのところShift_JIS-2004には対応していません。 ●NEC特殊罫線 NEC特殊罫線には以下の文字コードの範囲があります。(Shift-JIS解釈) 0x8640〜0x869Eの半角のNEC特殊罫線 0x8540〜0x85FCの2バイトの半角文字 0x86A2〜0x86EDの全角のNEC特殊罫線 同様に、上記の正規表現の方法で検索できます。 ●Macintoshの機種依存文字 0x86A2〜0x86EDの範囲にはMacintoshの機種依存文字もあります。(NEC特殊罫線とかぶっています) 同様に、上記の正規表現の方法で検索できます。 |