あいまい検索の設定ダイアログボックス(Ver3.54対応版)
半角/全角を区別しない
 半角文字と全角文字を区別しないで検索します。例えば半角文字の「A」を検索して、全角文字の「A」にもヒットするようにします。
 半角のカタカナと全角のカタカナも区別せずに検索するようになります。


全角文字で、ひらがなとカタカナを区別しない
 全角のひらがなと全角のカタカナを区別しないで検索します。例えばカタカナの「ア」を検索して、ひらがなの「あ」にもヒットするようにします。
 ここのオプションと「半角/全角を区別しない」の両方をONにすると、半角カタカナと全角カタカナと全角ひらがなをすべて区別せずに検索するようになります。例えばひらがなの「あ」を検索して、半角カタカナの「ア」にもヒットするようになります。


大きい「あ」と小さい「ぁ」を区別しない
 ひらがな/カタカナの大きい文字と小さい文字を区別しないで検索します。具体的には「あいうえおやゆよつ」の文字と「ぁぃぅぇぉゃゅょっ」を区別しないで検索します。
 全角ひらがな、全角カタカナ、半角カタカナそれぞれについて区別しないようになります。ここのオプションと他のオプションはすべて合成可能なので、例えばここのオプションと「半角/全角を区別しない」の両方をONにすれば、全角ひらがなの「あ」を検索して、全角カタカナの小さい「ァ」にもヒットするようになります。


濁音/半濁音を無視する
 濁音/半濁音を無視して検索します。例えば「は」を検索して「ば」にも「ぱ」にもヒットするようにします。
 このオプションをONにすると、濁音/半濁音をすべて除去して検索するようになります。その副作用として、例えば濁音のみの「゙」だけを検索することは出来なくなります。


かなの「ー」と英数字の「−」を同一視する
 かなの「ー」(文字コード815B)と英数字の「−」(文字コード817C)を同一の物と扱って検索します。半角の文字コードB0と文字コード2Dについても同じ扱いとします。
 かなの「〜」やその他の横棒風の文字についての同一視はしません。


空白/タブ文字を無視する
 空白/タブ文字を無視して検索します。例えば「AB」を検索して、「A B」のような途中に空白の入った文字列にもヒットするようにします。半角空白、全角空白、タブ文字を無視します。
 このオプションをONにすると、空白/タブ文字をすべて除去した形で検索するようになります。その副作用として、空白やタブ文字のみを検索することは出来なくなります。


UnicodeのIVS(異体字セレクタ)を無視する
 Windows8から、ユニコードでの「異体字セレクタ」(Ideographic Variation Selector)という仕組みがサポートされて、それを使うことで、例えば葛飾区の「葛」と葛城市の「葛」とで微妙に字体が違う物を両方表現出来るようになりました。ところが、それがあると、同じ「葛」の文字で検索しても葛城市の「葛」にヒットしないといった問題が起きる可能性があります。
 ここのオプションをONにすると、異体字セレクタを無視して検索するので、結果として「葛」で「葛」の異体字すべてにヒットするようになります。
 異体字セレクタの仕組み字体はWindows7でも有効で、異体字セレクタ対応のフォント(IPAmj明朝等)をインストールすることで使えるようになります。


改行を無視する
 改行を無視して検索します。例えば、「AB」を検索して、行末に「A」があって次の行の行頭に「B」があるような状況でもヒットするようにします。
 改行を無視すると言っても、実際に改行を完全に無視して検索するためには、検索対象のテキストファイル全体をまとめて検索しないといけなくなって、非常に都合が悪いです。そこで、「最大改行数」を別に指定しないといけません。最大改行数を多くすると、それだけ多くの改行を含んだ文字列にヒットするようになりますが、その代わり、検索速度は遅くなります。
 ここのオプションをONにすると、改行を除去した形で検索が実行されます。その副作用として、改行文字そのものを検索することは出来なくなります。


特定文字を無視する
 ユーザー側で指定された、特定の文字を無視して検索します。例えば"ABC"という指定をした場合、AとBとCの3種類の文字を無視して検索します。
 無視する対象の文字には、全角文字も含めることが出来ます。
 例えば文章中に「※1」〜「※9」のような文字が混じっているとして、それを無視して検索させたい時は、"※0123456789"という文字を無視対象に指定すればいいです。
 無視する対象に指定した文字は検索できません。なので、例えば上記のような0〜9すべてを無視対象に指定した場合には、数字の検索が出来なくなります。


カスタム1〜カスタム4
 ユーザー側で用意した同一視指定のそれぞれを有効にするかどうか指定します。
 同一視指定用のファイルは、右側の「参照...」ボタンを押して指定します。

 同一視指定ファイルの作成方法


HmJre.dll固有のヒープ領域を使う
 このオプションは、秀丸エディタでメモリ不足のエラーが出てしまう特定ユーザー様にテストしていただく用に作ったオプションで、現在はこのオプションをONにするメリットは無いです。普通はOFFにしておいてください。
 ここのオプションをONにすると、HmJre.dllで使う動的なメモリ領域が、プロセスの持ってるヒープとは別空間になり、結果として、もしもHmJre.dllがメモリを破壊するような処理やメモリリークのバグを発生させたとても、呼び出し元のプロセスのヒープを破壊したりメモリ不足にさせたりってことが無いようになります。ただ、これをONにすると、ヒープ領域のサイズがかなり制限されて、非常に複雑な正規表現パターンの検索や極端に長い文字列に対する検索をした時にHmJre.dll側でメモリ不足が起きる可能性があります。


注:大文字/小文字の区別について
 大文字/小文字を区別するかしないかについては、あいまい検索の呼び出し元の設定に従います。あいまい検索の設定ダイアログボックス上にはこのオプションはありません。

 呼び出し元の設定で「大文字/小文字を区別しない」と指定された場合、あいまい検索側では半角英字の大文字/小文字を区別しないだけでなく、全角英字についても大文字/小文字を区別せずに検索します。


注:正規表現ONとの組み合わせについて
 あいまい検索と正規表現の両方をONにして検索すると、一部期待する文字列にヒットしない可能性がありえます。例えば1つ分かっている例として、「(pattern){n}」のような、マッチする回数指定を指定した場合、それが期待した文字数にうまくヒットしないことがあります。
 例えば「ド{3}」のような検索をして、それが「ト゛ト゛ト゛」のようなトータル6文字にヒットする、というようなことがありえます。
 例えば「無視する指定」に指定された文字は、検索の処理の中で、対象文字を除外したような検索が実行されます。それによって期待した検索結果が得られないことがあります。
 その辺ご注意ください。



戻る