視覚障害者のための
正規表現入門1



【正規表現って?】
世界には無限の単語や文章があります。
無限に存在する単語や文章から、一定のの特徴をとらえるための表記方法が正規表現です。
たとえば、小説で、

1章 エルサレムの門
2章 甦るダビデ
3章 荒野へ
4章 死海のほとり

などという章タイトルが並んでいるとしましょう。
この章タイトルの細部を見ると、すべて、

行頭、空白文字、全角数字 「章」という文字、1個の全角空白 任意の文字列、行末

という構成になっています。
つまりすべての章タイトルが同じ構造を持っています。同じ構造をもっているなら、その構造をなんらかの形であらわせば、その表現はすべての章タイトルにマッチするはずです。これが正規表現です。正規表現が使えると、検索などにおいて、ものすごい威力を発揮します。
「行頭、空白文字・・・行末」という上述の構成を、正規表現で書くと、

^\s+[0-9]+章 .+$

となります。(意味は今はわからなくてもいいです。)

おそらく、ここで、最初の問題が発生します。
これを読んでくださっているのが視覚障害者だとすると、スクリーンリーダーやホームページリーダーは、上述の正規表現を不完全な形でしか読み上げないはずです。
正規表現においては、括弧や記号、半角スペースを含めてすべての文字が意味をもちます。スクリーンリーダーやホームページリーダーは、通常、記号や空白は読み上げあげない設定になっていますから、困ります。1文字ずつ走査して読み上げさせるか、正規表現を書いた部分においては、すべての記号を読み上げる設定にする必要があります。
また、文字の半角全角、英大文字か小文字かも重要です。意味が変わります。
可能なら、半角全角、大文字小文字の区別を読み上げさせる設定にしたほうがいいでしょう。
正規表現そのものは、きわめて単純な表記法なのですが、この「読み上げ」という点が、視覚障害者にとって敷居を高くしているように感じます。

上の正規表現を読み上げ用の文字で書くと、

 「ハット、エンマーク、半角小文字エス、半角プラス、左半角大括弧、全角数字ゼロ、ハイフン、全角数字キュー、右半角大括弧、半角プラス、章、全角空白、半角ピリオド、半角プラス、ドルマーク」

となります。
正規表現、

^\s+[0-9]+章 .+$

を走査して1文字ずつ読み上げさせて確認してください。

ここでおそらく第2の問題が持ち上がります。
先頭にある「ハット」てどんな文字か、すぐに理解できた視覚障害者は少ないのではないかと想像します。これはサーカムフレックスと呼ぶ文字です。俗には山型記号と呼ぶこともあります。正規表現においてこの位置で使われたときは行頭を意味します。
つまり、視覚障害者の場合、正規表現を使いこなすためには、記号の読みを完全に覚えてしまう必要があります。この点がひとつのハンディキャップになるでしょう。晴眼者なら読みなどどうでもいいのですが。


 以上、正規表現についての概略と、視覚障害者にとっての注意事項でした。
 視覚障害者にとっては、この導入部分が、いちばん敷居が高いかもしれません。
 次項からは、実際の正規表現の構造に入ります。アウトラインエディタKELFのヘルプ用に書いたものを、一部改変して掲載します。
 記号の読み上げさえうまくやれば、正規表現そのものは簡単に理解できると思います。


次の項目へ
正規表現入門の目次ページ
文字主体トップページ







Copyright(C) 2003 Kazuhiro Kito All rights reserved