現場で使えるIT技術のブログ

金融、流通、情報セキュリティプロジェクトなどの開発・運用・保守を経験したIT経験のあるまっちゃんが教えるIT技術者のための技術ブログです。

第5回[その他] 正規表現を知ろう

皆様、こんばんは


まっちゃん先生だよー


今回、なんだかんだで第5回目になりました。


今回のテーマは、ずばり正規表現です。


正直、全て知るのは不可能ですが、この正規表現を知っているのと

知らないのでは、パフォーマンスが明らかに違います。


例えば、数字ですが

1,2,3,4,5,6,7,8,9

である場合と、

[1-9]

の場合は、明らかに記述量が違います。


それがもう少し複雑な条件であれば明らか

先頭文字列が小文字英語の後の文字列がTRE,TYU,TEWのどれかであり、その後の末尾の数字が1-9のどれかとなる場合


・正規表現なし

aTRE1

aTRE2

...

zTEW9


・正規表現あり

^[a-z]T[RE|YU|EW][1-9]$


という感じで明らかに記載量が異なります。


このような正規表現ありに比べて、正規表現なしは、

26×3×9 = 702パターン記載しなければいけません。


正規表現ありだと1パターンでよいのに、

なければ702倍も手を動かす羽目になる。


こんなばかげた話はありません。


正規表現使えるならば、使えるに越したことはありません。

数字や文字、スペースやタブなど、基本的な正規表現さえ覚えてしまえば、

あとは、ITの現場で使うだけです。


正規表現と、ソースコードのきれいな書き方を、歯を磨くかのように

できれば、スーパーエンジニアに近い気がしますよ、はい。