GGG

プログラミング言語やソフトウェア開発について思ったことを書いてます

正規表現の理論的背景

〇タイトル

正規表現 技術入門

 

正規表現技術入門 ――最新エンジン実装と理論的背景 (WEB+DB PRESS plus)

 

正規表現の技術的・理論的な背景を平易に解説しているプログラマ向けの書籍。

正規表現をなんとく使えるレベルから、バックグラウンドにある理論を理解し使いこなせるようになるための様々なことにが解説されている。

数学的な面やコードレベルや最近の技術動向など。

 

個人的には平易ではなかった。だがすごい興味が湧いた。

正規表現を実現している背景にある理論や技術は面白い。

この本はしばらく手元において繰り返し読みたい。

 

正規表現エンジンのDFA型、VM型の2種に大別されるようだ。

それぞれのエンジンのコードリーディングもしてみようと思う。

DFA型エンジンのコードを読むのが先かな。

grepgoogle RE2 がそのようだ。

 

〇著者のslideshare

http://www.slideshare.net/sinya8282/presentations

GNU grep 

http://www.gnu.org/software/grep/devel.html

Google RE2

https://github.com/google/re2

RE2 (software) - Wikipedia, the free encyclopedia

米Google、高速・低メモリ消費の正規表現ライブラリ「RE2」を公開 | SourceForge.JP Magazine

backtracking regular expression engines らしい。

 

〇関連

The Prague Stringology Club

情報知識ネットワーク特論 | 北海道大学オープンコースウェア (Hokkaido University OpenCourseWare, HU-OCW, 北大OCW)