編集距離を求めるライブラリpylevenshteinの紹介
日頃の生活の中で、2つの文字列の編集距離を求めたいなあっと思うことは、しばしばあると思います。
そんな時に、手軽に使用することができるライブラリがpylevenshteinです。C言語で書かれていて、高速で処理することができるそうです。
ライブラリは、http://code.google.com/p/pylevenshtein/に公開されています。
いつも通りに、
$ sudo python setup.py install
でインストールできます。
実行例を
In [1]: import Levenshtein In [2]: print Levenshtein.distance("play","apple") 4 In [3]: print Levenshtein.editops("play","apple") [('insert', 0, 0), ('replace', 1, 2), ('replace', 2, 3), ('replace', 3, 4)]
また、ディレクトリ内にあるStringMatcher.pyをimportして使用することもできます。