2011-10-01から1ヶ月間の記事一覧

[python][テキストマイニング] 第5回 さくさくテキストマイニング勉強会で発表してきました。

QaA View more presentations from gepuro 書いたプログラムにバグがチラホラ・・・。例外処理の部分をほとんど書いてないのが原因なのは分かっているが直していない。 また、質問文の品詞を本文とパターンマッチして、探し出すと良いかもしれないと言うアド…

CaboChaによってXMLで出力されたファイルをパースする。

cabochaを用いて $ cabocha -f 3 hoge.txt > hoge.xml として出力されたXMLファイルはそのままでは、パースする事ができない。そのため、一手間加えてあげる必要がある。(事前に、一行毎に改行をしている必要あり) #!/usr/bin/python # -*- coding:utf-8 -…