[python][cgi][テキストマイニング] ブラウザからtf-idfで特徴語抽出ができるプログラムを書きました
http://future.ddo.jp/cgi-bin/tm.cgiに置いてあります。シンプルな構成になっています。
操作方法は、
- 分析したいテキストデータをアップロードする。
- 特徴語抽出をクリックする。
です。
現在は、tf-idfによる分析しか出来ませんが、随時増やしていく予定です。テキストデータの容量は、サーバの性能を考慮して1MB以下のデータのみです。
精度は、現在調整中の為に優れていませんが、ニュースの記事は、うまく分析できているようです。