[python][cgi][テキストマイニング] ブラウザからtf-idfで特徴語抽出ができるプログラムを書きました

http://future.ddo.jp/cgi-bin/tm.cgiに置いてあります。シンプルな構成になっています。
操作方法は、

  1. 分析したいテキストデータをアップロードする。
  2. 特徴語抽出をクリックする。

です。
現在は、tf-idfによる分析しか出来ませんが、随時増やしていく予定です。テキストデータの容量は、サーバの性能を考慮して1MB以下のデータのみです。

精度は、現在調整中の為に優れていませんが、ニュースの記事は、うまく分析できているようです。