単語の読みまで推定してくれるテキスト解析ツール KyTea

KyTea (京都テキスト解析ツールキット)

via bsiyo on Twitter: "Google: KyTea: 京都テキストツールキット を試してみた - nokunoの日記 : http://d.hatena.ne.jp/nokuno/20100307/1267923299"

ひとまず試してみた。
以下の環境はSnow Leopardです。

wget 'http://www.phontron.com/kytea/download/kytea-0.1.0.tar.gz'
tar xvfz kytea-0.1.0.tar.gz
cd kytea-0.1.0/
./configure
make
sudo make install

make uninstallで削除も可能。

echo "原理は単純を構造は複雑を極め人は最も人らしく" | kytea -out part 2> /dev/null
原-理/げんり|は/は|単-純/たんじゅん|を/を|構-造/こうぞう|は/は|複-雑/ふくざつ|を/を|極-め/きわめ|人/ひと|は/は|最-も/もっとも|人/ひと|ら-し-く

echo "2chダウン問題で、データセンター運営企業はFBIに資料提出したことを明らかにした。" | kytea 2> /dev/null 
2/UNK ch/UNK ダウン/だうん 問題/もんだい で/で 、/、 データ/でーた センター/せんたー 運営/うんえい 企業/きぎょう は/は FBI/UNK に/に 資料/しりょう 提出/ていしゅつ し/し た/た こと/こと を/を 明らか/あきらか に/に し/し た/た 。/

echo "攻殻機動隊" | kytea 2> /dev/null
攻殻/こうかく 機動/きどう 隊/たい