単語の読みまで推定してくれるテキスト解析ツール KyTea
ひとまず試してみた。
以下の環境はSnow Leopardです。
wget 'http://www.phontron.com/kytea/download/kytea-0.1.0.tar.gz' tar xvfz kytea-0.1.0.tar.gz cd kytea-0.1.0/ ./configure make sudo make install
make uninstallで削除も可能。
echo "原理は単純を構造は複雑を極め人は最も人らしく" | kytea -out part 2> /dev/null 原-理/げんり|は/は|単-純/たんじゅん|を/を|構-造/こうぞう|は/は|複-雑/ふくざつ|を/を|極-め/きわめ|人/ひと|は/は|最-も/もっとも|人/ひと|ら-し-く echo "2chダウン問題で、データセンター運営企業はFBIに資料提出したことを明らかにした。" | kytea 2> /dev/null 2/UNK ch/UNK ダウン/だうん 問題/もんだい で/で 、/、 データ/でーた センター/せんたー 運営/うんえい 企業/きぎょう は/は FBI/UNK に/に 資料/しりょう 提出/ていしゅつ し/し た/た こと/こと を/を 明らか/あきらか に/に し/し た/た 。/ echo "攻殻機動隊" | kytea 2> /dev/null 攻殻/こうかく 機動/きどう 隊/たい