mecabという形態素解析ツールをPythonで使うことになったので、環境構築!
mecabとは
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
文章を単語に自動で区切ってくれるソフトです。文章を意味で区切ることを形態素解析と言います。多分
Macではターミナル場で使えます。
Macでのインストールの仕方
homebrew
まずhomebrewを入れていない人は入れます。私は、先日slackbotを作るときに入れました。
Mecab
次にMecabを入れます。下のを一行ごと入れました。
brew install mecab brew install mecab-ipadic
一行ごとに、ダウンロードされます。
これでMecab入れ終わりました。
ターミナルで
mecabと入力して適当な文章を入れると
解析してくれました。
終了するにはCtrl+Cです!
Pythonで動かす
mecab単体は動きましたが、Pythonで動かすにはまだ何かを入れないといけません。
バイディング?というらしいです。何者かはわかりませんがこれを入れないとエラーがでてプログラムがちゃんと動いてくれませんでした。
入れるには、ノーマルな状態でターミナルに
pip install mecab-python3
でPythonで使えるようになります。
python2.7でも、pip install mecab-python3 でうまく動きました。
OSがSirriaの人
ただOSがSierraの時はpipがインストールできません。
この記事の下の方の解決法を参考にpythonをhomebrew経由でインストールし直したらできました。
brew update
でインストール
which python
で場所を確認。/usr/local/bin/pythonにあればオッケー
そして再び
pip install mecab-python3
で完了!
コードで動かしてみる!
pythonコードでMecabを動かしてみます。pythonと打って、対話モードにしてコードを打ちました。
できました!
参考
バイディング前まではこの記事を参考にしました。
バイディングの入れ方は↓の記事を参考にしました。
コメント
コメントもらいました。
PythonではないですがMeCabを使ってこのようなこともできます
MacOSXのSafariブラウザで
形態素解析の結果を表示したり
APPLE辞書やウィキペディア
などの検索結果をブラウザ内で直接プリントアウトできたりします
その他
バーコード付き商品アイテムの作成やプリントアウトにも対応しています
またブラウザの操作だけでゆうちょ銀行の払込取扱票に直接プリントする機能もあったりします
ぜひお試しください