読者です 読者をやめる 読者になる 読者になる

あったこといろいろ

ほぼ自分用備忘録です。

Mac環境へのNLTK0.7の導入(OS X Yosemite 64bit)

O'Reilly Japan - 入門 自然言語処理に記載されているプログラムを動かすため、MacBookAirにNLTKとNumpyを導入しました。
英語をテキトーに読んでるといろいろ手間取ってしまった

使用した環境

手順

1.Setup toolのダウンロード

f:id:Yazaten:20141022094538p:plain

  • 一番下の方までスクロールしてグレーの表を見つけ、setuptoolをダウンロードする(今回はsetuptools-7.0.zipを選択したが、多分好きなやつでいい)

f:id:Yazaten:20141022095652p:plain

  • ダウンロードが完了したら解凍する


2.Pipのインストール

  • ターミナルのアプリケーションを起動し、先ほどのファイルを解凍後にできたファイルへ、cdコマンドを利用して移動する(例:「cd /Users/USER_NAME/Downloads/setuptools-7.0」)
  • sudo easy_install pip」コマンドを実行する


3.Numpyのインストール

  • sudo pip install -U numpy」コマンドを実行する


4.NLTKのインストール

  • sudo pip install -U nltk」コマンドを実行する


5.Test installation

  • python」コマンドを実行してpythonを起動させ、「import nltk」と入力する

何もエラーがでなければ恐らくインストールは成功、”ImportError: No module named nltk”といったようなエラーが出た場合は手順を間違えているか、私の実行環境とは異なる可能性がある。

6.bookデータをダウンロードする

  • nltk.download()」コマンドを実行する
  • 以下のような画面が開くので、bookを選択し、左下のDownloadボタンを押す(この画像はbookをダウンロード後の画像なので、Statusがinstalledとなっている点は気にしなくて良い)f:id:Yazaten:20141022131133p:plain

※このとき「 [Errno 60] Operation timed out 」と書かれた以下の画像のようなウィンドウが現れ、ダウンロードのためのGUIが起動しかなった。ここでテザリングによってインターネットに接続し再度コマンドを入力したところ、問題なくダウンロードを実行することができた。
f:id:Yazaten:20141022131703p:plain

7.bookモジュールの項目をロードする

  • from nltk.book import *」コマンドを実行する
  • text1」と入力した時、"<Text: Moby Dick by Herman Melville 1851>"というテキストの内容が表示されれば成功である


pythonにNLTKをインポートする手順は以上。