こんにちは!!ようこそ、当ブログgcbgardenへ。管理人のsakurabaaa(@sakurabaaa_g)です。
前回はtwitterのAPIを使ってターミナルからツイートしてみるという記事を書きました。
ツイートの次は情報を収集してみようと思い、あるキーワードが含まれるツイートをCSVファイルに出力するというプログラムを作ってみました。
- MacOSSierra(ver.10.12.5)
- Pythonのバージョンは2.7.13
Twitter API操作の準備
まずはじめに、TwitterのAPIを使うためにデベロッパー登録を行う必要があります。
以下のリンクにとっても親切な解説ページが準備されているのでまずは登録を済ませましょう。
登録を行うプロセスで以下の4つのキーをメモしておいてください。
- Consumer Key(API Key)
- Consumer Secret(API Seacret)
- Access Token
- Access Token Secret
登録と各APIキーなどが準備できたら次のステップに進みます。
Twitterのモジュールをインストール
Python-twitterのモジュールをターミナルからインストールします。
Macユーザーの方は、Homebrewをインストールしておくと便利です!
さて、ここまで準備ができたら実際にコーディング(コピペ)をしていきます。
下に書いたコードをテキストファイルに記述し拡張子を.pyにしたものを保存します。
※「’xxxxxxxxxxxxxxxxxxxxxxxxxxxx’」 の x の部分を先ほどメモしたAPIに書き換えてください。
今回は、当サイト「gcbgarden」が含まれるツイートを収集するプログラムになっています。
自由に書き換えてください!!
実際にツイートを収集してみる!
ここまでできたら準備完了OK!!
実際にコードを実行してみましょう!! 今回、ぼくは「tweetcsv.py」というファイルで保存しています。
ターミナル上で実行すると…
同じディレクトリ階層で「tweetcsv.csv」 というファイルが生成されます。
csvファイル内を確認してみてください。指定した文字列を含んだツイート内容が羅列されています。
UnicodeEncodeErrorの解決方法
もしこのようなエラーメッセージが表示されてしまったら、、、
「sitecustomize.py」内に以下を書き込みます。
エンコーディング情報については、以下のようにして確認できます。
これで再度pythonコマンドを実行してみると成功するはずです!!
まとめ
モジュールの仕様上、最大100件までしか収集できないようなので上限を解放する方法とツイートされた時間がわかるようにしてみます。
twitterの可能性をどんどん広げていきます!!
(いまさらww)
この記事を書いた人。
20代。とあるネットベンチャーでがんばる働き屋さん、ブロガー。
書きたいことを気ままに書いてます!
Python、プログラミング、米株、カメラ、野球観戦がすき。趣味は新宿散策。