Pythonを使ってツイートをグラフにしてみよう！（月によって違いはあるのか？編）

こんにちは。ひと（@hito_waft）です。

前回自分のツイートから単語を抜き出して、簡単にグラフ化する方法を紹介しました。

前回は全ての期間を対象にグラフを作りましたが、今回は月によって単語の出現頻度に変化があるのか調べてみたいと思います。今回使うライブラリはpandas、numpy、matplotlibの三つです。なければpip3 installしておいてください。

（2017/4/12:追記あり）

こちらをご覧ください。

f:id:hwhw:20170406110349p:image

私が愛してやまない[Alexandros]の川上洋平さんについて言及したツイートの数を、月毎に平均したグラフです。6月から8月にかけてツイートが増えていることがわかります。これはたぶん、夏フェスなどでメディアへの露出が増え、それを見てかっこいいかっこいいとわめいていたのだと思います。

このように、全期間で作ったグラフだけ見ていてもわかりにくい季節の傾向などが可視化できるようになります。使い方はあなた次第。

13行目の"/hoge/tweets.csv"となってるところを、自分が保存した全ツイート履歴のCSVファイルのパスに書き換えます。
続いて20行目にキーワードを入れます。前回はいくつか同時にグラフを出すことができましたが、今回はややこしいので一度に一つだけ。{"label":"keyword"}の形式でlabelの所には凡例に出す名前を入れます。ここは文字化けするのでローマ字で。keywordにはツイートから抜き出したい単語を入れます。表記揺れ（猫、ネコ、ねこ等）は|（縦棒）で区切って入力します。例では"洋平|ようぺ"となっていますね。

そして実行するとグラフが出ます。色々キーワードを変えて遊んでみましょう。