ツイート履歴をpandasでcsvファイルに書き出し→読み込みするとズレる問題
上の記事に関連して小ネタを一つ。
ツイート履歴(tweet.jsから読み込んだもの)を編集した後に、再度csvファイルに書き出し(pandasのto_csv
)、その後pd.read_csv()
で読み込んだデータで、以下写真のようにna
が増えてしまうことがありました。
print(original_data.isnull().sum()) print(reloaded_data.isnull().sum())
その場合は書き出す際にline_terminator
を以下のように指定すればOK。
df.to_csv('tweet_data.csv', index=False, line_terminator='\r\n')