6月18日(月)

朝めっちゃくちゃ眠くて、研Cの1階のドアに向けて自分の家の鍵さしかけました、おかげで目が覚めました

とりあえずどれかのジャンルの分析を中間発表までにということで好きなゲームでまずやります!!

…と実際にツイート収集しようとした時に、
・特定のユーザー何人かのみのゲーム名を含むツイートを収集するか
・ゲーム名で検索して(ヒット数が多いものは上限を設け)1つずつ属性を分けていくか
と悩みました。

前者のメリットは、あらかじめ特定のユーザー(複数名)を決めているので属性別にするのが簡単。
デメリットは、データに偏り(極端に怒りっぽい人を対象にしてしまうなど)が出来てしまうかもという可能性。
後者のメリットは、公平(?)にデータが取れるので事実により近い結果が得られる。
デメリットは、キーワード検索だとユーザー数が莫大になり属性別にするのが大変そうだということ。

キーワード検索で引っかかったツイートから属性を見極めるのはとても難しそうなので、どうすれば…
属性別にしてもらうプログラミングを書ける気もしないし、出来たとしても検索に引っかかった一人一人を調べていくのも大変そう(;_;)
属性分けを手動で行って良いなら喜んでやりますが!!手動が良い…手動…

どっちの方法で収集するにしても、今のコード(?)では足りていない部分があるので調べながら書き足しているのですが、まーーーた時間がものすごいかかってます。

家に帰って色々いじって、特定のユーザーからゲーム名(キーワード)を含んだツイートのみの取得出来るようになりました~~!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です