Diary?

2009-08-14
Fri

(01:58)

ふと DQ9 の Amazon レビューのデータを Amazon Web Service 使って取得して、それを分析してみたら面白いんじゃなかろうかと思ったので、軽くやってみた。

今回調べようと思ったのは以下の項目。

  • 明らかにレビューの日付がおかしいデータを弾いた結果(どういうわけだか 2008 年とかに書かれたことになってる奴がある)
  • 発売してから5日以上経ってからのレーティング
  • 発売5日以内のレーティング
  • 発売日に投稿されたレビュー
  • 発売5日以内とそれ以降での投稿数の比率
  • レーティング毎のレビューの文字数

とりあえずこんぐらい調べたら、何かしら面白いものが見えてくるかもしれない。ちなみに5日で区切ったのは、大体ネガティブキャンペーンが盛り上がったのは5日程度っぽかったから。もうちょっと幅広く取って1週間にしても良かったかも知れない。

とりあえず評価毎に「総数」「5日目以降の投稿数」「5日以内の投稿数」「初日の投稿数」「5日目までとそれ以降の投稿数の比率」を出してみた。

評価総数5日目以降(a)5日目まで(b)初日b/a
24875173372.30666666667
★★220102118261.1568627451
★★★18987102121.1724137931
★★★★1919398181.05376344086
★★★★★1518665160.755813953488

明らかに星1つのレビューが早い時期に集中している。お前ら何やってんだよ。それとは対照的に星5つのレビューは5日目以降に増加しているようにみえるが、これは DQ9 がクリア後のボリュームが半端なく、そこまで遊び込むようなプレイヤーはたとえ初日に買ったとしても評価を下すのが遅くなりがちで、そして DQ9 遊び込んでる時点で高評価を下す傾向にある、ということかな。

ついでに期間毎に評価の平均値を出すとこうなる。

期間平均値
全体2.776777
5日目以降3.029345
5日目まで2.575540
初日2.541284

レビューの文字数を100文字刻みで区分けしてみたらこうなった。

評価〜100〜200〜300〜400〜500〜600〜700700〜平均
28 60 53 37 23 22 17 8 314
★★ 6 42 45 38 41 14 21 13 367
★★★ 9 34 44 28 25 20 13 16 368
★★★★ 13 42 47 30 21 18 11 9 329
★★★★★ 24 32 35 25 10 13 6 6 295

どのレーティングも200文字から400文字の間でかなりの数が収まっており、平均値の最小値と最大値の開きは70文字程度。今日の日記の第1段落が90文字程あるので、まあその程度の差しかない。どこぞのサイトでは「低い評価を下したレビュアーは具体的な記述をする傾向にある」とか書かれていたが、正直この程度の文字数じゃ記述の精緻さは大差ないんじゃないかと思う。ちなみに俺が書いた感想は7000文字を越えている。

あとせっかくだから発売日から今日に至までのレビューの投稿数を gnuplot でグラフにしてみた。

全体的に当たり前というか、予想通りの結果になっちまったなあ。

これらのデータを作るのに使ったソースコードを置いとくので、興味がある人はどうぞ。割と適当に書いてるので、あんま参考にならないかも。動かし方とかはソース見て解読して。

追記:コードに間違いがあったので修正。それに伴い、プロットしたグラフのみ最新のデータに差し替え。

Creative Commons
この怪文書はクリエイティブ・コモンズ・ライセンスの元でライセンスされています。引用した文章など Kuwata Chikara に著作権のないものについては、それらの著作権保持者に帰属します。