ふと DQ9 の Amazon レビューのデータを Amazon Web Service 使って取得して、それを分析してみたら面白いんじゃなかろうかと思ったので、軽くやってみた。
今回調べようと思ったのは以下の項目。
とりあえずこんぐらい調べたら、何かしら面白いものが見えてくるかもしれない。ちなみに5日で区切ったのは、大体ネガティブキャンペーンが盛り上がったのは5日程度っぽかったから。もうちょっと幅広く取って1週間にしても良かったかも知れない。
とりあえず評価毎に「総数」「5日目以降の投稿数」「5日以内の投稿数」「初日の投稿数」「5日目までとそれ以降の投稿数の比率」を出してみた。
評価 | 総数 | 5日目以降(a) | 5日目まで(b) | 初日 | b/a |
---|---|---|---|---|---|
★ | 248 | 75 | 173 | 37 | 2.30666666667 |
★★ | 220 | 102 | 118 | 26 | 1.1568627451 |
★★★ | 189 | 87 | 102 | 12 | 1.1724137931 |
★★★★ | 191 | 93 | 98 | 18 | 1.05376344086 |
★★★★★ | 151 | 86 | 65 | 16 | 0.755813953488 |
明らかに星1つのレビューが早い時期に集中している。お前ら何やってんだよ。それとは対照的に星5つのレビューは5日目以降に増加しているようにみえるが、これは DQ9 がクリア後のボリュームが半端なく、そこまで遊び込むようなプレイヤーはたとえ初日に買ったとしても評価を下すのが遅くなりがちで、そして DQ9 遊び込んでる時点で高評価を下す傾向にある、ということかな。
ついでに期間毎に評価の平均値を出すとこうなる。
期間 | 平均値 |
---|---|
全体 | 2.776777 |
5日目以降 | 3.029345 |
5日目まで | 2.575540 |
初日 | 2.541284 |
レビューの文字数を100文字刻みで区分けしてみたらこうなった。
評価 | 〜100 | 〜200 | 〜300 | 〜400 | 〜500 | 〜600 | 〜700 | 700〜 | 平均 |
---|---|---|---|---|---|---|---|---|---|
★ | 28 | 60 | 53 | 37 | 23 | 22 | 17 | 8 | 314 |
★★ | 6 | 42 | 45 | 38 | 41 | 14 | 21 | 13 | 367 |
★★★ | 9 | 34 | 44 | 28 | 25 | 20 | 13 | 16 | 368 |
★★★★ | 13 | 42 | 47 | 30 | 21 | 18 | 11 | 9 | 329 |
★★★★★ | 24 | 32 | 35 | 25 | 10 | 13 | 6 | 6 | 295 |
どのレーティングも200文字から400文字の間でかなりの数が収まっており、平均値の最小値と最大値の開きは70文字程度。今日の日記の第1段落が90文字程あるので、まあその程度の差しかない。どこぞのサイトでは「低い評価を下したレビュアーは具体的な記述をする傾向にある」とか書かれていたが、正直この程度の文字数じゃ記述の精緻さは大差ないんじゃないかと思う。ちなみに俺が書いた感想は7000文字を越えている。
あとせっかくだから発売日から今日に至までのレビューの投稿数を gnuplot でグラフにしてみた。
全体的に当たり前というか、予想通りの結果になっちまったなあ。
これらのデータを作るのに使ったソースコードを置いとくので、興味がある人はどうぞ。割と適当に書いてるので、あんま参考にならないかも。動かし方とかはソース見て解読して。
追記:コードに間違いがあったので修正。それに伴い、プロットしたグラフのみ最新のデータに差し替え。
この怪文書はクリエイティブ・コモンズ・ライセンスの元でライセンスされています。引用した文章など Kuwata Chikara に著作権のないものについては、それらの著作権保持者に帰属します。