とりあえず書きはじめ

このブログの内容

プロ野球のデータを、いろいろな視点から分析、可視化してみよう、という自己満足的なブログです。 ありがたいことに、ネット上で有志の方々がさまざまなデータを公開してくださっています (もちろん、MLBほど充実しているわけではないですが)。

そこで、そういったデータを使って、何かいろいろとできないかなぁ、と思った次第です。 また、自分のデータ分析スキルの練習も兼ねています。

ちなみにこのブログの著者は楽天ファンです。

注意

野球でデータ分析、というとよく聞くのがセイバーメトリクスです。

セイバーメトリクス - Wikipedia

もちろん、セイバーメトリクスの指標を扱うこともあるかもしれないですが、 このブログではセイバーメトリクスにこだわるつもりは全くなくて、適当にいろいろとやってみようと思っています。 ちなみに、自分自身、セイバーメトリクスにそんなに詳しいわけでもありませんので、そのあたりも今後勉強していきたいな、と思っています。

とりあえず

まぁ試しに、ということで。

2016年の全試合結果を、得失点でマップ化しました。

f:id:k0_bbdata:20170222225047p:plain

グラフの見方

  • 横軸がホームチームの得点、縦軸がホームチームの失点(=ビジターチームの得点)を表しており、該当する試合数によって色が変わっています。
    • 該当する試合がなかった場合は白、該当する色が少ないと緑、そして、該当する試合数が多いほど、青が濃くなります。
    • 例えば、右端の方にぽつんと存在する緑の点は、 ホームチーム 22 - 6 ビジターチーム の試合が1試合だけあったことを示しています。
  • 星印は、最も試合数が多かった ホームチーム 3 - 2 ビジターチーム を表しています。
  • 斜めの赤い破線は、ホームチームの得点=失点のグラフです。つまり、この破線上の点は引き分けの試合を表しています。
  • 縦横の黒い破線は、それぞれの軸の平均を表しています。

グラフからわかること

  • ホームチーム 3 - 2 ビジターチーム の試合が最も多くて、その周辺のスコアの試合が多い
    • ただし、なぜか ホームチーム 2 - 2 ビジターチーム の試合は1試合もなかった
  • 意外と2桁得点の試合も見られるが、両チーム2桁得点なのは、 ホームチーム 13 - 12 ビジターチーム の1試合のみ
    • ホームチーム 10 - 9 ビジターチーム は割とある

馬鹿試合が多い、みたいに、試合傾向みたいなのがわかるかなぁ、と思ったのですが、まぁぶっちゃけよくわからない結果になってしまいました。

まとめ

というわけで、こんな感じでなんとなくデータをまとめたり、可視化できたりなぁと考えています。 それが種々の知見を得られるような結果のときもあれば、今回のような、とりあえずできたけどよくわからない結果のこともあると思います。 まぁとりあえずいろいろと載せていくつもりですが、基本的には自己満足のものなのであしからず。。。