2010年08月01日

野球におけるデータとは -その1-

はじめに

 このたび新しいカテゴリとして、野球統計講座を作ってみました。

 これまでは本編で用いた統計分析の解説として補足コラムを用意していましたが、本編の記事の数値の内容がわかればいいと思い、かなり省略して書いていました。しかし、それが原因で記事にわかりにくいところがあったり、こちらも説明しにくいところがあったので、やっぱりちゃんと説明していこうと考えました。

 最終的には補足コラムを吸収合併していく予定なのですが、まずはデータに関する基本的な見方や扱い方の説明を中心に、そのうち分析手法の解説へと移っていきます。とはいえ、あまり数式うんぬんには触れず、データの意味を伝えればと考えています。

 と、偉そうに解説するなどといっておりますが、元来横着で間の抜けた人間なので、わかりにくいところも多々あると思います。読んでくださる方でわからないところがあればどうぞ指摘してください。



野球におけるデータとは?

 では野球統計講座第一回です。

 野球におけるデータとは?という問いに対して答えは2種類あります。それは以下の2つです。

①記録
 野球ではひとつの試合であまりにたくさんの出来事が起こるので、漫然と見ているだけでは全てを記憶する事ができません。そのため記録が必要になります。

 したがって記録とは

  ・どちらのチームに何点入ったか
  ・ヒットの数は何本か
  ・投手は何球投げたか
 
 などといった、データがそれにあたります。もちろん公式に記録されるもの、記録されないものも含め、他にも多くの記録があります。

②記録をまとめたもの
  野球では、年間に数多くの試合をこなすため、記録がたくさん蓄積されていきます。少ない試合であれば、記録をみれば簡単に評価ができますが、蓄積が増えればすぐにはわからなくなってしまいます。

例えば、これはある打者の20試合分の打席数と安打数の記録です。この打者は良く打っているのでしょうか?

 打席数:4, 4, 4, 5, 3, 4, 4, 3, 4, 4, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4
 安打数:1, 1, 3, 3, 1, 1, 0, 1, 1, 1, 0, 2, 1, 1, 1, 3, 1, 1, 2, 0

 とりあえず、安打数にところどころ3があるので結構打っているような気がします。しかし、これが50試合分、100試合分と増えていくともう判断ができません。そこで、記録をまとめる必要があります。

記録のまとめ方

 野球における記録は有限(とはいえたくさんあります)ですが、記録のまとめは角度を変えれば幾らでも作ることは可能です。しかし、大きく分けて2種類に分ける事ができます。

 ・数値で要約する
 ・視覚的に整理する

以上の2点です。

・数値で要約するとは、私達がよく目にするデータがそれにあたります。

 例えば、先ほどのデータを打率にすれば.320になります。40個の数値が1つの数値で要約できました。この打率であればかなり打っているといえそうです。(ちなみにこのデータは、2009年の巨人のラミレス選手の開幕20試合の成績です)

・視覚的に整理するとは、図表にまとめることをさします。

 例えば、先ほどのデータを一日ごとの打率の推移としてグラフ化が可能です(図1)。

図1
 平均すると.320という打率ですが、その変動がよく分かると思います。 これらの記録のまとめ方にはそれぞれ問題があります。 数値での要約では、要約の過程で大切な情報が削ぎ落とされてしまうという短所があります。  例えば打率ですが、この指標ではシングルヒットを10本打っても、本塁打を10本打っても同じ成績になってしまう。という問題があります。  この件に関しては、また後日に詳しく説明します。 視覚的に整理するのにも問題があります。  図表のデザインによって印象が操作されてしまうということです。  例えば図2と図3をご覧ください。
図2
図3
 これは図1と同じデータをグラフ化したものですが、縦軸の最大値と最小値を変えてあります(もっと露骨にやる事も可能です)。  縦軸の値をよく見れば分かることなのですが、人間の目とはいい加減なもので、ぱっと見ただけでは図表によって異なる印象を抱いてしまいます。ここではずっと表示してありますから見直す時間がありますが、短時間だけ表示されるようだとさらに印象は操作されやすくなります。  ちなみに、このような印象操作は世の中では結構頻繁に行われています。野球に限らずデータはよく見ていないと知らないうちに騙されているかもしれません……。  以上の2つのまとめ方には一長一短あり、基本的には併用することが望ましいです。


おわりに

 セイバーメトリクスについてWikipediaを読んでみると、

「野球はデータではなく人間がプレーするもの」という反論もあることが紹介されています。

 しかし、ここまで読んでいただければこの反論が少し的を外れているのがわかっていただけると思います。

 なぜなら、人間のプレーした記録を整理したものがデータであるからです。

 とはいえ、これは反論というよりは、馴染みのない数値が羅列されている事に対する感情的な反発であると思います。



 なぜなら、このような反論をする人も、名球界入りした往年のスターを語るときには、
「あの投手はは何勝もした」と、データで語るからです。

(ディスカバリーチャンネル ベースボール革命:勝利の統計学より言葉を借りました )



 しかしながら、こうした感情的な反発をぐっとこらえて、データをよくよく見ていけば、今までに無かった角度で野球を見ることができるのではないでしょうか。

 本ブログでは、データをよくよく見ていくお手伝いをする事で、セイバーメトリクスの端くれを担っていけたらと考えています。

 今日はこの辺りで失礼します。

引用文献
 ディスカバリーチャンネル ベースボール革命:勝利の統計学 
 出演: ビル・ジェイムズ, マイク・ピアザ 
 角川書店

posted by student |01:00 | 野球統計講座 | コメント(0) | トラックバック(0)
このエントリをlivedoorクリップに登録 このエントリをはてなブックマークに登録 newsing it! このエントリを Buzzurl に追加

トラックバックURL
このエントリーのトラックバックURL:
http://www.plus-blog.sportsnavi.com/student/tb_ping/14
コメントする

「他サービスID/メールアドレス」で投稿する場合は、そのID/メールアドレスは表示されず、当サービス専用の固定のコメント投稿者ID「英数+連番」に変換され表示します。

※コメント投稿手順
(1)上記リストから希望のIDを選択する。
  例: Yahoo! JAPAN IDでコメント投稿
(2)Yahoo! JAPAN上の本人確認画面でIDとパスワードを入力する。
(3)スポーツナビ+blog側のコメント入力画面が表示される。
(4)コメント本文を記入し、投稿ボタンをクリックする。
(5)コメント投稿者IDとコメントが表示される。

詳しくは以下2ページをご覧下さい
【仕様変更】PCからのコメント投稿について
ブログ利用マニュアル「コメント投稿方法」

※コメント投稿手順
(1)上記リストからログイン/メールアドレスのどちらかを選択する。
  例: ログインしてコメント投稿
(2)plus-blogのアカウントとパスワード/メールアドレスを入力する。
(3)コメント入力画面が表示される。
(4)コメント本文を記入し、投稿ボタンをクリックする。
(5)コメント投稿者IDとコメントが表示される。

詳しくは以下2ページをご覧下さい
【仕様変更】PCからのコメント投稿について
ブログ利用マニュアル「コメント投稿方法」