2008年07月08日
UZR runsの求め方
コメント欄でご質問がありましたので、調べてみました。 http://www.baseballthinkfactory.org/files/primate_studies/discussion/lichtman_2003-03-14_0/ 上のリンクから抜粋してます。 またSuper-LWTSについては今回は省いています。
この評価に含まれていないスキル。 ☆外野手のスローイング能力。 ☆内野手のゲッツーに関するスキル。 ZRとの違い。 ZRは「打球がエリア内に飛びそれをアウトにした回数」を「エリア内に飛んだ打球数」を割ったもの。 ※実際にはアウト処理したエリア外の打球数も含まれている。 UZR rate は平均との比較をしたものである。 UZR runs ただしUZRの真の目的はUZR runsを求めることだ。 UZR runsとは、ある野手が、”そのシーズン”の”そのリーグにおいて””そのポジションにおける”平均的な選手と比較し、如何に失点を防いだかを代弁するものである。 どんなデータを使用するか? http://www.retrosheet.org/location.htm このゾーンに飛んだ打球がデータ収集の対象となりますが、全てではない。 ☆内野手の場合は、バントを含んだゴロのみで、ポップフライやライナーはそれらの結果に関わらず含まれていない。 ☆外野手の場合は、フェアグラウンドに飛んだライナーとフライが対象。 ☆また共通としてファールグラウンドは、上のリンク上の3Fと5Fの部分を除いて対象外。 ☆投手と捕手は対象外。 以上のルールに則り以下のデータを収集していく。 1、そのゾーンへ飛びヒットになった打球の数。 2、1のそれぞれの得点価値を評価し、その平均を出す。 ※評価には”traditional lwts”を使う。 http://www.tangotiger.net/bsrexpl.html ※上のリンクは1990年までのデータ。 実際には年毎+リーグ毎のデータが使用されているようだ。 3、そのゾーンへ飛んだ打球で、アウトになった数を、そのポジションごとに集計する。 4、同時にエラーの数を”ROE”と”non ROE”にカテゴリー分けしてポジションごとに集計する。 ※ゾーン毎の集計ではない。 ※ROE:出塁させてしまったエラー。 ※non ROE:ROE以外のエラー。 例えばヒット後の打球処理に起こったもの、或いはエラーにさらに重ねてしまったエラーなど。 以後はサンプルを使って説明していく。 2002年のゾーン56のデータ。 Zone 56 Hits Outs Run Value per Hit All Plays 1055 1419 .472 SS 294 3B 1125 サンプルの対象とする選手はMike Bordickで次のデータを集計する。 1、彼がSSを守っていた時に、それぞれのゾーンに飛び、ヒットとなった打球の数。 2、彼がSSを守っていた時に、それぞれのゾーンに飛び、アウトとなった打球の数。 3、彼がSSを守っていた時の、”ROE”と”non ROE”エラーの数、繰り返すがゾーン毎ではない。 以下がゾーン56におけるその結果。 Zone 56 Hits Outs Bordick 79 18 ”ROE”と”non ROE”については後述。 いよいよ計算に入るが、若干込み入っているので、注意深く読むように。 とりあえず、ROEエラーをアウトとカウントする。 また、ROEエラーは、その野手が打球を捕球後送球し、それを受ける野手にも影響を受ける場合がある。 その場合は送球した野手にアウトが加算されるべきである。 ”ROE”と”non ROE”については後ほど加算する。 つまり上のBordickのOuts18はアウトの数+ROEエラーの数である。 さてBordickのゾーン56におけるUZR runs を計算してみよう。 まずはベースとなるゾーン56のアウト率を計算する。 2002年のゾーン56のデータより、アウトになった数は1419で打球の総数はこれに安打数を足した2474本である。 つまりアウト率は1419÷2474で求められる。 これによりアウト率は約57%、つまり一本につき約0.57本がアウトとなると考えられる。 逆に考えれば1本からこの数字を引いた0.43本がヒットとなっているわけだ。 このことから、このゾーンへ飛んだ打球を一回アウトにするということは、同時に0.43本のヒットを防いだと考えられる。 これを元にBordickのゾーン56におけるアウト分を評価すると、18本 x 0.43本で求められ7.7本となる。 次にヒット数についてであるが、Bordickのデータ中のヒット数は79本となっているが、ここは三遊間のエリアなので79本全てがBordickの責任ではない。 ではこのうちどの程度が彼の責任範囲になるのであろうか? 2002年のゾーン56のデータに戻って考えてみよう。 ゾーン56でアウトで処理された総数は1419で、その内SSが処理したものは294、3Bが処理したのは1125本であった。 つまりこのゾーンにおけるSSの処理率は、294÷1419と考えられ、約20.7%となり、これを同時にヒットの責任分担率とする。 このことから、ゾーン56にBordick分ヒットの数は79本 x 20.7%で16.4本となる。 つまり16.4本のヒットを許したということは、同時にアウトにする機会を失ったとも考えられる。 先ほど、1本アウトにするたびに0.43本のヒットを防いだという考え方で価値を求めたが、今回もそれと同じ。 16.4本ヒットになったことにより、失ったアウトの数は、16.4本 x 0.57本で求められる。 結果は9.4本となるが、失ったものであるので、当然マイナスが付される。 これに先ほど計算した7.7本を加算する。 -9.4本+7.7本=-1.7本 つまり、リーグの平均的なSSが、Bordickの代わりに守備に就いたとするならば、ゾーン56においては彼より1.7個ほど多くアウトを奪えたと考えられる。 今度はこれを失点をどれだけ防いだかに置き換える。 ゾーン56へ飛んだ打球のヒットの得点1への貢献度は、約0.47と”2002年のゾーン56のデータ”によって導かれている。 また2002年アメリカンリーグのワンアウトを与えたことによる得点1への”貢献度”は、マイナス0.29である。 この差、0.47-(-0.29)=0.76を、先ほどの(-1.7本)に掛けることにより、どの程度の失点を防いだかが求められる。 0.76点 x (-1.7)本 = -1.3点。 つまりBordickは(-1.3点)防いだ・・・1.3点相手に平均的なSSよりも多くの得点を与えてしまった、ということになる。 以上を全てのゾーンで計算する。 全てのゾーンとは、あるSSがワンアウト以上奪ったエリア全てのことである。 結果Bordickの場合6.2点と言う結果が出、つまりBordickのSSでの守備の評価として、平均的なSSよりも6.2点多く失点を防いだ、ということになる。 しかしながら、これにはエラーが加算されていない。 ここまでの結果は、ROEエラーがアウトと計算されている場合である。 最後にこのプロセスを行うが、これはシンプル。 このシーズン、SSが犯したROEエラーは全ゾーンにおいて169回 これにアウト数を加えると5218となり、エラー率は0.32/守備機会となる。 Bordickは全ゾーンにおいて277機会があったので、もし平均的なSSであれば、上のレートを当てはめ8.9個のエラーが記録されることになる。 しかしながら、実際にBordickが記録したエラーは1個であった。 つまり平均的なSSよりも7.9個少ないこととなり、これが次の計算で使用される。 先ほど示したとおり、ワンアウトが得点1に与える影響は-0.29。 一方内野手による一つのエラーが与える影響は0.49だ。 先ほどと同じように、この差を計算すると0.78。 これに7.9個を掛けると6.2点となる。 これが先ほど示した”BordickのSSでの守備の評価6.2”にさらに加算される。 次にnon ROEエラーの加算。 SSが犯したnon ROEエラーは45個で、以下はROEエラーの場合と同じプロセス。 結果Bordickには新たに、+0.72が加算されることになり、総合計では約13となる。 以上がUZR runsの計算方法です。 読まれた方、お疲れ様でした。 尚以下のリンクより、2003年から07年までのUZRのランキングがダウンロードできます。 本文中の最後のリンクで、データはエクセルです。 http://www.insidethebook.com/ee/index.php/site/article/uzr_2007_complete_list/ 以後はUZR Ratesと計算方法へと繋がりますが、これは省略させていただきます。 いずれ翻訳説明するつもりですが…いつかは約束できませぬw この手法の問題点としましては、ZRのそれをそのまま引き継いでいるようですね。 一般的にZRの問題点としては以下が上げられています。 ・シフトなどによる守備位置が考慮されていない。 ・ライナーやフライなどの判断にどうしても主観が入ってしまう。 ・以前ここで取り上げたRZRにより修正されている問題。 以後は独り言。 これはわし自身の反省点でもあるのですが、以上のような不具合点を上げ、その手法そのものを否定してしまう傾向が見られるということです。 UZR、特にUZR runsは、野球にとって最も正当な評価方法である、得点(或いは失点)への換算により守備の価値を示しているところが素晴らしい。 数字なんてあてにならんよ・・・と考え続けている間は、得られない結果であり、これは明らかに”ないよりまし”以上のものであり、かなり参考にすべきことだと思います。 理屈・・・という言葉には、多少嫌な響きがありますよね。 牛乳瓶の底のような眼鏡を掛けたやつが理屈をまくし立て、”そんなの関係ねー”とばかりにたくましい男にぶん殴られるシーンを思い浮かべてしまいます。 バランスが大切…という言葉にすら、なんとなく理屈否定の意識も垣間見れてしまいます。 勿論、理屈・・・数字と置き換えて見ても良いと思いますが、それで割り切れないことがあることは承知しているつもりです。 また、そこに日本人的な美学がある場合があることも。 しかしだからと行って理屈に対して目をつぶり続けていると、大変なことになります。 例えばエコのムーブメントなんかがそうですね。 そのムーブメント自体、いくつも理屈に合わないことが横行してしまっているのですが、それを取り上げる動きはメジャーになる雰囲気はなく、むしろ罪人扱い。 それはともかく最近気になっているのは排出量取引。 詳しくは触れませんが、賛成・反対に関わらず、日本は既にその枠組みに取り込まれていくことはほぼ間違いありません。 エコに関してモンロー主義を貫くことは最早無理で、善意や美学で盛り上げてしまったわしらも非常に反省しなければなりません。 反省で済めば良いけど、エコで国が破綻・・・ってのも笑い話ではなくなりつつあります。 それに歯止めを掛けることができるのは”理屈力”です。 話がかなり大げさになってしまいましたが、今日はこの辺で。。。
posted by rahmian |15:15 |
STATS |
トラックバック(0)
トラックバックURL
このエントリーのトラックバックURL:
(表示は許可制となっています)
http://www.plus-blog.sportsnavi.com/rahmian/tb_ping/479
この記事に対するコメント一覧
(事務局では、サービス全体の雰囲気醸成の為、全コメントをフィルター/目視チェックし、削除等しております。見逃し等も有りますので、ご不快な思いをされた場合は、事務局宛 support@plus-blog.sportsnavi.com にご意見頂けると幸いです。)
UZR runsの求め方
ありがとうございます、結局http://www.insidethebook.com/ee/index.php/site/article/uzr_2007_complete_list/
へ飛んで 13 という項目のところに着眼すれば それがプラスであれば それだけ失点を防いだことを示し マイナスですと 平均よりも彼が守備につくことにより それだけ多く失点しているということですよね。
ジーターとルーゴがよくBSで見るので気になっているところです。
posted by oki | 2008-07-09 14:04
UZR runsの求め方
よく見ると07年のデータは途中までのもののようですね。
posted by らー管理人 | 2008-07-09 23:54


