boxLEBRONとPERの比較
boxLEBRONという数字を突然見せられて、この数字がどれだけ信用できるのかと、疑問に思っている方もいるかと思います。私も、boxLEBRONがどれくらい正確に選手のインパクトを数値化できているかを聞かれても、「どのくらい」かと、今は具体的に答えることはできません。
boxLEBRONを計算してみようと思ったきっかけは、PERよりも良い個人スタッツができたらいいな、と思ったことでした。PERとは、元メンフィスグリズリーズのフロントオフィスのメンバーで、バスケットボールにおけるデータの活用を加速化させたJohn Hollingerという人が作った個人スタッツです。
NBAでは、現在はもっと進化したスタッツが使われることが多くなって、PERが使われる機会は減ってきました。一方Bリーグでは、公式サイトにはEFF、そしてRealGMにPERがありますが、個人スタッツはあまり注目を集めていない印象がありました。そこで、boxLEBRONを計算して、それを一般公開すれば多少なりとも個人スタッツという分野に貢献できるのではないかと考えました。
boxLEBRONがどれだけ「正確」かを考えたときに、以前からあるPERと比較をしてみる事が第一歩だと私は考えました。そこで、今日はboxLEBRONとPERを、Bリーグ2020-21シーズンここまでのデータで比較してみようと思います。
比較をする前に、2つのスタッツの計算式における大きな違いについて説明しようと思います。それは、boxLEBRONでは、チームのオフェンシブレーティング・ディフェンシブレーティング(100ポゼッションごとの得点数・失点数)が式に組み込まれていることです。PERにはそのような項は無く、あくまでも個人のボックススコアのスタッツのみで計算されています。
また、パッと見たときの数値の見え方にも違いはありますが、そこは今回比較する上ではあまり重要ではないのでおいておきます。
上が、縦軸にboxLEBRON、横軸にPERを置いた散布図です。また、赤色がついているのが5割以上の成績のチームの選手、青色がついているのが5割未満のチームの選手です。ここでは、勝率が高いチームはオフェンシブレーティング・ディフェンシブレーティングが良いという仮定をしています。
(PERの数値は、RealGMのものと数値が合わなかったのですが、だいたいの順位はあっていたので、概算ということでお許しください。)
これを見ると、傾向線の上に赤い点、下に青い点が多く分布しているのが見えると思います。つまり、boxLEBRONはPERと比べて勝率の高いチーム(つまり、レーティングが良いチーム)の選手を評価しているということになります。また、右上に行けば行くほど、この傾向が強くなっている様に見えます。これはやはり、上記した計算過程における大きな違いがもたらす影響だと考えられます。
なぜboxLEBRONはチームのオフェンスやディフェンスを式に組み込んでいるのか、疑問に思われる方もいると思います。理由を簡単に説明すると、「良いオフェンス(ディフェンス)をするチームで、たくさん出ている選手は、オフェンス(ディフェンス)でいい影響をもたらしている選手だろう」という論理であると考えられます。必ずしもそうとは言い切れないですが、+/-(出場した時間帯の得失点差)や、on/offのレーティング(出場した時間帯のO/Dレーティング)のデータが無い状態で、代用の様な形でboxLEBRONの計算式には含まれていると考えられます。
やはり、計算式での大きな違いが、散布図にしたときに顕著に現れている印象が強かったと思います。また、PERも、boxLEBRONも、どちらも「正確」とは言い難い中2つを比較しても、正確性の議論が進まないのはわかっていますが、まずは特色を理解することが第1歩かな、と思っています。
また、正確性について議論したアメリカの研究が2つあるので、リンクを貼っておきます。興味がある方は、英語にはなってしまいますが読んでみると面白いです。これについて詳しくは今は訳をしたりはしませんが、必要があればやろうかと思います。
0コメント