PIPM(Player Impact Plus-Minus)

PIPM (Player Impact Plus-Minus) は、Jacob Goldsteinが作った、オールインワンメトリックやインパクトメトリックと言われるものの一つです。NBAでは、PIPMの他に後継のLEBRONESPNのRPMFiveThirtyEightのRAPTORなど、様々なインパクトメトリックが一般公開されています。これらの目的は、選手が試合に与えるインパクトを、一つの数値にまとめようとすることです。NBAでは、それぞれのウェブサイトやアナリストたちがより良いものを目指して、毎年新しいものが生まれています。

まずは、PIPMを簡単に説明したいと思います。簡単な説明をしたあと、もっと具体的な計算や調整方法を、さらに興味のある方向けに書きます。興味がある方は、最後まで読むとさらに理解が深まるかと思います。


PIPMは1選手につき1つ、総合的なインパクトとして値があります。ですが、オフェンスの値とディフェンスの値を単純に足す形でその総合的な値が求まるので、オフェンスの値(O-PIPM)とディフェンスの値(D-PIPM)の2つに分けることができます。


また、PIPMが見ているものは主に3つになります。

① 選手のボックススコアでの貢献度

② 選手のon-offデータでの貢献度

③ 選手のオフェンシブ・ディフェンシブレーティング(リーグ平均との比較)


ボックススコアの数値が良ければ良い程PIPMの数値は高く、on-offデータ(その選手がコート上にいる時間帯と、いない時間帯のORTGとDRTGの差)が良ければ良い程PIPMが高く、また、チームのORTG・DRTGがリーグ平均と比べて高ければ高い程PIPMは高くなります。また、それぞれ逆も然りとなっています。

また、今回使用したon-offのデータはすべてBリーグ 私的データベースさん(Twitter)のデータを使用させていただいています。On-offのデータが無ければPIPMはできなかったので、大変感謝をしています。

これら3つのデータを見て、足し合わせる事によってPIPMは選手個人の総合的なインパクトを数値化しようと試みています。ボックススコアとon-offの両方を見る事によって、いわゆる「数字に残る活躍」に加え、「数字に残らない活躍」もキャッチしようとしているのがPIPMの最大の特徴です。

On-offデータを見る事によって、ディフェンスの部分が格段に改善されます。理由は、ボックススコアには、ディフェンスでの貢献がスティールとブロックしかなく、その2つも必ずしもディフェンスが上手かを見るのに有用なスタッツとは言えないからです。

また、PIPMのようなオールインワンメトリックの多くは、その数値が100ポゼッションごとのインパクトを表しています。(平均がだいたい0になるようになっており、平均は上位の選手が引き上げているので、Replacement levelは-2.0に設定されています)また、PIPMは選手の才能・能力を表すものではなく、その時のチームで、その時の役割で試合に与えるインパクトを表すものですので、そこも注意が必要です。


以上が、簡単な説明となります。ここからはもっと深く計算のプロセスに入っていくので、興味のある方だけ読んでください。


ではまず、ボックススコアの部分の説明から始めます。ボックススコアスタッツでも、使うのはペースアジャストされた36分換算のボックススコアスタッツです。ペースアジャストは至って単純で、(チームのペース)/(リーグ平均のペース)を各項目に掛けるだけです。これは36分換算のスタッツで、ペースが遅いチームの選手の数値を少しだけ上げ、速いチームの選手の数値を少しだけ下げるために行います。ペースアジャストをすることによって数値が大きく変わることはありません。また、36分換算に関しては言葉通りなので特に説明はしません。

ボックススコアスタッツの係数については、Jacob GoldsteinがNBAの15年RAPM(Regularized Adjusted Plus-Minus)とボックススコアスタッツを使い、重回帰分析を行ったものと同じ係数をここでは使っています。具体的な係数は、こちらにあるものを使っています。(RAPMというのは、簡単に言えばon-offのデータの、交代した選手のパフォーマンスから生まれるノイズを取り除こうとしたもので、長いサンプルを取らないと有用ではないとされているものです。オールインワンメトリックというものは、RAPMを1シーズン程のサンプルで再現することを目的としているものでもあります。)

ここで、チームアジャストメントというものを行います。チームアジャストメントは、BPM(Box Plus-Minus)という別のメトリックで行われるアジャストメントで、ORTGがリーグ平均のチームでは、boxPIPM(PIPMのボックススコアの部分のことを指します)× 出場した分数の%(分母は、チームの試合数×40分)の合計がゼロになるように、定数項を与えることです。これをオフェンスとディフェンスの両方で行います。

次に、on-offデータの部分を計算します。ここで使うのは、ラックアジャストされたon-offのレーティングです。ラックアジャストメントについては、こちらで説明しているのでここでは割愛します。

2つ目の大きな部分である、on-offのところではラックアジャストされたon-offのORTG、DRTGをそれぞれ使います。そして、3つ目の、原文ではAVGとなっている部分では、オンコートの時のORTG、DRTGを使います。

この2つの違いとしては、オンコート時とオフコート時の差を見るon-offで、その選手個人が試合にどういうインパクトを及ぼしているかを見ます。そして、オンコート時のレーティングでは、リーグ平均と比較してどれだけオフェンス・ディフェンスの効率が良いかを見ます。この2つの数値と、boxPIPMの数値、3つを使ってPIPMが(一旦)計算されます。係数は先程のboxPIPMの時と同じページの係数を使っています。

この3つの数値を使って計算する前に、小さなサンプルに対応するための調整が一つあります。プラスマイナスの部分(on-offとAVGの部分だと私は解釈しています)に関して、選手の出場時間(分)を、全試合フル出場した場合の分数で割り、その平方根をとったものを掛けるという調整です。サンプルが小さければ小さい程この調整でゼロに近づきます。

また、(一旦の)PIPMを計算した後、次はReplacement levelに近づける調整を行います。これも同じく、小さなサンプルに対応するための調整です。オフェンスには-1.7のレベルで350分、ディフェンスには-0.3のレベルで450分のプレーを全員にインプットします。

また、最後にもう一度チームアジャストメントを行います。先程boxPIPMのところで一度行っていますが、ここで同じことをオフェンス・ディフェンスそれぞれもう一度行います。ここでの調整は、先程より数値は小さくなるはずです。


これで、PIPMは完成です。Jacob Goldsteinによると、PIPMは15-year RAPMとの間に0.875という重相関係数が計測されているそうです。また、PIPMとRAPMのディフェンスの部分だけを見ても、0.843と、高い数値です。これは、ボックススコアだけを見ているメトリックの場合には成しえない数値であり、on-offのデータを入れることによってこのメトリックの精度が各段に上昇したと言えるでしょう。

ただPIPMは、Jacob GoldsteinがNBAの15年RAPMに合わせて作ったモデルです。もしBリーグのRAPMができて、重回帰分析をやり直した場合、同じ係数になることは無いと思われます。また、PIPMも一つのスタッツであり、これが全てということでは全くありません。あくまでも一つの数値ですので、弱点も少なからずあります。それは理解した上で、PIPMを見てください。

今までBリーグの、一般公開されていた個人スタッツ・メトリックは、EFFやPERに限られていました。ここに、PIPMを公開する事によって、インパクトメトリックのベンチマークのようなものになれば良いなと思っております。また、今後も、計算できそうな個人スタッツがあれば、やっていきたいと思っているので、これからもよろしくお願いします。


以上、長文となりましたが、読んでくださった方、ありがとうございました。最後にもう一度、Bリーグ 私的データベースさんには感謝を申し上げます。また、感想や質問などはTwitterにてお待ちしております。PIPMが良いと思った方は、是非シェアをしてもらって、もっと多くの方々に見ていただけるようにお願いします。


原文: Nylon Calculus: Introducing Player Impact Plus-Minus

計算に使用した係数はこちらです。

0コメント

  • 1000 / 1000