こんにちは.ご無沙汰しております.ゆるグラサポのコナカ@konakalab( https://twitter.com/konakalab )です.出遅れ感がすさまじいですが,(簡易版)ゴール期待値に基づくチーム評価・2019シーズン編をお届けします.
(データに関する注意:シュート位置のデータはFootball Lab(http://www.football-lab.jp/)の各試合結果から取得しました.オウンゴールはシュートおよび得失点には含まれていません.また,データの解釈はソースコードを読んだ私の理解に基づくものなので,誤りがある可能性があります.)
(簡易版)ゴール期待値とは?
再掲になりますが念のため定義をここで.
シュートは打たれたときの位置や選手の配置によって得点につながりやすいかどうかが異なります.ゴール正面の近くから打たれたシュートは得点になりやすく,ロングシュートはめったにゴールに入りません.シュートの成功率に関わりそうな条件のうち,シュートを打った位置のみについて,過去その付近のシュートがどの程度の割合でゴールになったのか,を集計したものを簡易版ゴール期待値(simplified eXpected Goals, sxG)と定義します.期待値を色で表したヒートマップは以前の記事(https://grapo.net/2019/04/24/9680/)をご覧ください.混同の恐れが無い場合,簡単のため「ゴール期待値」「得(失)点期待値」などと呼称します.
2019シーズンまとめ
まずはじめに,勝点との相関を,実得失点,簡易版得失点期待値について調べます.下図は実得失点差と勝点の関係です.
決定係数R2が0.9近くあり,得失点差と勝点には非常に強い相関関係があることが分かります(当たり前ですが).名古屋は得失点差から予測される勝点(約43)よりも少なめの実勝点(37)でした.
次に,簡易版得失点期待値差と勝点の関係を図示します.
こちらはだいぶ相関関係が弱まっています.が,決定係数R2=0.34(相関係数R=0.58)は二つの量の間に相関関係があこと,および勝点のうち何割かは簡易版得失点期待値(=シュートを打った場所と量の評価値)で説明できることを示しています.
得失点期待値だけの予測であれば,名古屋は広島(勝点55)に近い勝点であってもおかしくなかったことになります.また,上位チームはいずれも赤実線の上に位置していることが分かります.
得失点期待値のみを各軸に取った図も示します.
右下に行くほど相手ゴールに近いシュートが多く,かつ自ゴールに近い被シュートが少ないことを示しています.優勝した横浜FMおよび川崎Fがここでは最高の評価です.特徴的なのが大分で,シュートよりも被シュートが非常に多く,得失点期待値差ではもっとも悪い評価にも関わらず,9位と躍進しました.名古屋は期待値では得失点ともに上位の評価でしたが,勝点は伸びませんでした.なぜでしょうか?
ここで,実得失点と簡易版得失点期待値それぞれで含まれている・含まれていない要素を考えてみます.表にまとめました.○はシュートごとに異なる値が含まれている,△は平均化されて含まれていることを示しています.
要素 | 実得失点 | 簡易版得失点期待値 |
シュート位置 | ○ | ○ |
シュートを打った選手の技量 | ○ | △ |
シュート時の選手配置 | ○ | △ |
守備(特にゴールキーパー)の技量 | ○ | △ |
シュートの種類 | ○ | △ |
運など | ○ | △ |
ここで以下の仮説を立てます:
「実得失点と簡易版得失点期待値の間の差には,シュート時の選手配置などの影響が含まれている」
シュート時の選手配置はそこに至るまでに選手・ボールがどのように動いたか/動かしたかの結果であり,これを意図的にどのように生成するのかが現代サッカーにおけるチームの質の指標であることは間違いないでしょう.実得失点と簡易版得失点期待値の間の差が完全にチームの質を表せるわけではありませんが(運など他の要素も含まれている),ある一定の指標になるのではないかと現時点では考えております.
仮説の段階ではありますが,これらの差を得失点それぞれに分けて図示します.
図中,右下(期待値と比較して実得点が多く実失点が少ない)のチームほど「シュート時の状況の質が良い」ことを示唆しています.横浜FMは攻撃時の質が非常によく,守備は平均的,大分は攻守ともにシュート時の質が良い,C大阪は攻撃時の質は平均よりやや下回るが,被シュート時の質が非常に高い,と解釈できます.名古屋を見ると攻守ともに芳しくない評価で,清水,湘南,磐田などとともにもっとも悪いグループに分類できそうです.
これ以降の考察は以前の記事(https://grapo.net/2019/07/12/10392/ )と同じ結論になってしまうのですが,これらシュート位置に関する統計に基づくと,名古屋の2019シーズンは以下であったと結論付けて良いのではないでしょうか.
- シュート数そのものは多く,位置でもゴール近くのシュートが多く得点期待値はリーグ上位であった.しかし,
- ストライカーが不調であった
- PA内の選手数が多すぎることでシュート位置の割には実際の質は高くなかった
などの要因から,実得点は期待値を若干下回る程度となった.
- 被シュート数は多くなく失点期待値もリーグ上位だったにも関わらず,実失点は期待値を大きく超えてしまった.前半好調時は守備陣およびゴールキーパーの質の高さで失点を防いでいた傾向にあった(期待値と比較して失点が非常に少なかった)が,長期的には続かなかった.攻守のリスク管理のバランスの悪さが示唆される.
新監督で迎える2019シーズンはどのような特徴が出てくるのでしょうか.
補足
Twitterで毎週公開していた予測のふりかえりについては個人noteなどで公開していますので,興味がありましたらそちらもご覧ください.一部は少しインタラクティブなグラフを仕込んでいます.
Jリーグ2019シーズン予測ふりかえり
https://note.com/konakalab/n/n90e97735e4af
J1リーグ2019シーズン 月ごとの実力評価
http://www-ie.meijo-u.ac.jp/~konaka/J2019.html
個人的ふりかえり
早いもので2019年も終わりです.自分としては2018後半からTwitterではじめた予測の公開が運よくこのサイト関連の皆様の目に留まりまして(ラグさん( https://twitter.com/Lagty_in_2D )の高速リツイートはすごかった・・・(笑)),ついには「サッカーなんもわからん・・・」状態にも関わらずずうずうしくも寄稿させていただくことになりました.2020年はオリンピックがあるので,Jおよびグランパスとどんな付き合い方ができるのか分からない部分が多いのですが,ひとまずは本年の御礼とともに拙稿を閉じたいと思います.今年一年本当にありがとうございました.皆様良いお年を.