お久しぶりです。シミッチの人、またはフグの人、やるせない鯱です。
前回の記事が(おそらく)好評だったこともあり、再び記事を書かせて頂くことになりました。
記事についての評価云々は私の主観です。何かを客観的に評価することは容易ではありません。
それはサッカーでも同じです。
あるクラブチームがどのようなサッカーをしているのかを客観的に評価することもまた難しいことです。
今回は、各クラブチームの特徴を表す”レーダーチャート”についてのお話です。
忖度と叫ぶその前に、データリプレイ
事の始まりは8月初旬
twitterで
「名古屋のレーダーチャートが小さすぎる、忖度ではないか?」
という旨のツイートを見かけたことです。
当時の名古屋は4位以上をキープしており、Jリーグでもトップクラスの成績でした。
そんなチームのレーダーチャートが小さいものだろうか?
そう思い、sportsnaviに掲載されていた名古屋のレーダーチャートを確認しました。
「うわっ…名古屋のスタッツ、悪すぎ…?」
思わずつぶやいてしました。それほど小さかったのです。
そこで今回は
なぜ名古屋のレーダーチャートは小さいのか?
を検証したいと思います。
データサイエンスのプロフェッショナルであり、本(https://www.amazon.co.jp/-ebook/dp/B0844HZ7JF)も出版されているグラぽ大先生のお膝元でデータについて語るなどどんなツッコミが来るか戦々恐々ではありますが、どうかご容赦を。
それでは忖度と叫ぶその前にデータリプレイ、スタートです
レーダーチャートつくってみた
などと、意気込んでみたもののさっそく問題が発生しました。
ここで取り上げるレーダーチャートはsportsnaviさんに掲載されているものなのですが、著作権により、転載等が禁止されています。
肝心のレーダーチャートが使えなければ、内容が伝わりづらく、企画そのものが頓挫してしまいます。
内心焦る私の脳内に一筋の光明が差し込みます。
「レーダーチャートが使えなければ、自分で作ればいいじゃない」
ということでレーダーチャートの再現に取り組みました。
今回、J1第16節までのデータをもとに、17節名古屋グランパス対ヴィッセル神戸の試合のレーダーチャートを再現したいと思います。
sportsnaviさんの名古屋対神戸のレーダーチャートはこちら
https://soccer.yahoo.co.jp/jleague/game/preview/2020091922
sportsnaviさんのレーダーチャートはゴール、ドリブル、パス、クリア、インターセプト、タックル、クロス、シュートの項目から構成されており、偏差値として算出されたデータがプロットされています。
それらの各パラメーターがどのように算出しているのかを検証します。
ゴール
はじめに、一番わかりやすい”ゴール”の項目について考えましょう。
ゴールの指標として考えられるのは単純な総得点か試合当たりの平均得点のいずれかが考えられます。
まずは各チームの総得点のグラフを示します。
このグラフを見ると、神戸の方が名古屋よりも総得点が多いことがわかります。
次に試合あたりのゴール数(平均得点)のグラフを示します。
こちらのグラフでは名古屋の方が神戸に比べて平均得点が高いことがわかります。
- 総得点 名古屋<神戸
- 平均得点 名古屋>神戸
そしてsportsnaviさんのレーダーチャートでは神戸の方が名古屋に比べて大きくなっています。
このことからゴールの項目は総得点数をもとに算出していることが推測されます。
なぜ同じゴールの指標なのに評価が変わってしまうのでしょうか。
次に、y軸には総得点数、x軸には平均得点をとったグラフを示します。
本来であれば、各プロットはy=nx (n=試合数)の直線上にあるはずです。
しかし、今シーズンはCOVID-19の影響やACLによって各チームの消化試合数にばらつきがあるため、直線上にのりません。
そこで、n=16.5(各チームの消化試合数の中央値)の直線をグラフに引きました。
大まかにこの直線よりも上にあるチームは試合数が多いため、総得点の方が良い評価を得ることができます。反対に直線よりも下にあるチームは試合数が少ないため、平均得点の方が良い評価を得ることができます。
名古屋の総得点は24、平均得点は1.6、試合数は15
神戸 の総得点は26、平均得点は1.4、試合数は18 (第16節終了時)
このように今年は消化試合数が大きく異なるため、指標によって評価が逆転してしまうことがあります。
シュート
次に”シュート”の項目について考えてみます。
ゴールの項目が、試合あたりの得点ではなく総得点であるとすると、シュートやその他の項目も各試合の平均ではなく、全試合の結果を合算した総数と考えるのが妥当だと考えます。
なので、ここでも試合あたりのシュート数ではなく、シュート総数という前提で考えます。
シュートとして主に考えられるパラメーターは、「シュート数」、「枠内シュート数」があります。
このどちらを採用しているのかを考えてます。
17節名古屋グランパス対ヴィッセル神戸の試合のレーダーチャートのシュートにおいてヴィッセル神戸は名古屋グランパスを大きく上回っています。
前述のように消化試合数が異なることもあり、「シュート数」、「枠内シュート数」ともにヴィッセル神戸が名古屋グランパスを大きく上回っているため、このデータだけではどちらかわかりません。
そこでJ1第20節北海道コンサドーレ札幌vsベガルタ仙台のレーダーチャート(https://soccer.yahoo.co.jp/jleague/game/preview/2020100312)を使って検証します。
このレーダーチャートを見ると北海道コンサドーレ札幌(以下札幌)の方がベガルタ仙台(以下仙台)を大きく上回っています。
次に示す表はFBREF(https://fbref.com/en/comps/25/J1-League-Stats)のデータをもとにシュート数と枠内シュート数の偏差値を算出したものです。
シュート数の偏差値は札幌(58)が仙台(46)を大きく上回っています。その一方で、枠内シュート数は札幌(49)が仙台(45)をやや上回る程度です。
このことからシュートの項目は「シュート数」であると推測します。
また札幌よりもシュート数の偏差値は低くく、枠内シュート数の偏差値が高いFC東京や柏レイソルのレーダーチャートを比較してみても、札幌の方が大きいことからも「シュート数」を採用していることが裏付けられます。
ゴールとシュートの項目から、各項目のデータは全試合の結果を合算したものであり、成功数ではなく試行数であると推測します。
例えば、クロスの項目では1試合あたりのクロスの成功数ではなく、これまでの総クロス本数のデータを採用していると考えます。
レーダーチャートのできあがり
この前提から各項目の偏差値を算出し、レーダーチャートを作成しました。
ただし、パス総数のデータが見つからなかったので平均ボール支配率で代用し、ドリブルとクリアの総数も見つからなかったので項目ごと除外しました。(それらの情報を提供してくれるサイトを教えていただけたらうれしいです。)
(2項目欠けていますが)再現した17節名古屋グランパス対ヴィッセル神戸の試合のレーダーチャートがこちらです。
小さいですね。
一応これでレーダーチャートの再現をすることができました。
ここから試合数の違いを考慮してみましょう。
まず例として、最も消化試合数の少ないサガン鳥栖のレーダーチャートを比較してみます。
全ての項目において試合平均の方が上回っています。(ボール支配率は平均値なのでどちらも同じ数値)
名古屋の方が神戸に比べて消化試合数が少ないため、レーダーチャートが過小評価されてしまいます。
試合平均のデータをもとに作成したレーダーチャートがこちらです。
先ほどのレーダーチャートでは全ての項目において神戸を下回っていた名古屋でしたが、このレーダーチャートではゴールとタックル成功数ではやや神戸を上回るようになりました。
なぜ名古屋のレーダーチャートは小さいのか
前置きが長くなってしまいましたが、本題に入ります。
「なぜ名古屋のレーダーチャートが小さいのか?」
の理由として以下の2点を考えます。
①消化試合数が少ない
前述の様に、名古屋のような試合数の少ないチームは過小評価されてしまいます。
そのため、今シーズンのような消化試合数が大きく異なる場合、レーダーチャートの作製や比較を行う上で試合数を考慮した試合平均のデータを使用することが適当であると考える。
②パラメーターの性質
次に各項目で採用されているであろうパラメーターの種類です。単純なパスやシュートの総数だけではどのくらいパスが成功したのか、シュートが枠内に入ったのかというプレーの質を評価することができません。
極端な例を挙げます。
2013-14シーズンのイングランドプレミアリーグ第25節マンチェスターユナイテッドvsフルハムの一戦。
前年王者のマンチェスターユナイテッドは最下位のフルハムを攻め続け90分間に81本のクロスをあげました。
しかし、81本のクロスの内、味方に繋がったのは18本(成功率22.2%)であり、試合も2-2の引き分けに終わっています。
そのようなチームに、クロスが優れているという評価を誰もつけないと思います。
今夜、
🔴⚫️マンチェスター・ユナイテッド 🆚 フルアム⚪️⚫️
のカードを桑原学氏(@kuwaharamanabu)とともに、23時53分より@JSports2にて生でお届けします。
この2チームが最後に対戦したとき、ユナイテッドがリーグ記録となる81本のクロスを試みた(内18本が成功)。 pic.twitter.com/qRMEQ8bpOu
— Ben Mabley(ベン・メイブリー) (@BenMabley) December 8, 2018
J1リーグに”Moyes”という毎試合81本のクロスをあげる架空のチームを作製し、レーダーチャートでJ1のクラブと比較してみました。
Moyesのクロスの偏差値は91.6という圧倒的な数値を叩きだした。東大生でもこの偏差値を出せる者はほとんどいません。
(現在のJ1リーグの試合あたりのクロス数の平均が17.9本)
このようなレーダーチャートを見ると、Moyesのような量は多いけど質が伴っていないチームでも、クロスが得意なチームに見えてしまう可能性があるのです。
それに加えて、取り扱っているパラメーターが名古屋の特徴を捉えることができていないと考えます。
下記の表はJ1各チームの様々なデータの偏差値をまとめたものです。
例えば、名古屋のシュート数や枠内シュート数の偏差値は低く苦手と評価されてしまいますが、決定力(ゴール数/シュート数)はリーグでも上位です。
現在の名古屋のサッカーは、パス数やドリブル数、シュート数といった従来のパラメーターでは実態のつかみにくいものなのかもしれません。(セレッソ大阪も同様の傾向がある。このあたりの事も書けたらいいですね。)
長くなりましたが、名古屋のレーダーチャートが小さい理由をまとめますと
- 消化試合数が少なく、過小評価されてしまう
- 評価項目が量的であり、名古屋はその量が少ない
sportsnaviさんのレーダーチャートは今シーズンの各チームの特徴を理解するのには不十分ですが、おおまかなプレーの傾向(シュートが多い、クロスが多いなど)をつかむのに便利だと思います。PAGE_BREAK: PageBreak
第20節浦和レッズ戦
次にJ1第20節名古屋グランパスvs浦和レッズのレーダーチャートを独自に作製しました。
浦和はかなりバランスのいいレーダーチャートを示しており、掴みどころのないチームです。
特徴をあげると
- クロス数は少なく
- サイドよりも中央
ボール支配率は低くカウンター傾向ですが、オフサイド数が少ないことからアバウトにロングボールを裏に蹴るよりもショートパスを繋ぐことが推測されます。
また、footballlab(https://www.football-lab.jp/uraw/preview/) によると
浦和はセットプレーから6点、ショートパスから7点をあげています。ゴール前での不用意なファールをしないような守備をする必要があります。
一方で、浦和はクロスから12失点しており、クロス対応を苦手としています。マテウスのクロスから金崎夢生のヘディングゴール、まさにデータ通りの展開でした。
🎦 ゴール動画
🏆 明治安田生命J1リーグ 第20節
🆚 浦和vs名古屋
🔢 0-1
⌚️ 54分
⚽️ 金崎 夢生(名古屋)#Jリーグ#浦和レッズvs名古屋グランパス
その他の動画はこちら👇https://t.co/JUEMOXLYeZ pic.twitter.com/HlhyVmogya— Jリーグ(日本プロサッカーリーグ) (@J_League) October 4, 2020
「相馬走る、相馬上げる、飛び込んでヘディング、後ろからショーだー!」
これからもこんな展開ができるよう、サイドアタッカーに期待です。
第21節セレッソ大阪のレーダーチャート~プレビューもどきを添えて
最後にJ1第21節名古屋グランパスvs浦和レッズのレーダーチャートを独自に作成しました。
攻撃の指標として、ゴール数、シュート数、枠内シュート数、決定率(%)、クロス数、オフサイド数,ボール支配率(%)
守備の指標として、インターセプト数、タックル成功数、ファール数、被ファール数、失点数、被枠内シュート数、セーブ率(%)、クリーンシート率(%)
を設定、FBREF(https://fbref.com/en/comps/25/J1-League-Stats)のデータを参照した。各指標の偏差値を算出してレーダーチャートを作成しました。(~数は試合あたりの平均値)
前から思っていましたが似てますね、セレッソと名古屋。
攻撃の指標ではほとんど同じ特徴を示しており、両チームともシュート数、枠内シュート数が少ない傾向にありますが、決定率は名古屋の方が高いです。これが現在の得点数にも影響していると思います。
失点数が少なく、守備が堅いとされている両チームですが、ここは少し違いがありそうです。
①セレッソのタックル成功数はかなり少ない
セレッソのタックル成功数はJ1リーグの中で最下位です。
実はセレッソのタックル数そのものが少なく、自分から積極的に奪い取るというよりも、構えて相手のミスを誘発する守備スタイルであることが推測されます。
それに対して、名古屋は適度に自分からも奪いに行っている事がわかります。
②名古屋の被枠内シュート数はかなり少ない
失点が少ない両チームですが、セレッソの枠内シュート数(4.38本)はJ1リーグの平均程度であるのに対して、名古屋(3.10本)はリーグ2位の少なさです。
名古屋は守備陣が中心となって枠内にシュートを撃たせない、撃たせてもシュートブロックして枠内に飛ぶことを防いでいるためと考えます。
名古屋よりも枠内シュート数が多いにも関わらず、なぜセレッソ大阪の失点数は名古屋よりも少ないのか?
その理由はセレッソの守護神、キムジンヒョン選手です。
セーブ率は0.79%、クリーンシート数は8と両方ともリーグトップの成績です。
(ランゲラック選手はそれぞれ0.68%と7)
キムジンヒョン選手が枠内シュートを止めまくるおかげでセレッソの失点がかなり少なくなっていると考えます。
名古屋は枠内へのシュートを撃たせないようにフィールドプレイヤーがプレッシャーをかけ、それでも撃たれてしまった時はランゲラック選手におまかせ(撃たせない)
セレッソは守備陣がコースを限定したところで、飛んできたシュートをキムジンヒョン選手が止めまくる(撃たせて取る)
というスタンスなのではないかと思います。
そして両チームとも突出していたのが「被ファール数」です。
Jリーグ全体の被ファール数1位は坂元達裕選手(53回)、2位は奥埜博亮選手(47回)
名古屋では金崎夢生選手が4位(34回)稲垣祥選手が10位(32回)と両チームとも多いです。
そして両者ともファール数が少なく、被ファール数の多いチームです。
そこで、ファールと被ファールの関係を調べるためにfoul indexという指数を定義しました。
この指数は
foul index =(ファール数-被ファール数)/(ファール数+被ファール数)
という計算によってされ、-1~1の値をとります。
1に近づくほどファール数が多い、-1に近いほど被ファール数が多い事を示します。
(foul index=1なら自分たちのファールだけ、foul index=-1なら被ファールだけ、foul index=0ならファール数と被ファール数が同数)
このfoul index を見ると、セレッソ(-0.25)と名古屋(-0.11)と両チームともファールが少なく被ファールが多いことがわかります。
それでは、ファールはどのような時にしてしまうものでしょうか。
相手が優位な状態、自分たちにとってピンチな状態にある時しょうがなくしてしまうものだと思います。
名古屋、セレッソ共に守備では組織的な守備によって無理にファールを犯す必要がない位置で構えており、攻撃ではチャンスの起点となる位置、相手のピンチを招きうる位置でボールを持てるためファールで止められてしまう。(金崎選手や奥埜選手)
攻守にわたって相手にとって嫌なポジション、自分たちにとって有利なポジションを取れているのではないでしょうか。
第20節終了時の平均ファール数(Fls)と平均被ファール数(Fld)とfoul index
最近の名古屋の戦績は白星と黒星を繰り返すオセロなどと言われています。
私たちが見たいのはオセロのような悲劇ではなく喜劇であり、快進撃です。
この試合を契機に、連勝街道を突き進むことを願っています。