Oracle Cloudのデータ分析による情報を基に、プレミアリーグの2つの賞の受賞者を決定

全380試合で収集されたデータを基に、今シーズンのMost Improbable Comeback(最も信じられない逆転劇)とMost Powerful Goal(最も力強いゴール)の受賞者が決定されました。

Rob Preston | 2024年5月21日


プレミアリーグのサッカーチーム、AFCボーンマスが後半開始の時点でルートン・タウンFCに3ゴール差でリードされていたとき、引き分ける可能性は低く、勝利することはほぼ不可能だと思われました。しかしボーンマスはその後の33分間で、サポーターも信じられないような4つのゴールを決めたのです。

この試合は本当に、文字通り、2023-24シーズンのプレミアリーグのMost Improbable Comeback(最も信じられない逆転劇)だったのでしょうか?全380試合で12億行ものデータを収集し、100億を超えるデータポイントを集計した結果、それが事実であることが確認されました。

Most Improbable Comeback(最も信じられない逆転劇)は、プレミアリーグがシーズン終了時の5月21日に発表する2つの賞のうちの1つです。これらの賞はいずれもOracle Cloud Infrastructure(OCI)サービスを使用した厳格なデータ分析によって解析された結果に基づいています。

ボーンマスは、3月13日にホームスタジアムで4対3で逆転勝利を収めた試合に対して、Most Improbable Comeback(最も信じられない逆転劇)を受賞しました。同じく、今シーズンのMost Powerful Goal(最も力強いゴール)は、3月30日のウルヴァーハンプトン戦で鋭いシュートを決めたアストン・ヴィラのウィンガー、ムサ・ディアビ選手が受賞しました。

プレミアリーグにおける受賞者の決定を支えたのは、オラクルとの提携です。オラクルはデータ・サイエンティストを配備し、OCIのエッジ・サービスを用いて大量の試合データの分析を行っています。ここでは、その分析の舞台裏を紹介します。

Most Improbable Comeback(最も信じられない逆転劇)の算出方法

オラクルのデータ・サイエンティスト、Brian Macdonald氏は、プレミアリーグのチームに与えられるこの賞の候補を選定するにあたり、Win Probability(勝利確率)統計を使用しました。これは、試合の残り時間のシミュレーションを10万回行ってチームが勝利するか引き分ける可能性を計算する、サードパーティの統計機能です。

その統計モデルは、Stats Performによって生成された数年分の試合データに基づいており、各試合のさまざまな時点での得点、特定の試合の残り時間、ピッチに出場している各チームの選手の人数(レッドカードで退場になった選手の有無を考慮するため)、ホーム・ゲームとアウェイ・ゲームの違いなどの要素が考慮されます。

オラクルはOCI Data Scienceサービスを使用して、シーズン中の全380試合での各チームの勝利確率を30秒間隔で分析し、勝利確率が最も低い状態から勝利を勝ち取ったチームを算出しました。

OCI Data Scienceでは、Most Improbable Comeback(最も信じられない逆転劇)の受賞者となったボーンマスについて、後半の49分44秒の時点で相手チームのルートンの勝利確率が97.6%だったと判定されています。これは、今シーズン試合に負けた全てのチームの中で最も高い確率です。つまり、この時点でのボーンマスの勝利確率はわずか0.4%だったのです。

AFCボーンマスとルートン・タウンFCのゴール数を記録した表


Most Improbable Comeback(最も信じられない逆転劇)となったAFCボーンマスとルートン・タウンFCの試合での勝利確率(%)のグラフ

データが示すMost Powerful Goal(最も力強いゴール)の明確な受賞者

この賞は、得点につながったゴールシュートで、ボールが蹴られた瞬間からゴール・ラインを越えた瞬間までの最高平均速度を記録した選手に贈られるものです。ただし、ペナルティエリアの18ヤードラインを越えた位置からシュートしており、ボールの軌道が変化していないことが条件となっています。

OCI Data Scienceの分析によると、3月30日のウルブス戦でのムサ・ディアビ選手のシュートの平均速度は時速68.25マイル(時速109.84キロメートル)でした。プレミアリーグの2023-24シーズンで、時速65マイルを超えたゴールはたった一球、5月19日のアストン・ヴィラ戦でクリスタル・パレスのエベレチ・エゼ選手が放った時速65.01マイルのゴールだけです。

10位の選手と2位の選手の差はわずか時速3.2マイルでした。「このカテゴリでトップ10入りした残りの選手の記録はいずれも僅差でした。」Macdonald氏は言います。「2位以下はほとんど差がなく、1位の選手のみが圧倒的な記録を残していたのです。」

シュートされたボールはピッチの表面を滑るように飛んでいくこともあれば、高く飛んでゴールの上部中央に入ることもあります。自宅で観戦しているサポーターには、シュートのパワーの違いを見分けることは困難かもしれません。「そのため、この賞の決定ではデータ分析が非常に重要な役割を果たすのです。」プレミアリーグのチーフコマーシャルオフィサー(CCO, 最高商務責任者)、Will Brass氏は言います。「計算は複雑です。選手とボールの追跡データに加えて、ボールが蹴られた瞬間の詳細な分析データを考慮する必要があります。Oracle Cloud Infrastructureのおかげで選定の正確さに確信を持ち、ふさわしい受賞者を明確に決めることができました。」

予測されたとおり、Most Powerful Goal(最も力強いゴール)賞のファイナリストとなった選手たちはいずれもペナルティエリアのすぐ外側のゴール中央付近でシュートを放っていました。Macdonald氏は言います。「これは理にかなっています。これらのシュートを見てみると、その多くは軌道が変化したパスがゴールから離れた位置にいるシューターに送られることによって、ボールが加速しています。これは基本的な物理の原理です。」

得点につながったシュートのうち、平均速度が上位に入っているシュートの表

OCIを用いて、分析環境をセットアップするまで

Macdonald氏は、2つの賞を決めるための評価に使用されたOCIインスタンスの設定には、30分しかかからなかったと言います。

最初のステップとして行ったのは、OCI Compute仮想マシンにbashスクリプトを書き込み、プレミアリーグの2つの主要なデータ・プロバイダのAPIからデータを取得し、OCI Object Storageに取り込むことでした。その後、試合が行われるたびに、更新されたデータをこれらのスクリプトに取り込みました。

プロバイダの1つであるSecond Spectrumは、機械学習とコンピュータビジョンのアルゴリズムを使用して、プレミアリーグの全試合にわたって、ピッチ上の22人の選手全員とボールの位置データ(3D座標)を提供しています。もう1つのプロバイダであるStats Performは、Optaサービスを使用して位置データを拡張し、シュート(ピッチ上の位置、ゴールからの距離、左足または右足などの情報を含む)、コーナーキック、反則、ペナルティなど、試合中の「出来事」の特定を可能にしています。

これらを基に、Macdonald氏はOracle Autonomous Data Warehouseにデータをアップロードし、このクラウドベースのウェアハウスに組み込まれているJSON機能を使用して、サッカーの試合を表すために必要なネストされた複雑なJSONの配列構造を処理しました。その後、OCI Data Scienceの機械学習プラットフォームを使用して、一連の詳細な分析を実施しました。

分析では、全380試合の数十億ものデータポイントを取得し、それぞれの試合とゴールについて無数の指標の計算を行いました。これを基に各賞の候補者を絞り込み、プレミアリーグが各カテゴリの受賞者を選定するに至ったのです。

Macdonald氏は次のように述べています。「おそらく最も複雑な作業は、2つのデータ・プロバイダのAPIへの接続だったでしょう。この作業では、通常の初回認証手順を実施する必要があったからです。作業に着手した途端に、同じコマンドを何度も繰り返し実行しなければなりませんでした。その後の作業は簡単でした。」

受賞者の選定時に使用された統計分析を行うためのアーキテクチャ図
オラクルのデータ・サイエンティストが受賞者を決めるための計算に使用したアーキテクチャ。

プレミアリーグのシーズン閉幕時に2つの賞の受賞者を決定するために必要な解析結果が過去3年間、OCI環境で生成されています。リーダーボードとダッシュボードはそれぞれの試合が終わるたびに更新されます。暫定的な結果はソーシャルメディアで公開されます。有力候補は秘密にしたまま、シーズンを通して特別な出来事やゴールを広く伝えるのに一役買っています。

Macdonald氏は次のように説明しています。「私たちは何も見落としがないように、結果に関する詳細な分析とディスカッションを重ねました。」

使用された主なOCI製品

分析の要となるOCI Data Scienceサービスは、フルマネージド型のサーバーレス・プラットフォームです。データ・サイエンス・チームはこのサービスを使用して、高品質の機械学習モデルの構築、トレーニング、管理を行っています。自動化された機械学習機能は、機械学習モデルをチューニングしてその結果を説明しながら、さらにデータを迅速に検証し、最適なアルゴリズムを推奨します。

ドラッグ・アンド・ドロップでデータの統合と準備を行えるOCI Data Scienceのツールを使用すると、データ・レイクやデータ・ウェアハウスへのデータの移動が容易になります。クラウド・プラットフォームのセキュリティ・ツールとユーザー・インターフェイスを使用すると、複数のロールをプロジェクトに参加させ、機械学習モデルを共有できます。機械学習モデルに依存しない説明は、データ・サイエンティスト、ビジネス・アナリスト、経営幹部が結果に対して自信を持つことにつながります。

Oracle Autonomous Data Warehouseは、クラウドベースのデータウェアハウス・サービスです。プロビジョニング、構成、パッチ適用、チューニング、スケーリング、バックアップを自動化することによって、複雑な運用を行う手間を省くことができます。

OCI Computeは、ベアメタル・サーバーや仮想マシンから軽量コンテナまでのあらゆるワークロードに合わせて、高速で柔軟性が高く低コストなコンピューティング容量を提供します。OCI ComputeのVMインスタンスとベアメタル・インスタンスは非常に柔軟性が高く、最適なコストパフォーマンスを実現します。

OCI Object Storageでは、すべてのタイプのデータをネイティブ形式で安全に保存できます。組込みの冗長性機能を持つOCI Object Storageは、スケーラビリティと柔軟性を必要とするモダン・アプリケーションを構築するのに最適であり、分析、バックアップ、またはアーカイブの目的で複数のデータ・ソースを統合するために使用できます。

Macdonald氏はさらに、Oracle Analytics Cloudを使用して、それぞれの賞に関する完全なリーダーボードを提示しています。これにより、さまざまな基準に基づくデータの再ソートが可能になります。たとえば、18ヤードのペナルティエリア内でシュートを決めた選手をMost Powerful Goal(最も力強いゴール)賞の候補者に含めたり、分析結果を特定のチームの選手で絞り込んだりすることができます。

Oracle Analytics Cloudには、データ・インサイトを導出および共有するための完全なツール・セットが用意されています。このプラットフォームにより、アナリストはあらゆるデバイスでデータ所見をビジュアル化できます。また、さまざまなアルゴリズムと集計データを使用してデータの取込み、プロファイリング、整備を行い、MLモデルを大規模に実行できます。