Select Language

Open Dataset

2019年オーストラリアテニスオープンファイナル

2019年オーストラリアテニスオープンファイナル

0.11M
460 hits
0 likes
43 downloads
0 discuss
News,Sports,Tennis Classification

Data Structure ? 0.11M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト 現在、ほとんどのスポーツでは、追跡データまたはイベントデータがスポーツデータサイエンティストに提供され、リーグ、チーム、試合、または選手を分析することができます。たとえば、サッカーでは、[Opta](https://www.optasports.com/)、[Statsbomb](https://statsbomb.com/)、[Wyscout](https://wyscout.com/)などの専門のデータプロバイダーによって、すべての主要リーグのイベントベースのデータが提供されています。テニスではこれが異なります。ホークアイによるカメラベースの追跡は可能ですが、このデータは外部に公開されておらず、最大のコートだけがこのシステムを備えています。 画像分類、検出、自然言語処理([deepl.com](https://www.deepl.com/translator))、音声認識([Siri](https://www.apple.com/siri/)、[Alexa](https://en.wikipedia.org/wiki/Amazon_Alexa))における機械学習の最新の進歩を考えると、これらすべての分野で大量の*容易にアクセス可能な*データが提供されていることは明らかです。 個人的には、大量の無料で利用可能な試合データがあれば、テニスに関する研究がもっと増えると思います。 ATPツアーで行われたすべての試合の統計データは、さまざまなソースから入手できます。たとえば、Jeff Sackmansの[githubリポジトリ](https://github.com/JeffSackmann)は良いスタート地点です。彼はまた、ポイントごとのデータが収集されている[試合チャートプロジェクト](http://www.tennisabstract.com/blog/2015/09/23/the-match-charting-project-quick-start-guide/)も持っています。 しかし、テニスを考えるとき、それは選手の動きや戦術などに関係しています。私が見て分析したいのは、ボールの動き、実際のラリーやショットです。 イベントデータにより、位置、時間、ストロークの情報を捕捉することができます。 概念実証として、そして史上最高のテニス選手の2人であるNovac DjokovicとRafael Nadalへの敬意を表して、私は彼らの[2019年オーストラリアオープン決勝](https://www.atptour.com/en/scores/2019/580/MS001/match-stats?isLive=False)の各ラリーとストロークを手動で注釈付けしました。幸いなことに、試合は3セットで終わりました。 内容 このデータは、試合で行われたすべてのポイントから構成されています。それは**イベント**から**ラリー**、実際の**ポイント**へと階層的に構築されています。 - **ポイント**:決勝で行われたすべてのポイントのリストで、サーバー、レシーバー、ポイントの種類、ストローク数、ラリーの時間、試合の新しいスコアに関する情報が含まれています。 - **ラリー**:サーバー、レシーバーなどを含むすべてのラリーのリスト。 - **イベント**:選手がボールを打ったたびに、ストロークの種類、選手の位置、相手の位置が記録されます。 - **サーブ**:失敗ではない各成功したサーブについて、可能な限り、サービスボックス内のサーブの位置が記録されます。 私はすでにデータクリーニングの難しい部分を終えており、このデータセットは理解しやすく、すぐに使える状態になっていることを願っています。 位置 x、yの位置は、図1に示されているコート座標系に基づいています。これらは、試合の開始時に[直接線形変換][1]を通じてピクセル座標から計算されました。(試合中にカメラの角度が少し変化したため、一部の位置は正確ではありません。) ![コート座標系。横軸はxを、縦軸はy方向を指します。][2] インスピレーション データを調べて、何が見つかるかを確かめてください。位置、時間、ストロークの情報には、ブレークポイントの数やファーストサーブの成功率などの単純な試合シートの統計よりも、選手や試合について多くのことを教えてくれる情報があるでしょうか? このデータセットは好きなように使うことができますが、以下はいくつかのスタート地点です。 - プレイされたポイント数、サーブ成功率、勝った試合数、ブレークポイントなどの一般的な統計を生成し、他のウェブサイトの統計と比較するために、pandasを練習するのに最適です。 - コート上の選手の空間的な位置を可視化することができます。つまり、ナダルとドジョコビッチのレシーブ位置に違いがあるかどうかという質問に答えることができます。 - 移動距離などの移動統計を計算することができます。 - 各選手のフォアハンドとバックハンドの割合、またはスライス、トップスピンなどのショットの種類を計算することができます。 - 選手がどこにサーブしているかを見つけることができます。(ナダルは左利きであることを忘れないでください。) 始めるために、私はサンプルのカーネルを作成しました。[ここ](https://www.kaggle.com/robseidl/australian-open-mens-final-2019-data-exploration)で見つけることができます。 [1]: https://en.wikipedia.org/wiki/Direct_linear_transformation [2]: https://www.dropbox.com/s/gakg677f0uvhmb2/Screenshot%202019-03-02%2021.44.11.png?raw=1
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 460
    • 43
    • 0
    • collect
    • Share