Open Dataset
Data Structure ?
0.11M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
コンテキスト
現在、ほとんどのスポーツでは、追跡データまたはイベントデータがスポーツデータサイエンティストに提供され、リーグ、チーム、試合、または選手を分析することができます。たとえば、サッカーでは、[Opta](https://www.optasports.com/)、[Statsbomb](https://statsbomb.com/)、[Wyscout](https://wyscout.com/)などの専門のデータプロバイダーによって、すべての主要リーグのイベントベースのデータが提供されています。テニスではこれが異なります。ホークアイによるカメラベースの追跡は可能ですが、このデータは外部に公開されておらず、最大のコートだけがこのシステムを備えています。
画像分類、検出、自然言語処理([deepl.com](https://www.deepl.com/translator))、音声認識([Siri](https://www.apple.com/siri/)、[Alexa](https://en.wikipedia.org/wiki/Amazon_Alexa))における機械学習の最新の進歩を考えると、これらすべての分野で大量の*容易にアクセス可能な*データが提供されていることは明らかです。
個人的には、大量の無料で利用可能な試合データがあれば、テニスに関する研究がもっと増えると思います。
ATPツアーで行われたすべての試合の統計データは、さまざまなソースから入手できます。たとえば、Jeff Sackmansの[githubリポジトリ](https://github.com/JeffSackmann)は良いスタート地点です。彼はまた、ポイントごとのデータが収集されている[試合チャートプロジェクト](http://www.tennisabstract.com/blog/2015/09/23/the-match-charting-project-quick-start-guide/)も持っています。
しかし、テニスを考えるとき、それは選手の動きや戦術などに関係しています。私が見て分析したいのは、ボールの動き、実際のラリーやショットです。
イベントデータにより、位置、時間、ストロークの情報を捕捉することができます。
概念実証として、そして史上最高のテニス選手の2人であるNovac DjokovicとRafael Nadalへの敬意を表して、私は彼らの[2019年オーストラリアオープン決勝](https://www.atptour.com/en/scores/2019/580/MS001/match-stats?isLive=False)の各ラリーとストロークを手動で注釈付けしました。幸いなことに、試合は3セットで終わりました。
内容
このデータは、試合で行われたすべてのポイントから構成されています。それは**イベント**から**ラリー**、実際の**ポイント**へと階層的に構築されています。
- **ポイント**:決勝で行われたすべてのポイントのリストで、サーバー、レシーバー、ポイントの種類、ストローク数、ラリーの時間、試合の新しいスコアに関する情報が含まれています。
- **ラリー**:サーバー、レシーバーなどを含むすべてのラリーのリスト。
- **イベント**:選手がボールを打ったたびに、ストロークの種類、選手の位置、相手の位置が記録されます。
- **サーブ**:失敗ではない各成功したサーブについて、可能な限り、サービスボックス内のサーブの位置が記録されます。
私はすでにデータクリーニングの難しい部分を終えており、このデータセットは理解しやすく、すぐに使える状態になっていることを願っています。
位置
x、yの位置は、図1に示されているコート座標系に基づいています。これらは、試合の開始時に[直接線形変換][1]を通じてピクセル座標から計算されました。(試合中にカメラの角度が少し変化したため、一部の位置は正確ではありません。)
![コート座標系。横軸はxを、縦軸はy方向を指します。][2]
インスピレーション
データを調べて、何が見つかるかを確かめてください。位置、時間、ストロークの情報には、ブレークポイントの数やファーストサーブの成功率などの単純な試合シートの統計よりも、選手や試合について多くのことを教えてくれる情報があるでしょうか?
このデータセットは好きなように使うことができますが、以下はいくつかのスタート地点です。
- プレイされたポイント数、サーブ成功率、勝った試合数、ブレークポイントなどの一般的な統計を生成し、他のウェブサイトの統計と比較するために、pandasを練習するのに最適です。
- コート上の選手の空間的な位置を可視化することができます。つまり、ナダルとドジョコビッチのレシーブ位置に違いがあるかどうかという質問に答えることができます。
- 移動距離などの移動統計を計算することができます。
- 各選手のフォアハンドとバックハンドの割合、またはスライス、トップスピンなどのショットの種類を計算することができます。
- 選手がどこにサーブしているかを見つけることができます。(ナダルは左利きであることを忘れないでください。)
始めるために、私はサンプルのカーネルを作成しました。[ここ](https://www.kaggle.com/robseidl/australian-open-mens-final-2019-data-exploration)で見つけることができます。
[1]: https://en.wikipedia.org/wiki/Direct_linear_transformation
[2]: https://www.dropbox.com/s/gakg677f0uvhmb2/Screenshot%202019-03-02%2021.44.11.png?raw=1
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.