Open Dataset
Data Structure ?
298.59M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
**データ分析と機械学習に最適なサッカーデータベース
-------------------------------------------------------------------
あなたが得られるもの:**
- 25,000 試合以上
- 10,000 選手以上
- 11 の欧州諸国とその主要なチャンピオンシップ
- 2008 年から 2016 年のシーズン
- 選手とチームの属性*は EA Sports の FIFA ビデオゲームシリーズから取得され、毎週の更新も含まれます
- チームのラインナップと陣形 (X, Y 座標)
- 最大 10 の提供元からのオッズ
- 10,000 試合以上についての詳細な試合イベント (ゴールタイプ、ボール支配率、コーナーキック、クロス、ファウル、カードなど...)
**2016 年 10 月 16 日: FIFA からのチーム属性を含む新しいテーブルが追加されました!*
----------
**オリジナルのデータソース:**
サッカー試合に関するデータは簡単に見つけることができますが、通常はさまざまなウェブサイトに散らばっています。あなたの生活を楽にするために、徹底的なデータ収集と処理が行われました。**このデータを商業利用しないでください。** データは以下のソースから取得されました。
- [http://football-data.mx-api.enetscores.com/][1] : スコア、ラインナップ、チーム陣形、イベント
- [http://www.football-data.co.uk/][2] : オッズ。[オッズの列名システムを理解するにはここをクリック:][3]
- [http://sofifa.com/][4] : EA Sports FIFA ゲームからの選手とチームの属性。*FIFA シリーズとすべての FIFA アセットは EA Sports の所有物です。*
データベースを見ると、選手と試合の外部キーがオリジナルのデータソースと同じであることに気づくでしょう。私はそれらの外部キーを「api_id」と呼んでいます。
----------
**データセットの改善:**
ラインナップに一部の選手が欠けている (NULL 値) ことに気づくでしょう。これは、私が FIFA からそれらの選手の属性を取得できなかったためです。クローリングアルゴリズムが改善されるにつれて、この問題は解決されます。また、データセットは国際試合、国内カップ、チャンピオンズリーグ、ユーロパリーグを含むように拡張されます。特定の大会に関心がある場合は、私に問い合わせてください。
このデータセットを改善する手助けをしたい場合は、**Hugo Mathien** に連絡してください。
[プロジェクトの GitHub にアクセスするにはここをクリック][5]
クローラーを使用することに興味がある方への重要な注意: 私が最初にクローリングスクリプト (Python で) を書いて以来、sofifa.com のデザインが変更され、それに伴ってスクリプトに新しい要件が生じました。選手をクロールする既存のスクリプト ('Player Spider') は、私が更新するまで機能しません。
----------
データの探索:
これが楽しい部分です。このデータセットを使ってできることはたくさんあります。私はこの概要ページにビジュアルと洞察を追加する予定ですが、まずはカーネルを見て、自分で試してみてください! 以下はいくつかのアイデアです。
**聖杯... ...** 明らかに、試合の結果を予測することです。ブッキーは 3 つのクラス (ホームチームの勝利、引き分け、アウェイチームの勝利) を使って予測しています。彼らは約 53% の確率で正しい予測をしています。これは私も自分の SVM を使ってこれまで達成した結果です。ランダムなスポーツ試合に対しては高い確率のように聞こえるかもしれませんが、ホームチームが約 46% の確率で勝つことを知っておく必要があります。つまり、常にホームチームの勝利を予測する基本ケースの精度は実際には 46% です。
**確率とオッズ**
SVM のような多クラス分類器を実行するとき、確率推定値を出力してオッズと比較することもできます。分散とオッズを見比べて、予測が大きく異なった試合を見つけてみてください。
**特徴量の探索と可視化**
選手とチームの属性、チーム陣形、試合中のイベントにアクセスできるので、サッカーの美しい試合について興味深い洞察を得ることができるはずです。誰が知るか、いつの日かガルディオラ自身があなたたちの誰かを雇うかもしれません!
データベースはオープンデータベースライセンスの下で公開されています。個々の論文の著作権は原著者に帰属します。
[1]: http://football-data.mx-api.enetscores.com/
[2]: http://www.football-data.co.uk/
[3]: http://www.football-data.co.uk/notes.txt
[4]: http://sofifa.com/
[5]: https://github.com/hugomathien/football-data-collection/tree/master/footballData
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.