Open Dataset
Data Structure ?
65.92M
README.md
文脈上、もしあなたが数学の式を入力したことがあるなら、「手書きの式を写真撮影して、自動的に認識させることができたら素敵だな」と思うかもしれません。このデータセットには、システムを構築するために必要なすべてのデータが含まれています。このデータセットは、様々な国の数百人の筆者が手書きした11,000以上の式を提供しており、4つのCROHME競技会のデータセットを統合しています。筆者たちは、一連の式の中から印刷された式をコピーするように要求されました。このコーパスは、さまざまなタスクが要求する多様性を網羅するように設計されており、既存の数学コーパスやウィキペディアのページに埋め込まれた式から選択されています。異なるデバイス(異なるデジタルペン技術、ホワイトボード入力デバイス、ディスプレイ付きタブレット)が使用されているため、異なる尺度と解像度が用いられています。このデータセットはオンライン信号のみを提供します。2013年の最後の競技会では、テスト部分は完全に独自のもので、トレイン部分には5つの既存のデータセットが使用されました:* MathBrush(ウォータールー大学)、* HAMEX(ナント大学)、* MfrDB(チェコ工科大学)、* ExpressMatch(サンパウロ大学)、* KAISTデータセット。CROHME 2014では、987個の新しい式と2つの新しいタスク(孤立記号認識と行列認識)を含む新しいテストセットを作成しました。これらの新しいタスクの評価スクリプトとして、トレーニングファイルとテストファイルが提供されています。孤立記号データセットについては、既存のデータセットから完全な式の要素を抽出して使用しており、これには分割エラーも含まれています。行列認識タスクでは、380個の新しい式がラベル付けされ、トレーニングセットとテストセットに分割されています。さらに、2012年の競技会の6人の参加者が、彼らが認めた2012年のテスト部分の式を提供しました。これらのデータにより、決定融合や評価指標の研究が可能になります。技術的な詳細:各式に対応するインクはInkMLファイルに保存されています。
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.