Select Language

Open Dataset

手書き数学表現

手書き数学表現

65.92M
703 hits
0 likes
2 downloads
0 discuss
Arts and Entertainment,Artificial Intelligence Classification

コンテキスト もしあなたが数学式を入力したことがあるなら、あなたは思うかもしれません。「もし手書きの式を写真に撮って自動的に認識してくれたら、素敵ではないでしょうか?」このデータセット......

Data Structure ? 65.92M

    README.md

    文脈上、もしあなたが数学の式を入力したことがあるなら、「手書きの式を写真撮影して、自動的に認識させることができたら素敵だな」と思うかもしれません。このデータセットには、システムを構築するために必要なすべてのデータが含まれています。このデータセットは、様々な国の数百人の筆者が手書きした11,000以上の式を提供しており、4つのCROHME競技会のデータセットを統合しています。筆者たちは、一連の式の中から印刷された式をコピーするように要求されました。このコーパスは、さまざまなタスクが要求する多様性を網羅するように設計されており、既存の数学コーパスやウィキペディアのページに埋め込まれた式から選択されています。異なるデバイス(異なるデジタルペン技術、ホワイトボード入力デバイス、ディスプレイ付きタブレット)が使用されているため、異なる尺度と解像度が用いられています。このデータセットはオンライン信号のみを提供します。2013年の最後の競技会では、テスト部分は完全に独自のもので、トレイン部分には5つの既存のデータセットが使用されました:* MathBrush(ウォータールー大学)、* HAMEX(ナント大学)、* MfrDB(チェコ工科大学)、* ExpressMatch(サンパウロ大学)、* KAISTデータセット。CROHME 2014では、987個の新しい式と2つの新しいタスク(孤立記号認識と行列認識)を含む新しいテストセットを作成しました。これらの新しいタスクの評価スクリプトとして、トレーニングファイルとテストファイルが提供されています。孤立記号データセットについては、既存のデータセットから完全な式の要素を抽出して使用しており、これには分割エラーも含まれています。行列認識タスクでは、380個の新しい式がラベル付けされ、トレーニングセットとテストセットに分割されています。さらに、2012年の競技会の6人の参加者が、彼らが認めた2012年のテスト部分の式を提供しました。これらのデータにより、決定融合や評価指標の研究が可能になります。技術的な詳細:各式に対応するインクはInkMLファイルに保存されています。


    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:12 Go earn points?
    • 703
    • 2
    • 0
    • collect
    • Share