Select Language

Open Dataset

高速テキスト英単語ベクトル

高速テキスト英単語ベクトル

2155.4M
368 hits
0 likes
0 downloads
0 discuss
Universities and Colleges Classification

Data Structure ? 2155.4M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    英語の単語ベクトル --- fastTextについて
    fastTextは、単語表現の効率的な学習と文分類のためのライブラリです。fastTextの単語表現の主要な特徴の1つは、架空の単語であっても、任意の単語のベクトルを生成できることです。実際、fastTextの単語ベクトルは、その中に含まれる文字の部分文字列のベクトルから構築されます。これにより、誤ってスペルされた単語や単語の連結に対してもベクトルを構築することができます。 ベクトルについて
    これらの事前学習済みベクトルには、Wikipedia 2017、UMBCウェブベースコーパス、およびstatmt.orgのニュースデータセットを使用して学習された100万個の単語ベクトルが含まれています。合計で160億個のトークンが含まれています。 ファイルの最初の行には、語彙に含まれる単語の数とベクトルのサイズが記載されています。各行には、デフォルトのfastTextテキスト形式のように、単語の後にそのベクトルが記載されています。各値は空白で区切られています。単語は頻度の降順で並べられています。 謝辞
    これらの単語ベクトルは、クリエイティブ・コモンズ 表示 - 継承 3.0ライセンスの下で配布されています。 P. Bojanowski*、E. Grave*、A. Joulin、T. Mikolov、部分単語情報による単語ベクトルの拡張
    A. Joulin、E. Grave、P. Bojanowski、T. Mikolov、効率的なテキスト分類のためのトリック集
    A. Joulin、E. Grave、P. Bojanowski、M. Douze、H. Jégou、T. Mikolov、FastText.zip:テキスト分類モデルの圧縮

    (* これらの著者は同等の貢献をしています。)
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 368
    • 0
    • 0
    • collect
    • Share