Select Language

Open Dataset

英語 ウィキペディア記事 2017年8月20日 モデル

英語 ウィキペディア記事 2017年8月20日 モデル

1666.44M
231 hits
0 likes
0 downloads
0 discuss
Earth and Nature,Text Mining Classification

Data Structure ? 1666.44M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト これは、データサイエンスナッシュビルの11月のミートアップ「Gensim入門」のために作成された事前学習済みGensimモデルのコレクションです。私はこれらのモデルを[英語版ウィキペディア記事2017-08-20 SQLite][1]データセットで学習させ、使用したスクリプトをアップロードする予定です。近いうちにリンクをここで確認してください。 内容 - 辞書 - TF-IDF - 潜在的意味索引/分析 (LSI/LSA) - トピック数 = 200 - シングルパス - 潜在的ディリクレ配分 (LDA) - トピック数 = 200 - シングルパス - Word2Vec - ベクトルサイズ = 100 - エポック数 = 5 - FastText - ベクトルサイズ = 100 - エポック数 = 5 謝辞 これらの事前学習済みモデルが、Gensimに新しく触れる初心者のデータサイエンティストに役立つことを願っています。ノートブックを作成し、[英語版ウィキペディア記事2017-08-20 SQLite][2]をリンクすることをおすすめします。これにより、遊べるデータが手に入ります。なお、これらのモデルは一切チューニングされていません。私は単にGensimモデルの学習方法を示し、ユーザーがAPIを探索できるようにすることを目的としています。 バナー画像は、[Unsplash][4]の[Jack T][3]氏によって提供されました。 [1]: https://www.kaggle.com/jkkphys/english-wikipedia-articles-20170820-sqlite [2]: https://www.kaggle.com/jkkphys/english-wikipedia-articles-20170820-sqlite [3]: https://unsplash.com/@blankest [4]: https://unsplash.com
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 231
    • 0
    • 0
    • collect
    • Share