Select Language

Open Dataset

OSCARネパール語コーパス、ネパール語テキストコーパス、NLPの教師なし言語モデルの訓練に使用

OSCARネパール語コーパス、ネパール語テキストコーパス、NLPの教師なし言語モデルの訓練に使用

3.1G
366 hits
0 likes
0 downloads
0 discuss
NLP,Computer Science,Movies and TV Shows,Text Data,Languages Classification

これらのファイルは[OSCARコーパス](https://oscar-corpus.com/)からのものです。詳細な情報については、彼らのサイトを訪問してください。このデータセットは......

Data Structure ? 3.1G

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    これらのファイルは[OSCARコーパス](https://oscar-corpus.com/)からのものです。詳細情報については、彼らのサイトを訪問してください。 このデータセットは現在、行レベルでシャッフルされており、メタデータは提供されていません。したがって、主に自然言語処理(NLP)の教師なし言語モデルのトレーニングに使用することを想定しています。 ファイルは以下の通りです: - ne.txt(非圧縮サイズ1.8GB) - ne_dedup.txt(非圧縮サイズ1.2GB) - このバージョンでは、重複する行が削除されています。 私はこのデータセットの所有者ではありません。もしあなたが研究にこのデータセットを使用することに決めた場合は、データセットの作成者の[論文](https://hal.inria.fr/hal-02148693)を引用してください。

    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:35 Go earn points?
    • 366
    • 0
    • 0
    • collect
    • Share