Select Language

Open Dataset

20万英語ユーモアテキストデータセット

20万英語ユーモアテキストデータセット

24.57M
847 hits
0 likes
0 downloads
0 discuss
OCR/Text Detection Classification

公開時間:2016年 このデータベースには約208,000個のジョークがあります。現在のデータセットのファイルには、3つのソースからのジョークが含まれています。---------------------------------......

Data Structure ? 24.57M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    公開時間: 2016年

    このデータベースには約208,000個のジョークが含まれています。

    ファイル

    現在のデータセットには、3つのソースからのジョークが含まれています。

    ----------------------------------------------
    reddit_jokes.json | 195,000個のジョーク | 740万トークン
    stupidstuff.json  | 3,770個のジョーク | 396,000トークン
    wocka.json      | 10,000個のジョーク | 111万トークン
    ----------------------------------------------
    合計        | 208,000個のジョーク | 891万トークン
    ----------------------------------------------

    形式

    各ファイルはJSONドキュメントで、ジョークオブジェクトの平面リストが含まれています。各ジョークオブジェクトは常に、データセットに基づく追加フィールドを持つ本文フィールドを持っています。明らかに、これらのジョークがすべて面白いわけではありません。私たちは最良のものを見つけ、関連する他の分野で並べ替えたいと考えています。なお、このタイトルは多くの場合、ジョークの一部になっています(特にRedditに投稿されたジョークの場合)。

    # データセット

    データ引用:

    @misc{pungas,
        title={英語の平文ジョークのデータセット。},
        url={https://github.com/taivop/joke-dataset},
        author={Pungas, Taivo},
        year={2017},
        publisher = {GitHub},
        journal = {GitHubリポジトリ}
    }
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:6 Go earn points?
    • 847
    • 0
    • 0
    • collect
    • Share