Select Language

Open Dataset

テキストコーパスデータセット、すべての『セインフィールド』のエピソード脚本を含むテキストコーパス

テキストコーパスデータセット、すべての『セインフィールド』のエピソード脚本を含むテキストコーパス

1.41M
564 hits
0 likes
2 downloads
0 discuss
Text Data Classification

コンテキスト 『セインフィールド』は私のお気に入りのテレビ番組です。私はサイトseから『セインフィールド』の全エピソードの脚本をスクレイピングするスクリプトを書きました......

Data Structure ? 1.41M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    背景

    『シーンフェルド』は私のお気に入りのテレビ番組です。私は、サイト seinology.com から『シーンフェルド』の全エピソードの脚本をスクレイピングし、それらをテキストコーパスにまとめて言語モデルを学習させるためのスクリプトを作成しました。ソースコードは こちら で入手できます。これが皆さんに役立つことを願っています。ご意見をいただければ幸いです。

    内容

    corpus.txt:長さ717,576語のコーパスで、『シーンフェルド』の脚本64,919行を含み、言語モデルの学習に使用できます。


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:15 Go earn points?
    • 564
    • 2
    • 0
    • collect
    • Share