Select Language

Open Dataset

スタートレックの脚本、すべての《スタートレック》シリーズの脚本のオリジナルテキスト脚本と処理行

スタートレックの脚本、すべての《スタートレック》シリーズの脚本のオリジナルテキスト脚本と処理行

42.63M
362 hits
0 likes
0 downloads
0 discuss
NLP,Movies and TV Shows,Text Data,Text Mining Classification

スター・トレックの脚本テキストデータは、http://www.chakoteya.net/StarTrek/index.html のデータからスクレイピングされました。コードはこちら:https://github。......

Data Structure ? 42.63M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    スタートレックの脚本テキスト

    http://www.chakoteya.net/StarTrek/index.html からスクレイピングしたデータ

    コードはこちら: https://github.com/GJBroughton/Star_Trek_scripts

    情報検索技術、自然言語処理、基本的なウェブスクレイピングを試してみるために、以下の全エピソードから生の脚本と処理済みのセリフを生成したデータセットを作成しました:

    • スタートレック オリジナルシリーズ (TOS)

    • スタートレック アニメーションシリーズ (TAM)

    • スタートレック ネクストジェネレーション (TNG)

    • スタートレック ディープスペースナイン (DS9)

    • スタートレック ボイジャー (VOY)

    • スタートレック エンタープライズ (ENT)

    構造:

    all_series_line={シリーズ名:{エピソード番号:{キャラクター:全セリフ}}}

    例:
    all_series_lines['DS9']['エピソード 0']['SISKO']

    これがテキストマイニングの楽しみや練習に役立つことを願っています。ただし、見つけたエラーやデータセットのクリーニングや構造の改善方法については、ぜひ教えてください。


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:14 Go earn points?
    • 362
    • 0
    • 0
    • collect
    • Share