Select Language

Open Dataset

クロム - 開発アーカイブ

クロム - 開発アーカイブ

262.77M
244 hits
0 likes
0 downloads
0 discuss
Computer Science,Internet,Software,Programming,Linguistics Classification

Data Structure ? 262.77M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    文脈 chromium-devは、公式のChromium開発者メーリングリストです。 内容 このデータセットは、[ggmbox](https://github.com/vmarkovtsev/ggmbox)を使用してGoogleグループをクロールすることで作成されました。メールのIDが与えられれば、生のメールを取得することが可能です。そのため、まずすべてのトピックを発見してリスト化し、その後個々のメールを取得しました。このデータセットには、**15379のトピック**と**78975のメッセージ**が含まれています。 `chromium-dev.tar.xz`は、2018年12月9日時点で取得したメールであり、`chromium-dev.json.gz`は各ディスカッショントピックのメタデータです。また、`threads.csv.gz`には、各トピックの平文メッセージが論理的な順序で、かつ一部のフィルタリングが行われた状態で含まれています。例えば、引用部分は削除されています。このデータセットを改善したり、カスタムの情報抽出器を作成したい場合は、[parse.go](https://github.com/vmarkovtsev/ggmbox/blob/master/parse.go)を参照してください。Pythonユーザーの場合、メールは[`email.message_from_file()`](https://docs.python.org/3/library/email.parser.html#email.message_from_file)を使用して読み込むことができますが、一部のファイルのBase64エンコードされた部分をデコードするには、追加の作業が必要になる場合があります。詳細は[MIME](https://en.wikipedia.org/wiki/MIME)を参照してください。 謝辞 メールの内容の権利は、それぞれの著者に帰属します。 関連項目: [golang-nutsアーカイブ](https://www.kaggle.com/vmarkovtsev/gonuts)
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 244
    • 0
    • 0
    • collect
    • Share