Select Language

Open Dataset

リアルタイム入札

リアルタイム入札

455.45M
233 hits
0 likes
0 downloads
0 discuss
Business,Earth and Nature,Artificial Intelligence Classification

Data Structure ? 455.45M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    # コンテキスト これは、広告主がマーケティングスロット(例えば、ウェブページ上のバナー)に入札すべきかどうかを予測するために使用される*本当の*リアルタイム入札データです。説明変数には、ブラウザ、オペレーティングシステム、ユーザーがオンラインである日時、ユーザー識別子が以前に取引された市場などがあります。**'convert'** 列は、ユーザーが広告をクリックした場合は 1、そうでない場合は 0 となります。 # 内容 残念ながら、データは匿名化されているため、基本的には多くの特徴量エンジニアリングを行うことができません。私は PCA を適用し、線形説明力の 0.99 を保持しました。しかし、不均衡なデータに対する一般的なアルゴリズムをテストするためには、このデータは依然として非常に興味深いものです。;) # インスピレーション このデータは高度に不均衡であるため、正確性を重視して学習することは意味がありません。むしろ、データを交差検証することで、良好な AUC、F1 スコア、MCC または再現率を得ることを試みるべきです。 異なるモデル(ロジスティック回帰、決定木、SVM など)をこれらの指標で比較し、訓練データとテストデータの分割がデータに与える影響を見るのは興味深いです。 これらの[機械学習データセットにおける不均衡なクラスに対抗する戦術](http://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/)に従うのは良い戦略かもしれません。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 233
    • 0
    • 0
    • collect
    • Share