Select Language

Open Dataset

虹彩データセットのロジスティック回帰

虹彩データセットのロジスティック回帰

273 hits
0 likes
0 downloads
0 discuss
Business,Earth and Nature,Computer Science Classification

Data Structure ? 0M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    **アヤメ種データセットの可視化:** - このデータには4つの特徴量があります。 - 各サブプロットは2つの特徴量を考慮しています。 - この図から、アヤメの品種であるIris - setosaのデータポイントはまとまっており、他の2つの品種のデータポイントはある程度重なっていることがわかります。 **ロジスティック回帰を用いた分類:** - 各品種には50個のサンプルがあります。各品種のデータは3つのセット(訓練セット、検証セット、テストセット)に分割されます。 - 3つの品種について訓練データは別々に用意されます。たとえば、品種がIris - Setosaの場合、対応する出力は1に設定され、他の2つの品種については0に設定されます。 - 訓練データセットは別々にモデル化されます。3セットのモデルパラメータ(シータ)が得られます。出力を予測するためにシグモイド関数が使用されます。 - コスト関数を用いて、勾配降下法を使って「シータ」に収束させます。 **最適なモデルの選択:** - モデルをより良く訓練するために多項式特徴量が含まれます。より多くの多項式特徴量を含めると訓練セットにより良く適合しますが、検証セットで良い結果が得られない可能性があります。多項式特徴量を増やすにつれて、訓練データのコストは減少します。 - ですから、どれが最適な適合かを知るために、まず訓練データセットを使ってモデルパラメータを求め、それを検証セットに適用します。検証セットで最も低いコストを与えるものが、データにより良く適合するものとして選ばれます。 - 多項式特徴量を追加するにつれてデータの過学習を抑制するために正則化項が含まれます。 *観察結果:* - Iris - Setosaについては、多項式特徴量の追加は交差検証セットで良い結果をもたらさなかった。 - Iris - Versicolorについては、より多くの多項式特徴量を含める必要があるように見えます。しかし、すでに3次までの多項式特徴量が使用されていたため、さらに特徴量を追加するアイデアは断念されました。 **バイアスとバリアンスのトレードオフ:** - より多くの特徴量を含めることでモデルがより良く機能するかどうかを確認します。サンプル数を段階的に増やし、対応するモデルパラメータとコストを計算します。得られたモデルパラメータを使って検証セットを用いてコストを求めることができます。 - もし両方のセットのコストが収束する場合、それは適合が良いことを示しています。 訓練誤差: - ヒューリスティック関数は理想的には正の出力に対しては1、負の出力に対しては0であるべきです。 - 正の出力に対してヒューリスティック関数が0.5以上で、負の出力に対して0.5未満であれば許容できます。 - すべてのセットについて訓練誤差が計算されます。 *観察結果:* Iris - SetosaとIris - Virginicaについては非常に良い結果が得られました。Iris - Versicolorの検証セットを除いて、他のセットはかなり良くモデル化されています。 **精度:** *ヒューリスティック関数から得られた最も高い確率が、その品種に属すると予測されます。 検証データの精度は93.33%でした。そして驚くべきことに、テストデータの精度は100%でした。* 改善点: 勾配降下法の代わりに、モデルパラメータを求めるためのより高度なアルゴリズムを使用することができます。 最良の性能を得るために、訓練データ、検証データ、テストデータをランダムに選択することができます。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 273
    • 0
    • 0
    • collect
    • Share