Open Dataset
Data Structure ?
0M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
**アヤメ種データセットの可視化:**
- このデータには4つの特徴量があります。
- 各サブプロットは2つの特徴量を考慮しています。
- この図から、アヤメの品種であるIris - setosaのデータポイントはまとまっており、他の2つの品種のデータポイントはある程度重なっていることがわかります。
**ロジスティック回帰を用いた分類:**
- 各品種には50個のサンプルがあります。各品種のデータは3つのセット(訓練セット、検証セット、テストセット)に分割されます。
- 3つの品種について訓練データは別々に用意されます。たとえば、品種がIris - Setosaの場合、対応する出力は1に設定され、他の2つの品種については0に設定されます。
- 訓練データセットは別々にモデル化されます。3セットのモデルパラメータ(シータ)が得られます。出力を予測するためにシグモイド関数が使用されます。
- コスト関数を用いて、勾配降下法を使って「シータ」に収束させます。
**最適なモデルの選択:**
- モデルをより良く訓練するために多項式特徴量が含まれます。より多くの多項式特徴量を含めると訓練セットにより良く適合しますが、検証セットで良い結果が得られない可能性があります。多項式特徴量を増やすにつれて、訓練データのコストは減少します。
- ですから、どれが最適な適合かを知るために、まず訓練データセットを使ってモデルパラメータを求め、それを検証セットに適用します。検証セットで最も低いコストを与えるものが、データにより良く適合するものとして選ばれます。
- 多項式特徴量を追加するにつれてデータの過学習を抑制するために正則化項が含まれます。
*観察結果:*
- Iris - Setosaについては、多項式特徴量の追加は交差検証セットで良い結果をもたらさなかった。
- Iris - Versicolorについては、より多くの多項式特徴量を含める必要があるように見えます。しかし、すでに3次までの多項式特徴量が使用されていたため、さらに特徴量を追加するアイデアは断念されました。
**バイアスとバリアンスのトレードオフ:**
- より多くの特徴量を含めることでモデルがより良く機能するかどうかを確認します。サンプル数を段階的に増やし、対応するモデルパラメータとコストを計算します。得られたモデルパラメータを使って検証セットを用いてコストを求めることができます。
- もし両方のセットのコストが収束する場合、それは適合が良いことを示しています。
訓練誤差:
- ヒューリスティック関数は理想的には正の出力に対しては1、負の出力に対しては0であるべきです。
- 正の出力に対してヒューリスティック関数が0.5以上で、負の出力に対して0.5未満であれば許容できます。
- すべてのセットについて訓練誤差が計算されます。
*観察結果:*
Iris - SetosaとIris - Virginicaについては非常に良い結果が得られました。Iris - Versicolorの検証セットを除いて、他のセットはかなり良くモデル化されています。
**精度:**
*ヒューリスティック関数から得られた最も高い確率が、その品種に属すると予測されます。
検証データの精度は93.33%でした。そして驚くべきことに、テストデータの精度は100%でした。*
改善点:
勾配降下法の代わりに、モデルパラメータを求めるためのより高度なアルゴリズムを使用することができます。
最良の性能を得るために、訓練データ、検証データ、テストデータをランダムに選択することができます。






















×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.