Open Dataset
Data Structure ?
0.43M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
引用依頼:このデータセットは研究用に公開されています。詳細は[Cortez et al., 2009]に記載されています。このデータベースを使用する予定の場合は、以下の引用を含めてください。
P. Cortez, A. Cerdeira, F. Almeida, T. Matos and J. Reis. 物理化学的特性からのデータマイニングによるワインの嗜好性のモデリング。Decision Support Systems, Elsevier, 47(4):547 - 553. ISSN: 0167 - 9236.
入手先:[@Elsevier] http://dx.doi.org/10.1016/j.dss.2009.05.016 [事前版 (pdf)] http://www3.dsi.uminho.pt/pcortez/winequality09.pdf [bib] http://www3.dsi.uminho.pt/pcortez/dss09.bib
タイトル:ワインの品質
作成元:Paulo Cortez (Univ. Minho)、Antonio Cerdeira、Fernando Almeida、Telmo Matos and Jose Reis (CVRVV) @ 2009
過去の使用例:
P. Cortez, A. Cerdeira, F. Almeida, T. Matos and J. Reis. 物理化学的特性からのデータマイニングによるワインの嗜好性のモデリング。Decision Support Systems, Elsevier, 47(4):547 - 553. ISSN: 0167 - 9236.
上記の参考文献では、赤ワインと白ワインのサンプルを使用して2つのデータセットが作成されました。入力には客観的なテスト(例:pH値)が含まれ、出力は官能データ(ワイン専門家による少なくとも3回の評価の中央値)に基づいています。各専門家はワインの品質を0(非常に悪い)から10(非常に優れている)の範囲で評価しました。回帰アプローチの下で、いくつかのデータマイニング手法がこれらのデータセットをモデリングするために適用されました。サポートベクターマシンモデルが最良の結果を達成しました。いくつかの指標が計算されました:平均絶対偏差(MAD)、固定誤差許容範囲(T)の混同行列など。また、入力変数の相対的な重要度(感度分析手順によって測定された)をプロットしました。
関連情報:
2つのデータセットは、ポルトガルの「Vinho Verde」ワインの赤ワインと白ワインのバリエーションに関連しています。詳細については、http://www.vinhoverde.pt/en/ または参考文献[Cortez et al., 2009]を参照してください。プライバシーおよび物流上の問題により、物理化学的(入力)および官能的(出力)変数のみが利用可能です(例:ブドウの品種、ワインのブランド、ワインの販売価格などのデータはありません)。
これらのデータセットは、分類または回帰タスクとして見ることができます。クラスは順序付けられており、不均衡です(例:優れたまたは劣ったワインよりもはるかに多くの普通のワインがあります)。外れ値検出アルゴリズムを使用して、少数の優れたまたは劣ったワインを検出することができます。また、すべての入力変数が関連しているかどうかはわかりません。したがって、特徴選択手法をテストすることが興味深いかもしれません。
インスタンスの数:赤ワイン - 1599;白ワイン - 4898。
属性の数:11 + 出力属性
注:いくつかの属性は相関している可能性があるため、何らかの特徴選択を適用することは理にかなっています。
属性情報:
詳細については、[Cortez et al., 2009]を読んでください。
入力変数(物理化学的テストに基づく):1 - 固定酸度(酒石酸 - g / dm^3)2 - 揮発性酸度(酢酸 - g / dm^3)3 - クエン酸(g / dm^3)4 - 残留糖分(g / dm^3)5 - 塩化物(塩化ナトリウム - g / dm^3)6 - 遊離二酸化硫黄(mg / dm^3)7 - 総二酸化硫黄(mg / dm^3)8 - 密度(g / cm^3)9 - pH 10 - 硫酸塩(硫酸カリウム - g / dm3)11 - アルコール(体積%)出力変数(官能データに基づく):12 - 品質(0から10のスコア)
欠落している属性値:なし
属性の説明:
1 - 固定酸度:ワインに含まれるほとんどの酸は固定されているか、または不揮発性(容易に蒸発しない)です。
2 - 揮発性酸度:ワイン中の酢酸の量で、そのレベルが高すぎると不快な酢の味につながる可能性があります。
3 - クエン酸:少量含まれているクエン酸は、ワインに「新鮮さ」と風味を加えることができます。
4 - 残留糖分:発酵が停止した後に残る糖分の量で、1グラム/リットル未満のワインはまれで、45グラム/リットルを超えるワインは甘口と見なされます。
5 - 塩化物:ワイン中の塩の量。
6 - 遊離二酸化硫黄:SO2の遊離形態は、分子状SO2(溶解ガスとして)と亜硫酸水素イオンとの間で平衡状態に存在します。微生物の増殖とワインの酸化を防ぎます。
7 - 総二酸化硫黄:S02の遊離形態と結合形態の量。低濃度では、SO2はワイン中でほとんど検出できませんが、遊離SO2濃度が50 ppmを超えると、SO2がワインの香りと味に現れます。
8 - 密度:水の密度は、アルコールと糖分の含有率に応じて水の密度に近くなります。
9 - pH:0(非常に酸性)から14(非常に塩基性)のスケールでワインの酸性度または塩基性度を表します。ほとんどのワインのpHは3 - 4の間です。
10 - 硫酸塩:ワインの添加物で、二酸化硫黄ガス(S02)のレベルに寄与することができ、抗菌剤および抗酸化剤として作用します。
11 - アルコール:ワインのアルコール含有率(体積%)。
出力変数(官能データに基づく):12 - 品質(0から10のスコア)
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.