Open Dataset
Data Structure ?
0.09M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
引用要求:
このデータセットは研究用に公開されています。詳細は[Cortez et al., 2009]に記載されています。
このデータベースを使用する予定がある場合は、以下の引用を含めてください:
P. Cortez、A. Cerdeira、F. Almeida、T. MatosおよびJ. Reis。
物理化学的特性からのデータマイニングによるワインの嗜好のモデリング。
Decision Support Systems誌、Elsevier社、47(4):547 - 553。ISSN: 0167 - 9236。
入手可能な場所: [@Elsevier] http://dx.doi.org/10.1016/j.dss.2009.05.016
[印刷前版 (pdf)] http://www3.dsi.uminho.pt/pcortez/winequality09.pdf
[bib] http://www3.dsi.uminho.pt/pcortez/dss09.bib
1. タイトル: ワインの品質
2. 出典
作成者: Paulo Cortez (ミニョ大学)、Antonio Cerdeira、Fernando Almeida、Telmo MatosおよびJose Reis (CVRVV) @ 2009
3. 過去の利用例:
P. Cortez、A. Cerdeira、F. Almeida、T. MatosおよびJ. Reis。
物理化学的特性からのデータマイニングによるワインの嗜好のモデリング。
Decision Support Systems誌、Elsevier社、47(4):547 - 553。ISSN: 0167 - 9236。
上記の参考文献では、赤ワインと白ワインのサンプルを使用して2つのデータセットが作成されました。
入力には客観的なテスト(例:pH値)が含まれ、出力は感覚データに基づいています
(ワインの専門家による少なくとも3回の評価の中央値)。各専門家はワインの品質を0(非常に悪い)から10(非常に優れている)の間で評価しました。いくつかのデータマイニング手法が回帰アプローチの下でこれらのデータセットをモデル化するために適用されました。サポートベクターマシンモデルが最良の結果を達成しました。いくつかの指標が計算されました:平均絶対偏差、固定誤差許容度(T)の混同行列など。また、入力変数の相対的な重要度をプロットしました(感度分析手順によって測定されたもの)。
4. 関連情報:
2つのデータセットはポルトガルの「Vinho Verde」ワインの赤ワインと白ワインのバリエーションに関連しています。
詳細については、http://www.vinhoverde.pt/en/ または参考文献[Cortez et al., 2009]を参照してください。
プライバシーおよび物流上の問題のため、物理化学的(入力)および感覚的(出力)変数のみが利用可能です(例:ブドウの品種、ワインのブランド、ワインの販売価格などのデータはありません)。
これらのデータセットは分類または回帰タスクとして見ることができます。
クラスは順序付けられており、不均衡です(例:優れたまたは劣ったワインよりもはるかに多くの普通のワインがあります)。外れ値検出アルゴリズムを使用して、少数の優れたまたは劣ったワインを検出することができます。また、すべての入力変数が関連しているかどうかはわかりません。そのため、特徴選択手法をテストすることが興味深いかもしれません。
5. インスタンスの数: 赤ワイン - 1599; 白ワイン - 4898。
6. 属性の数: 11 + 出力属性
注: いくつかの属性は相関している可能性があるため、某种の特徴選択を適用することが意味があります。
7. 属性情報:
詳細については、[Cortez et al., 2009]を読んでください。
入力変数(物理化学的テストに基づく):
1 - 固定酸度(酒石酸 - g / dm^3)
2 - 揮発性酸度(酢酸 - g / dm^3)
3 - クエン酸(g / dm^3)
4 - 残留糖(g / dm^3)
5 - 塩化物(塩化ナトリウム - g / dm^3)
6 - 遊離二酸化硫黄(mg / dm^3)
7 - 総二酸化硫黄(mg / dm^3)
8 - 密度(g / cm^3)
9 - pH
10 - 硫酸塩(硫酸カリウム - g / dm3)
11 - アルコール(容量%)
出力変数(感覚データに基づく):
12 - 品質(0から10のスコア)
8. 欠損属性値: なし
9. 属性の説明:
1 - 固定酸度: ワインに関与するほとんどの酸は固定されているか、または不揮発性です(容易に蒸発しません)
2 - 揮発性酸度: ワイン中の酢酸の量で、レベルが高すぎると不快な酢の味につながる可能性があります
3 - クエン酸: 少量含まれているクエン酸は、ワインに「新鮮さ」と風味を加えることができます
4 - 残留糖: 発酵が停止した後に残る糖の量で、1グラム/リットル未満のワインはまれで、45グラム/リットルを超えるワインは甘いとされます
5 - 塩化物: ワイン中の塩の量
6 - 遊離二酸化硫黄: 遊離形態のSO2は、分子状SO2(溶解ガスとして)と亜硫酸水素イオンの間で平衡状態で存在します; 微生物の増殖とワインの酸化を防止します
7 - 総二酸化硫黄: 遊離および結合形態のS02の量; 低濃度では、SO2はワイン中でほとんど検出できませんが、遊離SO2濃度が50 ppmを超えると、SO2がワインの香りと味に現れます
8 - 密度: ワインの密度は、アルコールと糖の含有量に応じて水の密度に近くなります
9 - pH: ワインの酸性度または塩基性度を0(非常に酸性)から14(非常に塩基性)のスケールで表します; ほとんどのワインのpHは3 - 4の間です
10 - 硫酸塩: ワインの添加物で、二酸化硫黄ガス(S02)のレベルに寄与することができ、抗菌剤および抗酸化剤として作用します
11 - アルコール: ワインのアルコール含有量の割合
出力変数(感覚データに基づく):
12 - 品質(0から10のスコア)
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.