Open Dataset
Data Structure ?
0.01M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
# コンテキスト
これはUCIのガラス識別データセットです。IDを含む10個の属性があります。目的変数はガラスの種類(7つの離散値)です。
# 内容
属性情報:
1. ID番号:1から214(CSVファイルから削除されています)
2. RI:屈折率
3. Na:ナトリウム(単位:対応する酸化物中の重量パーセント、属性4 - 10も同様)
4. Mg:マグネシウム
5. Al:アルミニウム
6. Si:シリコン
7. K:カリウム
8. Ca:カルシウム
9. Ba:バリウム
10. Fe:鉄
11. ガラスの種類:(クラス属性)
-- 1 建物の窓(フロート法処理済み)
-- 2 建物の窓(非フロート法処理済み)
-- 3 車両の窓(フロート法処理済み)
-- 4 車両の窓(非フロート法処理済み)(このデータベースにはありません)
-- 5 容器
-- 6 食器
-- 7 ヘッドランプ
# 謝辞
https://archive.ics.uci.edu/ml/datasets/Glass+Identification
出典:
作成者:
B. German
中央研究施設
内務省法科学サービス
アルダーマストン、リーディング、バークシャー RG7 4PN
提供元:
Vina Spiehler博士、DABFT
診断製品会社
(213) 776 - 0180(内線3014)
# 着想
このデータセットのデータ探索から、2つの重要な特性が明らかになります。
1) 変数は目的変数を含めて互いに高度に**相関**しています。
では、このデータセットに最適な機械学習アルゴリズムはランダムフォレスト、KNN、それとも他のアルゴリズムでしょうか?また、データセットが小さすぎるため、PCAを適用する可能性はありますか、それとも完全に避けるべきでしょうか?
2) データが高度に**歪んで**います。
スケーリングで十分ですか、それともデータを正規化するために他の手法を適用すべきでしょうか?例えばボックス - コックス変換など。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.