Open Dataset
Data Structure ?
4M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
データセット上で線形回帰モデルを実施し、GPUの実行時間を予測します。4回の実行の平均値を目的変数として使用します。回帰モデルの既存の実装を使用することは許可されていません。バッチ更新(すべての訓練例を一度に使用)により勾配降下アルゴリズムを実装する必要があります。2 *サンプル数で正規化された誤差の二乗和[J(β0,β1)=(1 / 2m)[Σ(yᶺ(i)– y(i))2])をコストと誤差の指標として使用します。ここで、mはサンプル数です。すべての14個の特徴量を使用する必要があります。
また、第4部で説明されているロジスティック回帰モデルも実装します。同様に、既存のロジスティック回帰モデルの実装を使用することは許可されていません。バッチ更新(すべての訓練例を一度に使用)により勾配降下アルゴリズムを実装する必要があります。クラスで説明されているロジスティック回帰のコスト/誤差関数を使用する必要があります。さらに、精度/ ROCなども使用できます。
タスク:
*第1部:*データセットをダウンロードし、適切な訓練/テスト分割パーセンテージを使用して、訓練セットとテストセットにランダムに分割します。
第2部:平均GPU実行時間をモデル化する線形回帰モデルを設計します。レポートに回帰モデルの方程式を含めてください。
第3部:バッチ更新ルールを使用して勾配降下アルゴリズムを実装します。クラスと同じコスト関数(誤差の二乗和)を使用します。初期パラメータ値を報告してください。
第4部:この問題を二値分類問題に変換します。目的変数は2つのクラスを持つ必要があります。ロジスティック回帰を行い、このデータセットを分類します。訓練セットとテストセットの精度/誤差指標を報告してください。
実験:
* 1。*線形回帰とロジスティック回帰のさまざまなパラメータ(たとえば、学習率など)を実験し、パラメータの変化によって訓練セットとテストセットの誤差/精度がどのように変化するかを報告します。結果をグラフ化します。パラメータの最適値を報告してください。
2.線形回帰とロジスティック回帰の収束閾値をさまざまに試行します。訓練セットとテストセットの誤差結果を閾値の関数としてグラフ化し、閾値の変更が誤差にどのように影響するかを説明します。最適な閾値を選択し、勾配降下の反復回数に関する関数グラフとテスト誤差を(1つのグラフに)グラフ化します。
3。ランダムに8つの特徴量を選択し、この10個の特徴量のみでモデルを再訓練します。元の特徴量セット(14個)と8つのランダムな特徴量を使用した場合の訓練誤差とテスト誤差の結果を比較します。ランダムに選択された10個の特徴量を報告してください。
4.ここで、出力を予測するのに最適だと思われる8つの特徴量を選択し、この10個の特徴量を使用してモデルを再訓練します。元の特徴量セットを使用した場合とランダムな特徴量を使用した場合と比較します。あなたが選択した特徴量は、ランダムに選択した特徴量よりも良い結果をもたらしますか?なぜですか?あなたが選択した特徴量は、すべての特徴量を使用するよりも良い結果をもたらしますか?なぜですか?
リソース:
エンリケ・G・パレデス(egparedes'@'ifi.uzh.ch)。スイス連邦工科大学チューリッヒ校情報学部可視化とマルチメディア研究室。チューリッヒ、8050年。スイス
ラファエル・バレスター・リポール(rballester'@'ifi.uzh.ch)。スイス連邦工科大学チューリッヒ校情報学部可視化とマルチメディア研究室。チューリッヒ、8050。スイス
引用:
このデータセットを使用する場合は、以下の1つまたは2つを引用してください。
ラファエル・バレスター・リポール(Rafael Ballester-Ripoll)、エンリケ・パレデス(Enrique G.ソボルテンソルトレインを用いたグローバル感度分析。arXivコンピュータサイエンス/数値解析電子版、2017年
セドリック・ヌグテレン(Cedric Nugteren)とバレリウ(Valeriu Codreanu)CLTune:OpenCLカーネルの汎用自動チューニング掲載誌:MCSoC:第9回組み込みマルチコア/多核システムオンチップ国際ワークショップ。IEEE、2015年
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.