AI Technology Community
payititi-AI助手
2021-12-06 16:42:01
ランダムな森の特徴
先ほど述べたように、ランダムフォレストは非常に柔軟で実用的な手法であり、以下のような特徴があります:
現行のすべてのアルゴリズムの中で、極めて高い精度を持っています/現在のアルゴリズムの中で精度が群を抜いています;
大規模なデータセットでも効率的に動作します/大規模なデータベースでも効率的に動作します;
高次元の特徴を持つ入力サンプルを処理でき、しかも次元削減を必要としません/数千の入力変数を変数を削除することなく処理できます;
分類問題における各特徴の重要性を評価できます/分類においてどの変数が重要かを推定します;
生成過程で、内部生成誤差の無偏推定値を取得できます/フォレスト構築が進むにつれて、汎化誤差の内部無偏推定値を生成します;
欠損値の問題に対しても良好な結果が得られます/欠損データを推定する効果的な方法があり、データの大部分が欠損している場合でも精度を維持します
... ...
実際には、ランダムフォレストの特徴はこの6点だけではありません。機械学習の分野では、Leatherman(多面手)のような存在で、ほとんど何でも投入でき、基本的に利用可能です。推定推論マッピングに特に適しており、SVMのように多くのパラメータを調整する必要がありません。
6
item of content
ランダムフォレスト(Random Forest、略してRF)は広範な応用可能性を持っており、マーケティングから医療保険まで多岐にわたり利用されています。マーケティングシミュレーションのモデリングや顧客の獲得、維持および離反の統計に使用されるだけでなく、疾患リスクや患者の感受性の予測にも用いられます。私自身、初めてこのアルゴリズムに触れたのは校外コンペティションに参加していた時でした。近年の国内外の大会、例えば2013年の百度校园电影推荐系统大赛(Baiduキャンパス映画推薦システムコンペティション)、2014年の阿里巴巴天池大数据竞赛(アリババTianchiビッグデータコンペティション)やKaggleデータサイエンスコンペティションなどでも、参加者の多くがランダムフォレストを使用しています。さらに、私の個人的な経験からも、最終選考に残ったチームの大部分がRandom ForestまたはGBDTアルゴリズムを選択していることが分かります。したがって、Random Forestはその精度において相当な優位性を持っていると言えるでしょう。
- 797hits
- 0replay
-
0like
- collect
- send report