AI Technology Community
小小程序员
2021-05-14 18:19:21
Logistic Regression論理回帰
ロジスティック回帰は、「イベント = 成功」と「イベント = 失敗」の確率を計算するために使用されます。目的変数のタイプが二元(1 / 0、真/偽、是/否)変数の場合、ロジスティック回帰を使用する必要があります。ここで、Yの値は0から1までで、以下の方程式で表すことができます。
オッズ = p / (1 - p) = イベント発生の確率 / イベント非発生の確率 ln(オッズ) = ln(p / (1 - p)) ロジット(p) = ln(p / (1 - p)) = b0 + b1X1 + b2X2 + b3X3.... + bkXk
上記の式で、pはある特徴を持つ確率を表します。あなたはおそらくこのような質問をするでしょう:「なぜ公式の中で対数logを使うのですか?」。
ここでは二項分布(目的変数)を使用しているため、この分布に最適なリンク関数を選ぶ必要があります。それがロジット関数です。上記の方程式では、通常の回帰で使用される最小二乗誤差を最小化するのではなく、観測サンプルの最尤推定値によってパラメータを選択します。
要点:
分類問題に広く使用されます。
ロジスティック回帰は、説明変数と目的変数が線形関係であることを要求しません。予測の相対リスク指数ORに非線形の対数変換を使用するため、さまざまなタイプの関係を扱うことができます。
過学習と学習不足を避けるために、すべての重要な変数を含める必要があります。これを確実にする良い方法の1つは、段階的選択法を使用してロジスティック回帰を推定することです。
サンプル数が少ない場合、最尤推定の効果は通常の最小二乗法よりも劣るため、大きなサンプルサイズが必要です。
説明変数は相互に関連していてはならず、すなわち多重共線性を持っていてはいけません。ただし、分析とモデリングでは、分類変数の相互作用の影響を含めることができます。
目的変数の値が順序尺度の場合、それを順序ロジスティック回帰と呼びます。
目的変数が多クラスの場合、それを多項ロジスティック回帰と呼びます。
8
item of content
- 364hits
- 0replay
-
0like
- collect
- send report