Select Language

AI Technology Community

Logistic Regression論理回帰

ロジスティック回帰は、「イベント = 成功」と「イベント = 失敗」の確率を計算するために使用されます。目的変数のタイプが二元(1 / 0、真/偽、是/否)変数の場合、ロジスティック回帰を使用する必要があります。ここで、Yの値は0から1までで、以下の方程式で表すことができます。

オッズ = p / (1 - p) = イベント発生の確率 / イベント非発生の確率
ln(オッズ) = ln(p / (1 - p))
ロジット(p) = ln(p / (1 - p)) = b0 + b1X1 + b2X2 + b3X3.... + bkXk

上記の式で、pはある特徴を持つ確率を表します。あなたはおそらくこのような質問をするでしょう:「なぜ公式の中で対数logを使うのですか?」。

ここでは二項分布(目的変数)を使用しているため、この分布に最適なリンク関数を選ぶ必要があります。それがロジット関数です。上記の方程式では、通常の回帰で使用される最小二乗誤差を最小化するのではなく、観測サンプルの最尤推定値によってパラメータを選択します。

要点:

  • 分類問題に広く使用されます。

  • ロジスティック回帰は、説明変数と目的変数が線形関係であることを要求しません。予測の相対リスク指数ORに非線形の対数変換を使用するため、さまざまなタイプの関係を扱うことができます。

  • 過学習と学習不足を避けるために、すべての重要な変数を含める必要があります。これを確実にする良い方法の1つは、段階的選択法を使用してロジスティック回帰を推定することです。

  • サンプル数が少ない場合、最尤推定の効果は通常の最小二乗法よりも劣るため、大きなサンプルサイズが必要です。

  • 説明変数は相互に関連していてはならず、すなわち多重共線性を持っていてはいけません。ただし、分析とモデリングでは、分類変数の相互作用の影響を含めることができます。

  • 目的変数の値が順序尺度の場合、それを順序ロジスティック回帰と呼びます。

  • 目的変数が多クラスの場合、それを多項ロジスティック回帰と呼びます。


post
線形回帰
2021-05-12 17:04:54join communtity
  • 8

    item of content