AI Technology Community
小小程序员
2021-05-14 16:19:25
線形関数正規化(Min-Max Scaling)
データ特徴間の次元の影響を排除するために、我々は特徴に正規化処理を行う必要があり、異なる指標間に比較可能性を持たせます。
数値型の特徴に正規化を行うことで、すべての特徴をほぼ同じ数値区間に統一することができます。最もよく使われる方法は主に以下の2種類です。
線形関数正規化(Min - Max Scaling)。これは元のデータに線形変換を行い、結果を[0, 1]の範囲にマッピングし、元のデータの等比スケーリングを実現します。正規化の公式は以下の通りです:
ここでXは元のデータで、
はそれぞれデータの最大値と最小値です。
零平均正規化(Z - Score Normalization)。これは元のデータを平均が0、標準偏差が1の分布にマッピングします。具体的には、元の特徴の平均がμ
、標準偏差がσであると仮定すると、正規化の公式は以下のように定義されます:
2種類の数値型特徴があると仮定します。x1
の値の範囲は[0, 10]で、x2
の値の範囲は[0, 3]です。
学習率が同じ場合、x1
の更新速度はx2
より大きく、最適解を見つけるためには多くの反復が必要です。
<
2
item of content
データの標準化(正規化)処理はデータマイニングの基本的な作業であり、異なる評価指標はしばしば異なる次元や単位を持ちます。このような状況はデータ分析の結果に影響を与える可能性があるため、指標間の次元の影響を排除するためにデータの標準化処理が必要となります。これにより、データ指標間の比較可能性が確保されます。元のデータがデータ標準化処理を経た後、各指標は同じ数量級にあり、総合的な比較評価に適しています。
- 863hits
- 0replay
-
2like
- collect
- send report