Select Language

AI Technology Community

線形関数正規化(Min-Max Scaling)

データ特徴間の次元の影響を排除するために、我々は特徴に正規化処理を行う必要があり、異なる指標間に比較可能性を持たせます。

数値型の特徴に正規化を行うことで、すべての特徴をほぼ同じ数値区間に統一することができます。最もよく使われる方法は主に以下の2種類です。

線形関数正規化(Min - Max Scaling)。これは元のデータに線形変換を行い、結果を[0, 1]の範囲にマッピングし、元のデータの等比スケーリングを実現します。正規化の公式は以下の通りです:


ここでXは元のデータで、

はそれぞれデータの最大値と最小値です。

零平均正規化(Z - Score Normalization)。これは元のデータを平均が0、標準偏差が1の分布にマッピングします。具体的には、元の特徴の平均がμ

、標準偏差がσであると仮定すると、正規化の公式は以下のように定義されます:

2種類の数値型特徴があると仮定します。x1

の値の範囲は[0, 10]で、x2

の値の範囲は[0, 3]です。

学習率が同じ場合、x1

の更新速度はx2

より大きく、最適解を見つけるためには多くの反復が必要です。

<

post
  • 2

    item of content
データの標準化(正規化)処理はデータマイニングの基本的な作業であり、異なる評価指標はしばしば異なる次元や単位を持ちます。このような状況はデータ分析の結果に影響を与える可能性があるため、指標間の次元の影響を排除するためにデータの標準化処理が必要となります。これにより、データ指標間の比較可能性が確保されます。元のデータがデータ標準化処理を経た後、各指標は同じ数量級にあり、総合的な比較評価に適しています。