AI Technology Community

小小程序员 2021-05-14 16:19:25

Communtity Adminstator

線形関数正規化（Min-Max Scaling）

データ特徴間の次元の影響を排除するために、我々は特徴に正規化処理を行う必要があり、異なる指標間に比較可能性を持たせます。

数値型の特徴に正規化を行うことで、すべての特徴をほぼ同じ数値区間に統一することができます。最もよく使われる方法は主に以下の2種類です。

線形関数正規化（Min - Max Scaling）。これは元のデータに線形変換を行い、結果を[0, 1]の範囲にマッピングし、元のデータの等比スケーリングを実現します。正規化の公式は以下の通りです：

ここでXは元のデータで、

はそれぞれデータの最大値と最小値です。

零平均正規化（Z - Score Normalization）。これは元のデータを平均が0、標準偏差が1の分布にマッピングします。具体的には、元の特徴の平均がμ

、標準偏差がσであると仮定すると、正規化の公式は以下のように定義されます：

2種類の数値型特徴があると仮定します。x1

の値の範囲は[0, 10]で、x2

の値の範囲は[0, 3]です。

学習率が同じ場合、x1

の更新速度はx2

より大きく、最適解を見つけるためには多くの反復が必要です。

post

データの正規化
2021-05-14 16:15:52join communtity

2
item of content

データの標準化（正規化）処理はデータマイニングの基本的な作業であり、異なる評価指標はしばしば異なる次元や単位を持ちます。このような状況はデータ分析の結果に影響を与える可能性があるため、指標間の次元の影響を排除するためにデータの標準化処理が必要となります。これにより、データ指標間の比較可能性が確保されます。元のデータがデータ標準化処理を経た後、各指標は同じ数量級にあり、総合的な比較評価に適しています。

873hits
0replay
2like

0

dinglike
collect
send report

+replay

Select Language