特徵標準化 (Feature Normalization)
將數值範圍大的數據縮小,數值範圍小的數據放大,使得數據之間的數值範圍統一。
舉例來說,使用距離市中心(km)和面積(m^2)兩個變數來預測房價,
距離市中心數值範圍介於 1~10 之間,
面積數值範圍介於 100~300 之間,
在使用權重進行加乘時,數值範圍大的數據影響力太大,因此,必須將特徵標準化。
特徵標準化方式:
- Min Max Normalization:將特徵數據縮放成 0~1 之間的數值。
- Standard Deviation Normalization:將特徵數據縮放成平均值為 0,方差為 1。
特徵標準化好處:
加快機器學習的學習速度,還可以避免機器學習曲線學得扭曲。