這篇文章主要介紹了如何基于python實現歸一化處理,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
一、定義
歸一化方法有兩種形式,一種是把數變為(0,1)之間的小數,一種是把有量綱表達式變為無量綱表達式。主要是為了數據處理方便提出來的,把數據映射到0~1范圍之內處理,更加便捷快速。
二、目的
不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數據分析的結果,為了消除指標之間的量綱影響,需要進行數據標準化處理,以解決數據指標之間的可比性。其具體針對的是奇異樣本數據,奇異樣本數據指的是相對于其他輸入樣本特別大或特別小的樣本矢量,如[0.34,0.51,0.44,222][0.34,0.51,0.44,128]中最后一列元素就是奇異樣本數據。
三、常見標準化方法
1.最大-最小標準化映射到區間[0,1]
2.Z-score標準化結果聚集在0附近方差為1
四、矩陣的歸一化
矩陣的列歸一化,就是將矩陣每一列的值,除以每一列所有元素平方和的絕對值,這樣做的結果就是,矩陣每一列元素的平方和為1了。
五、python歸一化
其中參數axis=0表示列也是跨行的意思axis=1表示行也是跨列的意思
1
2
3
4
5
6
7
8
9
10
|
fromsklearn.preprocessingimportnormalize data = np.array([ [ 1000 , 10 , 0.5 ], [ 765 , 5 , 0.35 ], [ 800 , 7 , 0.09 ],]) data = normalize(data,axis = 0 ,norm = 'max' ) print (data) >>[[ 1.1 . 1. ] [ 0.7650 . 50.7 ] [ 0.80 . 70.18 ]] |
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持服務器之家。
原文鏈接:https://www.cnblogs.com/cccccttttyyy/p/12210115.html