原始數(shù)據(jù)標準化處理 什么是數(shù)據(jù)治理,為什么要進行數(shù)據(jù)標準化?
什么是數(shù)據(jù)治理,為什么要進行數(shù)據(jù)標準化?達到企業(yè)增值的目的。基于大數(shù)據(jù)技術的數(shù)據(jù)分析平臺系統(tǒng),通過從多個業(yè)務系統(tǒng)到ODS中間庫、ODS中間庫到數(shù)據(jù)倉庫模型的處理和過濾,再綁定模型組件實現(xiàn)數(shù)據(jù)可視化,可
什么是數(shù)據(jù)治理,為什么要進行數(shù)據(jù)標準化?
達到企業(yè)增值的目的。基于大數(shù)據(jù)技術的數(shù)據(jù)分析平臺系統(tǒng),通過從多個業(yè)務系統(tǒng)到ODS中間庫、ODS中間庫到數(shù)據(jù)倉庫模型的處理和過濾,再綁定模型組件實現(xiàn)數(shù)據(jù)可視化,可以讓用戶更生動地觀察和分析不同業(yè)務的數(shù)據(jù)。
有兩個方面。隨著人們研究領域的不斷拓展,評價對象也越來越復雜。單指標評價往往是不合理的,因此需要多指標的信息處理數(shù)據(jù),才能得到用戶想要的更準確、更有用的業(yè)務數(shù)據(jù)。
如何對數(shù)據(jù)進行標準化處理?
為了消除Excel中的維度,沒有現(xiàn)成的函數(shù)。步驟如下:
步驟1:計算每個變量(指標)的算術平均值(數(shù)學期望)Xi和標準差Si;
步驟2:標準化:
Xij¢=(Xij Xi)/Si
其中:Xij¢為標準化變量值;Xij為實際變量值。
第3步:將符號轉(zhuǎn)置到反向指示器之前。
標準化變量值在0左右波動,大于0表示高于平均水平,小于0表示低于平均水平
數(shù)據(jù)標準化的主要功能是消除變量之間的維度關系,使數(shù)據(jù)具有可比性。舉個簡單的例子,如何將百分比變量與5點變量進行比較?只有通過數(shù)據(jù)標準化,當它們都被標準化為同一個標準時,它們才能具有可比性。一般采用Z標準化,即均值為0,方差為1。當然還有其他的標準化,比如0-1標準化等等,可以根據(jù)自己的研究目的來選擇