java字符串歸一化方法 java開發(fā),轉(zhuǎn)大數(shù)據(jù)好還是機器學(xué)習(xí)?
java開發(fā),轉(zhuǎn)大數(shù)據(jù)好還是機器學(xué)習(xí)?謝謝。我建議轉(zhuǎn)向大數(shù)據(jù)。我也從事java開發(fā),我對這個主題的糾纏也有同樣的感受。畢竟,如果我精通Java,我已經(jīng)付出了大量的學(xué)習(xí)精力。如果我學(xué)習(xí)機器學(xué)習(xí),我基本上
java開發(fā),轉(zhuǎn)大數(shù)據(jù)好還是機器學(xué)習(xí)?
謝謝。我建議轉(zhuǎn)向大數(shù)據(jù)。
我也從事java開發(fā),我對這個主題的糾纏也有同樣的感受。畢竟,如果我精通Java,我已經(jīng)付出了大量的學(xué)習(xí)精力。如果我學(xué)習(xí)機器學(xué)習(xí),我基本上想告別Java,這無疑是一個非常不幸的選擇。
此外,轉(zhuǎn)向機器學(xué)習(xí)不僅需要深入了解python,還需要掌握數(shù)學(xué)算法,這是不可能一蹴而就的。因此,轉(zhuǎn)向人工智能的風(fēng)險相對較高,很容易打亂一個人的職業(yè)規(guī)劃。
目前,大數(shù)據(jù)方向仍是一個需求量大、前景好的工作方向。Java廣泛應(yīng)用于大數(shù)據(jù)領(lǐng)域。單憑Hadoop生態(tài)系統(tǒng)就足以完成大量的大數(shù)據(jù)工作,而Hadoop和Java是分不開的。
最重要的是大數(shù)據(jù)方向不會低于機器學(xué)習(xí)的工資,機器學(xué)習(xí)還處于初級階段。別擔(dān)心工資問題。
如何進行數(shù)據(jù)的歸一化處理?
首先,測試集的標準化平均值和標準偏差應(yīng)來自訓(xùn)練集。如果您熟悉Python的sklearn,您應(yīng)該知道應(yīng)該首先對訓(xùn)練集數(shù)據(jù)進行擬合,得到包括均值和標準差的定標器,然后分別變換訓(xùn)練集和驗證集。這個問題其實很好。很多人不注意。最容易犯的錯誤是在劃分訓(xùn)練測試集之前進行規(guī)范化。
第二個問題是不同歸一化方法的選擇,如均值方差歸一化、最大最小歸一化等。歸一化的目的是調(diào)整每個場之間的數(shù)量級差異。均值-方差歸一化可能更適合不知道數(shù)據(jù)邊界在哪里的情況。最大和最小規(guī)格化相當于積分到01,這意味著您知道該字段的邊界在哪里。所以我個人更喜歡均值方差的標準化。我只是憑經(jīng)驗說的,不一定是對的。