過擬合和欠擬合的解決方法 以神經(jīng)網(wǎng)絡(luò)為核心的智能算法是否可以預(yù)測股票價格?
以神經(jīng)網(wǎng)絡(luò)為核心的智能算法是否可以預(yù)測股票價格?如何創(chuàng)建一個優(yōu)秀的神經(jīng)網(wǎng)絡(luò)模型?例如,要預(yù)測一個人是男人還是女人,有兩組因素可供選擇:a.頭發(fā)顏色、皮膚顏色、雙眼皮與否;B.他是否有胡須、是否有亞當(dāng)蘋
以神經(jīng)網(wǎng)絡(luò)為核心的智能算法是否可以預(yù)測股票價格?
如何創(chuàng)建一個優(yōu)秀的神經(jīng)網(wǎng)絡(luò)模型?
例如,要預(yù)測一個人是男人還是女人,有兩組因素可供選擇:a.頭發(fā)顏色、皮膚顏色、雙眼皮與否;B.他是否有胡須、是否有亞當(dāng)蘋果和他的體重。
因此,為了建立一個優(yōu)秀的神經(jīng)網(wǎng)絡(luò)模型,我們必須選擇具有高度相關(guān)性的因素。
同樣的因素,在不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,預(yù)測結(jié)果會有很大的不同。
如果結(jié)構(gòu)太簡單,會出現(xiàn)“欠擬合”,即應(yīng)該分析的不分析;如果結(jié)構(gòu)太復(fù)雜,會出現(xiàn)“過擬合”,即不應(yīng)該分析的不分析。只有正確的網(wǎng)絡(luò)結(jié)構(gòu)才能分析出預(yù)期的結(jié)果。
例如:
一個住在偏遠村莊a的學(xué)生被城市B中學(xué)錄取。他是村里歷史上唯一被B中學(xué)錄取的人。高考后,他被清華大學(xué)錄取。
如果已經(jīng)安裝了模型,將考慮100%的“住a村”和“讀B高中”的人可以被清華大學(xué)錄取。這是真的,但顯然不是我們想要的結(jié)論。
直接圖表:
沃倫·巴菲特(Warren Buffett)是公認的投資大師,在過去20年中實現(xiàn)了20%的平均回報率;詹姆斯·西蒙斯(James Simmons)使用他的量化模型,從1989年到2009年實現(xiàn)了約35%的平均回報率。
深度神經(jīng)網(wǎng)絡(luò)是否夸張地過擬合了?
這不可能是一樣的。
1. 過度裝配可分為許多情況。一是現(xiàn)在的情況太多了。這種神經(jīng)網(wǎng)絡(luò)能對許多情況給出正確的答案。即使它是過度安裝,你也無法證明它。此外,即使它能工作和排氣,也沒有壞處。
2. 是否過擬合與我們的神經(jīng)網(wǎng)絡(luò)模型和訓(xùn)練集有關(guān)。當(dāng)二者的組合過擬合時,它在訓(xùn)練集上運行良好,在驗證集上也會出現(xiàn)問題?,F(xiàn)在有一些方法可以對訓(xùn)練集的數(shù)據(jù)進行預(yù)處理、多次輸入和多次訓(xùn)練。
3. 目前,過度擬合的問題是不可避免的。培訓(xùn)本身就是一種適應(yīng)過程。如果未來在數(shù)學(xué)原理或應(yīng)用這方面有質(zhì)的突破,可能有解決的機會。
可以通過直接減少hidden layer、hidden unit而不是加正則化來解決神經(jīng)網(wǎng)絡(luò)過擬合嗎?
簡單的答案是肯定的。復(fù)雜的答案是不確定的(見下文)。
這個概念。
(圖片作者:chabacano,許可證:CC by sa 4.0)
從圖像中可以明顯看出,過度擬合的曲線過于曲折(復(fù)雜),對現(xiàn)有數(shù)據(jù)擬合得非常好,但它不能很好地描述數(shù)據(jù)的規(guī)律,因此面對新數(shù)據(jù),我們不得不停下來。
從上面我們得到一個直覺,過度擬合的模型往往比正確的模型更復(fù)雜。
。您所說的“直接減少隱藏層和隱藏單元的數(shù)量”使網(wǎng)絡(luò)更薄、更窄正是簡化模型的方法。這個想法沒有問題。
但是,我們可能必須嘗試找出它是否有效。因為,一般來說,更復(fù)雜的網(wǎng)絡(luò)可能更有表現(xiàn)力。
一般來說,神經(jīng)網(wǎng)絡(luò)仍然是一個黑匣子。有時,正則化的效果更好,有時則不然。一些問題可能是復(fù)雜的網(wǎng)絡(luò)工作得很好,另一些問題可能是深度和狹窄的網(wǎng)絡(luò)工作得很好,另一些問題可能是薄而寬的網(wǎng)絡(luò)工作得很好,或者一些問題可能是簡單的網(wǎng)絡(luò)工作得很好。
具體來說,為了解決過擬合問題,除了簡化模型(即您稱之為“直接減少隱藏層、隱藏層、隱藏層”)外,還存在漏項(在某種意義上,我們可以看到模型的某些部分由于簡化模型的繞道而無法工作),以及人為增加稀疏性限制(稀疏性和簡化之間存在模糊關(guān)系)或盡快停止訓(xùn)練。
神經(jīng)網(wǎng)絡(luò)能不能完全擬合簡單函數(shù)呢?
答案是,理論上,這取決于運氣。
在很大的概率中,訓(xùn)練的結(jié)果是達到局部最優(yōu)。如果你幸運的話,就有可能達到全局最優(yōu)。因此,在實際應(yīng)用中,神經(jīng)網(wǎng)絡(luò)完全擬合函數(shù)存在誤差。
當(dāng)然,神經(jīng)網(wǎng)絡(luò)的最佳用途不是擬合函數(shù)。我們之所以使用神經(jīng)網(wǎng)絡(luò),是因為我們需要它的泛化能力,即對于未知的特征可以得到很好的分類或回歸結(jié)果。擬合函數(shù)只使用它的記憶能力。
請教大牛神經(jīng)網(wǎng)絡(luò)的過擬合問題?
你的問題很模糊。你想知道神經(jīng)網(wǎng)絡(luò)的過擬合是什么樣的嗎?為什么會有過擬合。對于第一個問題,神經(jīng)網(wǎng)絡(luò)的過擬合類似于支持向量機、高斯混合模型等建模方法的過擬合,說明訓(xùn)練數(shù)據(jù)集的建模效果很好,而測試數(shù)據(jù)集的建模效果很差,由于強學(xué)習(xí)能力是預(yù)測模型中的噪聲會湮滅有用信息,導(dǎo)致泛化能力差。對于第二個問題,產(chǎn)生上述現(xiàn)象的主要原因是隱層節(jié)點過多(隱層節(jié)點越多,學(xué)習(xí)能力越強),這使得預(yù)測模型在訓(xùn)練過程中挖掘訓(xùn)練數(shù)據(jù)集中的噪聲,即噪聲會湮滅有用信息。因此,在使用神經(jīng)網(wǎng)絡(luò)建模時,必須處理模型過擬合的問題。一方面,我們可以增加樣本數(shù)據(jù)集,另一方面,我們可以使用交叉驗證來選擇適當(dāng)數(shù)量的隱層節(jié)點,在精度和泛化能力之間做出權(quán)衡。最常用的方法是加入正則化項,在一定程度上可以防止模型過擬合的問題。(機器學(xué)習(xí)算法和python學(xué)習(xí))