北方偉業(yè)計(jì)量集團(tuán)有限公司
支持向量回歸機(jī)(Support Vector Regression, SVR)與SVM的主要不同點(diǎn)是尋找的一個(gè)最優(yōu)超平面,不是將兩類樣本點(diǎn)分離的最遠(yuǎn),而是讓所有的樣本點(diǎn)距離這個(gè)最優(yōu)超平面的總方差最小 。若給定樣本數(shù)據(jù)集{(xi,yi),i=1,2,...,n},其中xi=T,yi∈R,一個(gè)回歸函數(shù)則被建立:
式(5)中,φ(x)為原始特征數(shù)據(jù)的非線性映射函數(shù),w為權(quán)向量,b∈R為閾值。
引入線性不敏感損失函數(shù)θ,f(xi)表示預(yù)測(cè)值,yi為相對(duì)應(yīng)的實(shí)際值,|yi−f(xi)|為真實(shí)值與預(yù)測(cè)值之間的差,θ不敏感函數(shù)引用的意義在于若|yi−f(xi)|在允許誤差范圍內(nèi),那么f(xi)沒有損失,如式(6)所示。引入正則化參數(shù)c,式(5)可以轉(zhuǎn)化為式(7)的代價(jià)函數(shù):
引入松弛變量ξ1i,ξ2i,可以建立式(8)的目標(biāo)函數(shù)與式(9)的約束條件:
引入拉格朗日函數(shù)和核函數(shù)K(xi,xj)=φ(xi)φ(xj),可將式(8)和式(9)變換成對(duì)偶形式:
式(10)-(11)中的α為拉格朗日乘子,在KKT(Karush-Kuhn-Tucker)條件下,對(duì)最優(yōu)解α和α∗求解,可以得出:
式(12)中Nnsv表示支持向量的個(gè)數(shù),計(jì)算可得偏置量b∗。綜上,最終可得SVR的擬合函數(shù),如式(13):
當(dāng)核函數(shù)選擇的是式(14)的sigmoid函數(shù)時(shí),SVR實(shí)現(xiàn)的是一個(gè)多層感知器神經(jīng)網(wǎng)絡(luò),對(duì)未知變化狀況的樣本集具有良好的泛化能力,溶解氧的預(yù)測(cè)值可以表示為式(15):
采集到的數(shù)據(jù)一般不直接采用,需經(jīng)過數(shù)據(jù)的歸一化處理。這是因?yàn)樗|(zhì)因子指標(biāo)的范圍比較大,不同的數(shù)據(jù)具有不同的量綱單位,為了消除水質(zhì)指標(biāo)彼此之間的量綱影響及保證這些數(shù)據(jù)之間具有可比性以及提高模型的運(yùn)行速度和預(yù)測(cè)精度。本文采用MATLAB R2018a的map-maxmin函數(shù)進(jìn)行歸一化處理,如式(23)所示,“apply”模式是將數(shù)據(jù)指標(biāo)轉(zhuǎn)化到[-1,1]之間,便于對(duì)比預(yù)測(cè),而“resver”模式可以將數(shù)據(jù)反歸一化回去。
了解更多> >在選取的樣本信息中,水質(zhì)指標(biāo)濁度與水溫之間的相關(guān)系數(shù)為0.58>0.5,氨氮與電導(dǎo)率之間的相關(guān)系數(shù)為0.547>0.5,在99%的置信區(qū)間下,具有顯著相關(guān)性。而互信息值0.7759(濁度)>0.6800(水溫),0.7854(電導(dǎo)率)>0.7598(氨氮),因此選取電導(dǎo)率、總磷、濁度、高錳酸鉀指數(shù)、PH、總氮等作為水質(zhì)指標(biāo)中影響溶解氧含量的特征變量。
了解更多> >綜上所述,在研究水質(zhì)指標(biāo)溶解氧問題時(shí)選擇的特征變量過少導(dǎo)致建模效果不佳,預(yù)測(cè)結(jié)果不具有代表性,特征變量多可以提供描述問題的更多信息,但數(shù)據(jù)中會(huì)存在無關(guān)和弱相關(guān)且冗余的特征變量,會(huì)降低模型的泛化性能。在對(duì)溶解氧預(yù)測(cè)實(shí)踐中,PCA-MI特征選擇方法選取的特征變量更具有代表性,能更有效的提高模型預(yù)測(cè)性能。
了解更多> >在解決水質(zhì)指標(biāo)溶解氧的預(yù)測(cè)問題時(shí),將經(jīng)過PCA和MI組合特征選擇的溶解氧數(shù)據(jù)作為GNIPSO-SVR預(yù)測(cè)模型的輸入,并與BP神經(jīng)網(wǎng)絡(luò)、SVR、PSO-SVR等預(yù)測(cè)模型進(jìn)行對(duì)比分析。各個(gè)溶解氧預(yù)測(cè)模型的總體趨勢(shì)與實(shí)際值都比較吻合,但本文提出的GNIPSO-SVR模型預(yù)測(cè)DO的曲線更接近實(shí)際值的曲線,PSO-SVR模型的預(yù)測(cè)效果次之,SVR的預(yù)測(cè)曲線與實(shí)際值曲線擬合度最差,尤其是對(duì)突變值的擬合情況,各個(gè)模型的預(yù)測(cè)值和實(shí)際值的擬合曲線的可視化結(jié)果如圖4-圖7所示。
了解更多> >本文利用主成分分析(PCA)、互信息(MI)、非線性慣性權(quán)重遞減的粒子群優(yōu)化算法(GNIPSO)和支持向量回歸機(jī)(SVR),提出了一種基于高斯函數(shù)的非線性權(quán)重遞減的粒子群算法優(yōu)化支持向量回歸機(jī)(GNIPSO-SVR)的預(yù)測(cè)模型,通過實(shí)驗(yàn)證明了GNIPSO算法優(yōu)化SVR的參數(shù)優(yōu)于標(biāo)準(zhǔn)的PSO算法和慣性權(quán)重線性遞減的PSO算法。
了解更多> >通話對(duì)您免費(fèi),請(qǐng)放心接聽
溫馨提示:
1.手機(jī)直接輸入,座機(jī)前請(qǐng)加區(qū)號(hào) 如13803766220,010-58103678
2.我們將根據(jù)您提供的電話號(hào)碼,立即回電,請(qǐng)注意接聽
3.因?yàn)槟潜唤蟹?,通話?duì)您免費(fèi),請(qǐng)放心接聽
登錄后才可以評(píng)論