如何构造svr短期负荷预测测训练样本

小波分析和SVR在供热负荷预测中的应用_论文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
您可以上传图片描述问题
联系电话:
请填写真实有效的信息,以便工作人员联系您,我们为您严格保密。
小波分析和SVR在供热负荷预测中的应用
||文档简介
中国最大最早的专业内容网站|
总评分0.0|
&&采​用​热​计​量​后​供​热​系​统​将​成​为​变​流​量​系​统​,​结​合​小​波​分​析​和​支​持​向​量​回​归​(​S​V​R​)​及​时​准​确​预​测​热​负​荷​,​使​供​热​控​制​跟​踪​热​量​的​变​化​,​利​用​偏​相​关​分​析​来​选​择​模​型​输​入​参​数​,​将​小​波​分​析​应​用​于​数​据​消​噪​处​理​,​建​立​支​持​向​量​回​归​负​荷​预​测​模​型​。​研​究​结​果​表​明​,​该​方​法​提​高​了​运​算​效​率​和​预​测​精​度​。
试读已结束,如果需要继续阅读或下载,敬请购买
定制HR最喜欢的简历
你可能喜欢热负荷预测方法评析_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
热负荷预测方法评析
上传于||暂无简介
阅读已结束,如果下载本文需要使用5下载券
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢RBF神经网络样本选取 用RBF对负荷预测,需要样本分成两类,训练样本和_百度知道基于SVR的短期电力负荷预测_论文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
您可以上传图片描述问题
联系电话:
请填写真实有效的信息,以便工作人员联系您,我们为您严格保密。
基于SVR的短期电力负荷预测
||暂无简介
中国最大最早的专业内容网站|
总评分0.0|
试读已结束,如果需要继续阅读或下载,敬请购买
定制HR最喜欢的简历
你可能喜欢论文发表、论文指导
周一至周五
9:00&22:00
改进SVR在金融时间序列预测中的应用
2008年第11期目录
&&&&&&本期共收录文章20篇
  摘要:针对目前金融时间序列预测方法的不足,在利用训练样本与测试样本间马氏距离对惩罚因子进行加权的基础上,改进传统的支持向量回归机(SVR)。通过以上海证券综合指数趋势的预测为例子,与标准BP人工神经网络(BPANN)和SVR方法进行了对比,发现该方法能获得更准确的预测结果。结果表明,该方法能充分反映股票价格时间序列趋势规律,是研究金融时间序列预测问题的有效方法。 中国论文网 /3/view-1416838.htm  关键词:股票价格;支持向量回归机;人工神经网络;时间序列预测   文章编号:1003-4625(2008)11-0095-04中图分类号:830.91文献标识码:A   Abstract: According to the disadvantages of t financial time serial forecast, the improved support vector regression (SVR) is developed by using Mahalanobis distance between training and testing samples to get weighted penalty coefficients. Taking Shanghai Composite Index trend forecast as an example, more accurate results can be acquired by this method compared with normal BP artificial neural network. The results indicate that the method could sufficiently reflect the trend of stock price time series, and it is an effective approach for financial time series forecast.   Key Words: Stock PSupport Vector R Artificial Neural N Time Series Forecast      一、引言   证券市场是现实生活中典型的复杂系统, 之所以复杂, 不仅是影响市场的因素众多, 而且它们之间的相互作用是非线性和时变的。系统内部这些相互作用的因素或状态变量之间的关系也许永远都是一个谜, 即难以建立完整的描述市场的动力方程。如果将股票价格序列看作系统的输出, 那么可以缓解无法建立市场动力和市场方程的遗憾。因为作为系统的输出, 价格序列毕竟是影响市场各种因素相互作用的结果,因此,价格序列必定载有关于系统状态变量的信息。为了准确地刻画和描述证券价格序列的变化情况,目前人们提出了许多预测方法,主要有:传统预测方法(包括专家经验预测法、移动平均法、线性回归法、指数平滑法、趋势外推法、季节变动法等)和人工神经网络(Artificial Neural Network, ANN)方法。但采用传统预测方法不仅指标确定的主观随意性较大,而且需要事先知道各种参数, 以及参数在什么情况下应做怎样的修正。而人工神经网络虽然在一定程度上能克服上述困难,但其算法训练速度慢,学习过程误差极易收敛于局部极小点,很难保证学习精度。另外,这种方法只能保证在有限样本的情况下经验风险最小,无法实现期望风险最小,网络的泛化能力差,不能保证训练后的网络对训练集外的样本有好的应用效果。这些不足极大地限制了上述方法在实际中的应用。而支持向量回归机( Support Vector Regression ,SVR)则很好地解决了上述的一些问题,并在实际应用中取得了很好的性能。   在标准?着-SVR方法中,设计参数C和?着的选择对构造回归函数是至关重要的。参数?着表明了系统对估计函数在样本数据点上误差的期望(误差要求)。?着越小,估计函数在样本数据点上的误差要求越小,函数估计的精度越高。参数C是对估计函数误差大于?着的样本数据的惩罚,C越大,惩罚越大。在标准?着-SVR方法中,所有样本对应的C和?着都是相同的,即对于不同的样本数据,对它的精度要求、偏离精度要求的惩罚是一视同仁的。但在实际应用中,常常发现某些样本数据重要性大,要求小的训练误差;而有些样本数据的重要性相对低一些,容许一定大小的训练误差,如股市预测、期货预测、电力负荷预测等动态变化比较剧烈的时间序列预测问题,近期数据的重要性要远远高于早期数据的重要性。也就是说,不同的样本数据,其精度要求也会不同。因此,在描述优化问题时,每个样本数据应具有不同的误差要求和惩罚系数,即每个C、?着不同,从而得到更准确的回归估计。为此,学者们提出了加权SVR(Weighted SVR, WSVR)方法来解决上述问题。如:文献针对模式识别问题,认为样本集中第1个样本的误差要求最低,设定为小于1的值,最后一个样本误差要求最高,设定为1,并采用线性插值方法计算其他样本的加权系数;文献针对动态变化剧烈的金融时间序列预测问题,认为近期样本的误差要求要远远高于早期样本,采用了时间序列的指数函数来表征各样本的误差要求,另外从实验中也观察到对?着加权不会显著地改善系统的泛化能力。但上述研究并没有对这种称之为WSVR的方法进行系统性的描述,也没有给出其详细的优化问题描述及训练算法,因此探索新WSVR方法来准确预测股票价格变动趋势是有必要的。   本文针对金融时间序列数据的产生过程的随机性、含有噪声、有较强的非线性等特点,提出了一种改进的?着-SVR方法。根据机器学习中,“与训练样本空间距离越小的测试样本重要性(误差要求)远高于空间距离大的测试样本”的原则,该方法通过计算训练样本与测试样本的马氏距离来衡量不同测试样本相对于训练样本的重要性(即对?着-SVR惩罚因子C赋予不同的加权系数),建立了用于股票价格时间序列趋势预测的模型,并给出了其详细地优化问题描述及训练算法。仿真结果表明, 与标准BPANN方法和?着-SVR方法相比,该方法预测精度较高、收敛速度快、方法简单易行。      二、金融时间序列数据与支持向量回归机      金融时间序列数据与支持向量回归机间的关系主要有以下三点:   (一)金融时间序列数据的产生过程主要是随机性的、是部分决定的,其影响因素很多,也很复杂。因此,一般建模之前总需要做一些假定,这些假定的正确与否对于预测的准确性影响很大。而SVR是一种非参数模型,只需很少的假定即可进行具有一定精度的预测, 因此SVR的使用将会极大地降低因假定有误而引起的预测误差。   (二)多数金融时间序列数据中都含有噪声。经常会有一些突发事件,它们并不会使金融时间序列数据的结构(趋势、周期等) 发生大的改变,仅会使数据发生暂时的偏离(比如:发生趋势或周期的暂时偏离,但很快又会恢复到原来的趋势及周期上去)。SVR的适度拟合会忽略掉噪声, 找到数据背后真正的规律。由于SVR具有较强的泛化能力,适合于对没有学习过的样本进行推断,所以SVR非常适合于处理金融时间序列这种有噪声的数据。   (三)金融时间序列数据间具有较强的非线性。用于金融时间序列的预测方法很多,而且非线性方法的研究日益受到关注,如自回归条件异方差(ARCH) 模型、双线性(Bilinear)模型和门限自回归(TAR)模型等。这些模型的共同特点是,都使用了数据间相互关系的显性表达式。非线性数据间的关系一般都很复杂,因为数据间的非线性模式是多种多样的,任何一个特定的非线性模型都不能完全刻画出这种非线性关系。而SVR不需要事先假定金融数据间具有何种具体的函数形式。
  三、改进?着支持向量回归机   在改进?着-SVR方法中,惩罚因子C是针对各个样本来选择的。为每个样本引入权系数si,加权后的输入样本集((x1,y1,s1)…,(xi,yi,si),…,(xl,yl,sl)),0<si≤1,其最优化问题为   如前面所述,加权系数si根据对应样本数据的重要性来选择。本文将测试样本与训练样本的马氏距离作为重要性指标,即测试样本与训练样本的空间距离越短,该训练样本的重要性越大,C参数的加权系数si越大。因此,在对测试样本进行回归预测时,首先需要计算测试样本与各个训练样本间的马氏距离,其公式为      四、上证综合指数序列的多步预测及分析      股票价格预测之所以困难,是因为不确定的内生、外生影响因素众多,从而导致价格的变化充满不确定性。由于影响因素的不确定性,仅由历史价格提供的预测信息就显不足,完全依靠历史价格预测未来价格是困难的。Takens定理保证,在一定条件下,时间序列的过去值组成的矢量与未来值之间存在光滑影射。就市场常识而言, 这种光滑映射在股票价格序列中显然是不存在的。一种解决方法是引入其他市场信息,如成交量、各种技术指标;一种是降低预测的要求。前者没有一定的规律可循,多凭预测者的经验。本文采用后一种方法,改价格序列预测为价格序列趋势预测,一则预测相对容易;二则不失实际意义。   通过如下方法得到价格序列的趋势,首先对时间序列进行小波变换,然后将高频部分置零,再重构,得到趋势序列。这里对于时间序列的重构采用基于平均预测误差最小化的相空间重构参数确定法,来求得恰当的时间延迟和嵌入维数。不严格地说,趋势序列中存在上文所述的光滑映射。改变小波分解的级数,可调整趋势序列的光滑程度和原始序列的吻合程度。之所以不采用常用的移动平均方法,是因为该方法不是零相位滤波,不可避免地有滞后现象。窗口越宽, 滞后越严重。随机选择有代表性的行情说明本文方法的有效性。   2001年2月,市场在1900点处获得支撑,并于3月底一举突破前期高点2100点,沿续2000年初开始的牛市行情。进入6月,指数已爬升至2240点的历史新高,但成交量却没有有效配合,而是逐渐萎缩。6月中旬下调至2170点,下旬自2240点附近开始下跌,与4月底的调整低点2100 点一起形成一个复合型头部。如果跌破颈线2100点,则头部确认,牛市行情宣告结束;否则短时间内不能完全确定行情的发展方向。   首先原始综合指数数据除以1000,然后采用6阶Daubechies小波, 经4级小波变换、置零、重构, 得到趋势序列。其中重构时求得时间延迟和嵌入维数分别为6和5。为确定各个样本的加权系数,首先计算训练样本与各测试样本间的马氏距离,得到形如(7)式的加权系数函数,这里选取f=1,u=0.005。对于改进?着-SVR和标准?着-SVR的核函数和参数采用交叉验证的方法进行优化选择,为K(x,y)=e,?滓=1,?着=0.01,C=10;对于标准BPANN,采用三层网络结构,用快速BP算法训练前向网络,输入层神经元为5个,隐含层神经元为6个,输出层神经元1个,最大训练次数1000,期望误差为0.0001,初始学习率为0.01。在实验中采用递归预测方法,训练中, 利用截至预测时间以前的历史行情数据构造输入矢量xi,以及与之对应的延时后的行情输出yi,(xi,yi)组成一个训练对。训练结束后,将进一步预测的结果作为输入矢量的分量,预测下一步数值而无需重新训练, 如此循环得到多步预测。训练区间:至,预测区间:至。具体预测结果如表1和图1,其中采用的评价标准为归一化均方误差   NMSE(P)=   从表1和图1可以看出,在上述方法对股票价格的趋势预测中,三种方法所获得的预测归一化均方差和多步预测结果说明,在一定程度上采用这些方法都能预测股票价格时间序列趋势。但从预测归一化均方差和所获得的预测趋势图优劣情况来看,基于改进?着-SVR的方法优于BPANN和?着-SVR,这主要反映了对于训练样本以外的测试样本,改进?着-SVR的方法有更强的泛化预测能力。这也说明了通过采用训练样本与测试样本间的空间距离来表征训练样本的重要性,即对各个样本数据采用不同的惩罚因子C,可以较大地提高系统的预测性能。   表1不同方法的归一化均方误差比较      五、结论      本文在Takens定理基础上,通过简单的小波去噪方法得到上证综合指数序列的趋势序列,然后采用改进的?着-SVR对股票价格趋势进行了预测研究。通过与标准的BPANN和?着-SVR仿真对比表明,改进的?着-SVR对股票价格趋势有更好的预测效果,有很强的自学习性、自适应性,且收敛快、准确性高,说明该预测方法是可信的。虽然所涉及的不是指数的精确预测, 但不可否认,市场趋势的多步预测同样具有实际意义。   就本文所涉及的递归预测问题和预测结果来看,由于递归预测的误差累积效应会随着预测范围的增加而迅速放大,因此根据证券市场具有分形结构特征,随着预测范围的逐步增加,可以将多步预测近似地视为较大尺度上的一步预测。另外,支持向量的数目在总输入矢量中所占的比重,直接影响最终结果。而该比率又与所选择的训练区间以及输入向量的构造方法有关。需进行多次实验,积累经验,只有在了解数据特性的基础上,才有望得到好的预测结果。      参考文献:   [1]向书坚.20世纪90年代时间序列预测领域主要研究动态[J].中南财经大学学报,-37.   [2] Faraw ay J, Chatfield C. Time series forecasting with neural network s: a comparative study using the air line data. Applied Statistics, 1~250.   [3] Vapnik V.An overview of statistical learning theory[J].IEEETrans. on NN.,):988-999.   [4]Lin C F,Wang S D.Fuzzy support vector machines [J]. IEEETranson Neural Networks, ):464~471.   [5]Toy F E H, Cao L J. Descending support vector machines for financial time series forecasting [J]. Neural Processing Letters,):179~195.   [6]Toy F E H,Cao L J. Modified support vector machines in financial time series forecasting[J]. Neuro computing, 7~861.    [7] Takens F. Detecting strange attractors in fluid turbulence[A].Dynamical Systems and Turbulence [C].Berlin : Springer,.   [8]岳毅宏,韩文秀,程国平.多变量时间序列相空间重构中参数的确定[J].控制与决策,):290-293.   [9]杨一文,刘贵忠.分形市场假说在沪深股票市场中的实证研究[J].当代经济科学,):75-79.   (责任编辑:张艳峰)
转载请注明来源。原文地址:
【xzbu】郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息,与本网站立场无关。xzbu不保证该信息(包括但不限于文字、数据及图表)准确性、真实性、完整性等。

我要回帖

更多关于 负荷预测方法 的文章

 

随机推荐