毕业设计-基于时间序列分析与预测的短期价格预测模型研究,共35页,13731字,附python程序源代码、开题报告等
主要内容
此毕设主要研究目标为基于分布式计算的数据挖掘调优算法的研究,主要研
究挖掘方法为基于智能群体(Intelligent Community)算法的分布式聚类分析(
DDM-clustering)与分布式关联分析(Association- rules),目标算法应针对数据流
应具有较强的鲁棒性,时效性,与预测精准性。使用Lunix系统作为开发环境的主
要原因如下:Lunix系统具有高效性和灵活性.具有低廉的成本以及高效的运算效
率使得其更面向于实际应用。
实验数据来源均为史实数据,选取适当范围的数据进行模拟实验,实验环境限
于本地服务器来模拟云端,使用模拟数据预先生成所需子频繁项集(Association-rules 方法)以及子类(clustering方法)。如有条件,可构建实验性云环境对算法进
行评估。
实验待突破难点:(1) 对于模拟数据的选取以及效用性评估。
(2) 算法的实现与优化。
(3) 算法的可集成性。
(4) 对算法针对时实数据流的可行性评估。
摘要
近年来,自然灾害对农产品的生产带来了极大的负面影响,并直接传导到农产品消费方面。农产品消费的隐患,直接关系着国计民生,影响着我国社会经济的发展。农产品消费预警,已经成为一个刻不容缓的关键研究课题。价格预测是产品消费预警中关键的一步。
本课题旨在研究农产品价格波动预测,重点针对目前价格预测模型多依赖于已知特征的多样性以及基于最小二乘曲线拟合的时间序列预测的朴素性,提出一非朴素的价格预测模型,在使用非负矩阵因式分解提取导致价格波动特征的基础上,对其时间-特征权重矩阵以最小二乘法拟合时间-特征权重函数,并提出一种基于梯度下降法的梯度修正算法。最后,利用python进行了仿真设计,对外贸农产品价格信息进行了短期预测,结果表明了该算法的合理性与可行性,但在算法在对原始数据压缩损失等情况,还需进一步研究。
本文的具体研究内容为:
(1)商品价格信息的特征提取。通过对现有数据挖掘算法的学习以及对比,采用非负矩阵因式分解算法对商品价格矩阵进行特征提取,并将所提取的特征以知识的可见、可理解的知识的形式表现出来。
(2)商品价格的回归分析与预测。在提取的特征的基础上,融合基于最小二乘的回归分析方法,对时间序列进行回归分析,并预测出短期价格。
(3)针对于回归分析未充分利用所提取的特征,而导致准确率不高,提出一种基于最速下降法的梯度修正算法,对预测结果进行修正,进一步提高其准确率与准确度。
关键字:价格预测 时间序列预测 非负矩阵因式分解 最小二乘法 梯度修正
目录
摘要 2
Abstract 3
第1章 绪论 6
1.1课题研究背景和意义 6
1.2 国内外研究现状 6
1.3 本文的主要研究工作 6
1.4 本章小结 9
第2章 技术概述与理论基础 10
2.1 数据挖掘概述 10
2.2 时间序列分析概述 11
2.3 理论基础 12
2.3.1 线性ARMA模型和最优预测器 12
2.3.2 最小二乘参数估计 13
2.3.3 非负矩阵因式分解(Non-nagetivematrix-factorize) 13
2.3.4 最速下降法 14
2.4 本章小结 14
第3章 基于时间序列预测的短期价格预测模型 15
3.1价格预测 15
3.2 基于时间序列预测的价格模型 16
3.3 非负矩阵因式分解(Non-negative matrix factorization) 16
3.4 时间序列回归分析 19
3.4.1最小二乘曲线拟合 19
3.4.2最小二乘曲线拟合多项式次数n的确定问题 19
3.5 本章小结 21
第4章 基于梯度修正算法的改进模型 22
4.1 根据特征进行梯度修正 22
4.2 误差函数 23
4.2.1欧式距离 23
4.2.2 相对熵 23
4.3 基于梯度修正算法 24
4.4 本章小结 25
第5章 实验结果与分析 26
5.1 实验数据以及编程环境 26
5.2 数据预处理 26
5.2.1 数据平滑 27
5.2.2 加权缩放 27
5.3 特征的表示 28
5.4 回归分析与预测 29
5.5 梯度修正 31
第6章 结论与讨论 33
6.1 结论 33
6.2 讨论 33
参考文献 35
表格索引
表格5-1 部分产品NMF重构与最小二乘预测对照结果 30
表格5-2 验证集结果统计 32
本文的主要研究工作
本文的主要研究工作为在仅有商品价格信息而无其他任何与商品价格有关的信息情况下,通过机器学习算法提取影响商品价格波动的特征,并构建商品价格预测模型。本文的研究主要分为三大部分,一是提取商品价格的特征,二是根据特征进行预测分析,并提出一种梯度修正算法。最后进行试验结果的统计对比与分析。
本文的主要工作流程如图1-4所示:
图 1-4 工作流程
本文的主要研究工作如下:
(1)商品价格信息的特征提取。通过对现有数据挖掘算法的学习以及对比,采用非负矩阵因式分解算法对商品价格矩阵进行特征提取,并将所提取的特征以知识的可见、可理解的知识的形式表现出来。
(2)商品价格的回归分析与预测。在提取的特征的基础上,融合基于最小二乘的回归分析方法,对时间序列进行回归分析,并预测出短期价格。
(3)针对于回归分析未充分利用所提取的特征,而导致准确率不高,提出一种基于最速下降法的梯度修正算法,对预测结果进行修正,进一步提高其准确率与准确度。
(4)基于上述研究,使用sql2008存储数据,在python编程环境下对实验数据进行预测,经过预处理后,采用上述研究模型对农产品价格信息进行预测,并记录预测结果与对比结果。