您现在正在浏览:首页 > 职教文章 > 职教论文 > 基于时间序列的趋势提取方法的研究

基于时间序列的趋势提取方法的研究

日期: 2023/10/31 浏览: 2 来源: 学海网收集整理 作者: 刘冰琪1 解 初2

基于时间序列的趋势提取方法的研究

刘冰琪1 解 初2

1,泰山科技学院 山东泰安 271000

2,国网山东省电力公司泰安供电公司 山东泰安 271000

摘 要:时间序列是指对同一统计指标下的数值根据不同的时间发生次序进行排列,进而得到的一组现实的、真实的数列。该数列具有高维度、大规模,结构复杂且易受噪声干扰等特点,这也使得基于原始时间序列数据进行数据趋势特征信息的挖掘存在较大的难度。时间序列的趋势提取方法能够将高维时间序列数据转化为低维的时间序列数据,同时能够保留反映原始时间序列数据特征的重要信息,该方法在时间序列数据挖掘方面具有广泛应用。主要趋势提取的方法有自顶向下趋势提取方法、自底向上趋势提取方法以及滑动窗口趋势提取方法等,本文基于工业系统中闭环控制系统的时间序列数据,对上述三种趋势提取方法进行对比分析,并确定最优趋势提取方法。

关键词:时间序列;趋势提取;闭环控制系统;性能评价

Research on Trend Extraction Method Based on Time Series

LIU Bing-qi1 Xie Chu2

1,Taishan College of Science and Technology Tai'an Shandong 271000

2,State Grid Shandong Electric Power Company Tai'an Power Supply Company Tai'an Shandong 271000

Abstract:Time series refers to a group of realistic and real data series obtained by arranging the values under the same statistical index according to different time sequence. The sequence has the characteristics of high dimension, large scale, complex structure and easy to be disturbed by noise, which also makes it difficult to mine data trend feature information based on original time series data. The trend extraction method of time series can transform high-dimensional time series data into low-dimensional time series data, and retain important information reflecting the characteristics of original time series data. This method has been widely used in time series data mining. The main trend extraction methods include top-down trend extraction method, bottom-up trend extraction method and sliding window trend extraction method. Based on the time series data of the closed-loop control system in the industrial system, this paper compares and analyzes the above three trend extraction methods and determines the optimal trend extraction method.

Key words:time series;trend extraction;closed loop control system;rating of merit

1 时间序列

时间序列是基于某种统计指标按时间先后顺序进行排序进而形成的数列。随着工业自动化水平的发展,基于时间序列的预测及异常检测越来越广泛。通过对时间序列的趋势特征[1]进行提取,挖掘时间序列所反映的发展过程、发展方向,进而预测时间序列未来可能达到的水平,或基于历史数据,分析检测当前数据是否发生偏离,以达到时间序列异常检测的目的。然而如何准确提取时间序列的趋势特征,是时间序列有效预测和可靠异常检测的关键[2]。因此,本文基于闭环控制系统时间序列的工业数据,就现有趋势提取方法进行对比分析,并基于性能评价指标给出最优趋势提取方法,并验证了该方法的有效性。

2 趋势提取方法

时间序列的趋势提取方法能够在将高维的时间序列数据转化为低维的时间序列数据的,同时,能够保留体现原始时间序列数据特征的重要信息[2],在时间序列数据挖掘方面具有十分广泛的应用。

2.1 自顶向下趋势提取方法

自顶向下趋势提取方法[3]的中心思想是对整个原始时间序列进行线性拟合,并求取拟合误差,然后对整体时间序列数据段进行划分,挑选导致拟合误差最大的数据点进行分段,重复挑选该数据点,直到所有数据段的拟合误差结果在设定的拟合误差范围内,对应分段结果下获得的数据段为自顶向下趋势提取方法的分段结果。

以时间序列数据为例,其中时间序列数据总长度为,设置数据段的拟合误差阈值为,首先将数据段划分为一段,即:

(1)

然后挑选使得数据段拟合误差最大的点,即到拟合直线距离最大的点,假定为第点,其中,因此在点处将数据段划分为两段,即:

(2)

并给出每段的线性表示结果,重复寻找使得每段拟合误差最大的数据点,直到所得每个数据段的拟合误差值均小于设定的拟合误差阈值,即:

(3)

自顶向下提取法是从整体入手,不断进行数据段的划分,因此能够精确掌握信号的总体趋势,但该方法的计算量比较大,尤其对应较高维度的时间序列,会面临更大的计算压力,以至于算法的适用性不高。

2.2 自底向上趋势提取方法

自底向上趋势提取方法[3]的中心思想是先基于原始时间序列数据,对相邻采样点按顺序两两进行连接,得到拟合误差结果等于零的短数据段,然后对相邻的两个短数据段进行合并,并对其拟合数据段的误差值进行计算,将拟合误差值最小的两相邻数据段优先合并为一个数据段,重复以上步骤,直到数据段拟合误差值大于设定的拟合误差阈值或数据段数为设定的分段数,此时得到的分段结果即为自底向上趋势提取方法的划分结果。

以时间序列为例,其中时间序列数据总长度为,令拟合误差阈值为,或令时间序列数据分段数阈值为,则将时间序列产生最准确的拟合数据段,即相邻采样点按顺序两两进行连接,得到拟合数据段,即:

(4)

得到个短数据段,其中,然后计算相邻数据段进行合并的拟合误差结果,若经计算第段和第的拟合误差值最小,令,则将其合并为一个数据段,此时,不断重复以上操作,将拟合误差结果最小的相邻两个数据段进行合并,直到所有数据段的拟合误差值均大于设定的拟合误差阈值或分段数目等于设置的分段数阈值时,此时结束数据段的合并,即满足:

(5)



(6)

自底向上趋势提取方法是自顶向下趋势提取方法的对应思路相反的趋势提取算法,该算法不仅使得时间序列的整体趋势特征得以保留,同时有效兼顾时间序列特征信息的提取。所以,该方法在实际生产应用中有着十分广阔的前景,另外,时间序列划分中的拟合误差阈值以及分段数阈值的合理设置对于该趋势提取方法的可靠性有着重要意义。

2.3 滑动窗口趋势提取方法

滑动窗口趋势提取方法[4]是将窗口中最左侧的数据点进行固定,作为时间序列的初始数据点,滑动窗口向右侧延展以不断的增加数据,随着数据点的不断增多,采用最小二乘法对目前窗口内的数据点进行线性拟合,计算目前窗口中进行直线拟合的数据段拟合误差结果,并将该结果与预先设定的分段阈值数据进行对比,若超过预先设定的分段阈值,认为窗口内数据段满足分段条件,则在窗口末端数据点处断开,并将此数据点作为新窗口的起始点,重复以上拟合步骤,直到得到完整时间序列数据的趋势特征结果。

以时间序列为例,其中时间序列数据总长度为,设置窗口最大的宽度为,窗口最小的宽度为,则初始窗口的宽度,即窗口内时间序列数据为,对窗口内时间序列采用最小二乘算法进行拟合,得到:

(7)

、为拟合系数,即:

(8)

(9)

其中,,,窗口内数据段的拟合误差值为:

(10)

若拟合误差值小于设定的拟合误差阈值,即不满足公式(11)所示:

(11)

则增加数据,此时,重复以上最小二乘拟合步骤,直至拟合误差结果超过设置的拟合误差阈值,即满足公式(11)的条件,或窗口宽度达到上限,即,认为此时窗口内数据为新划分的数据段,用公式(7)所示线性方程来描述窗口内数据段,并将该窗口的末端数据点作为下一段数据的起始时刻,并重置窗口宽度,进行下一数据段的划分,直至穷尽整个数据段。

滑动窗口趋势提取方法是最为简单的趋势提取法,但此方法受分段阈值影响较大,分段阈值过小会使得分段数目过多,忽略时间序列数据总体的趋势特征,分段数过大使得所划分的数据段太长,使时间序列趋势特征的提取丧失意义。因此,合理可靠的设置分段阈值对滑动窗口趋势提取方法特别重要。

3 性能评价

为有效对比现有自顶向下趋势提取方法、自底向上趋势提取方法以及滑动窗口趋势提取方法的性能,本文基于闭环控制系统时间序列的工业数据分别采用上述方法进行趋势提取,最终确定最优趋势提取方法。实际工业数据选取某电厂4号机组#6低压加热器的水位及正常疏水调节阀指令数据[5],如图1所示。

图1. 闭环控制系统时间序列的工业数据

低压加热器的水位与正常疏水调节阀指令满足闭环控制系统的控制规律[6],即低压加热器的水位为控制系统的过程输出信号,调节阀指令为控制系统的控制信号,控制信号跟随过程输出信号的变化不断进行调整,以实现闭环控制系统的控制效果,如图2所示。

图2. 闭环控制系统方框图

基于图1所示工业数据,分别采用上述趋势提取方法对时间序列进行趋势提取,设置趋势提取的分段数在1至8范围内取值,滑动窗口长度为L=300s,并以x=5s步进长度向前滑动,对所提取子序列进行拟合。以低加水位初始窗口内时间序列及正常疏水调节阀指令为例,分别采用上述趋势提取方法对时间序列进行趋势提取,基于上述三种趋势提取方法对原始时间序列数据进行趋势提取,并根据公式(10)计算拟合误差,经计算采用滑动窗口趋势提取方法下的时间序列的趋势提取结果拟合误差最小,最优拟合结果如图2所示,其中黑色垂直虚线为最优拟合分段点,即被分为3个数据段,被分为2个数据段,该方法能够更好的提取时间序列的重要特征,有效减小拟合误差。

图3.滑动窗口提取方法的工业数据拟合结果

4 结论

本文在现有研究基础上基于工业数据对自顶向下趋势提取方法、自底向上趋势提取方法以及滑动窗口趋势提取方法三种主要的趋势提取方法进行对比分析,并基于分析结果确定适用于闭环控制系统的最优趋势提取方法。滑动窗口趋势提取方法能够有效捕捉时间序列的重要特征,更好的保留时间序列的重要信息,从而为基于时间序列特征信息的闭环控制系统异常诊断提供可能,以保证工业自动化系统的安全高效运行。

参 考 文 献

李鹏勃, 胡杰, 郑善魁. 基于时间序列数据的分段表示及趋势提取方法研究[C]// 中国计算机自动测量与控制技术协会. 中国计算机自动测量与控制技术协会, 2015.

刘意杨, 李俊朋, 白洪飞. 基于转折点和趋势段的时间序列趋势特征提取[J]. 计算机应用, 2020.

Keogh E, Chu S, Hart D, et al. An online algorithm for segmenting time series[C]// Proceedings 2001 IEEE International Conference on Data Mining. IEEE, 2001: 289-296.

高东, 马昕, 许欣. 基于滑动窗口的定性趋势分析方法及应用[J]. 计算机应用研究, 2014, 31(5): 4.

刘冰琪, 王建东, 解初等. 基于变化趋势的闭环控制系统报警监控方法[J]. 科学技术与工程, 2020(027): 020.

胡寿松. 自动控制原理基础教程[M]. 科学出版社, 2013.

作者简介:

刘冰琪(1996.2-),女,汉族,泰安市,泰山科技学院,硕士,助教,高校教师,研究方向:电气工程及其自动化;

解初(1994.7-),男,汉族,泰安市,硕士,国网山东省电力公司泰安供电公司,变电运维中心副值班长,助理工程师,研究方向:智能电网理论与技术。


基于时间序列的趋势提取方法的研究.doc

返回顶部