pgsql 两个时间字段相减_如何在Excel做专业的时间序列分析
一、工具产生背景
在生产中我们常会根据历史数据去预测未来的发展趋势。比如客户投诉量、用户留存率、页面点击率等等。
对于预测功能的需求多但是具备相应能力的分析师却很少。想做出一份精准的预测需要具备很多专业的知识和技能。因此有必要做一个分析工具,即简单易用又能实现良好的预测效果。因此开发了该ARIMA的预测模型以实现在Excel中轻轻松松即可完成一份准确的预测。
ARIMA是常用的时间序列分析模型,且其预测效果得到了广泛的公认。因此,可以考虑将该模型可视化,提供给用户。
二、使用工具
点击SqlCel选项卡下的“时序分析”按钮,如下:
将弹出以下对话框:
接下来具体介绍功能的使用:
1、选择数据集
选择的数据集需满足以下条件:
1)首行是字段
2)总共两个字段,第一个字段是日期时间,第二个字段是对应的数值
如下:
在本例中,我们使用经典的airpassengers数据集。
2、周期
周期是以下所有分析的基础,默认值是12。周期设置不同对结果有较大影响。
周期体现的是一组数据的周期性。它可以通过用户的个人经验来设置。也可以通过相关图来判断。现在介绍相关图判别法。我们先设置一个比较大的周期,然后点击“相关图”按钮将产生时间序列的相关图,观察自相关图(Autocorrelation),一般取相关系数超出置信边界,且系数较大、阶数较大的那一阶为周期:
此图中可以比较明显的观察出周期为12。
3、平稳性检验
平稳性检验用于判断数据的平稳性。点击“平稳性检验”按钮可以输出时序图和DF检验表(单位根检验)。如下:
通过时序图可以观察数据趋势和以周期为窗口的滚动平均值及滚动标准差。滚动均值可以消除周期性并体现数据的趋势性,滚动标准差可以体现数据的波动性大小。
DF检验以数字的形式判断数据的平稳性,可以给出更严谨的判断标准。判断规则如下:
1)如果P值小于0.05,那么我们即可断定数据是平稳的;
2)如果P值大于0.05,当统计量大于0且小于关键值(1%)或统计量小于0且大于关键值(1%),可以酌情接受平稳性假设;
3)如果统计量大于关键值(1%)则拒绝平稳性假设;
4)P值并不是越小越好,尽量通过少量的平稳性处理步骤满足P值可选即可。
4、平稳性处理
ARIMA模型只能用来预测平稳性序列,因此平稳性处理至关重要。每次平稳性处理之后都会自动做一次平稳性检验。
1)输出
如果勾选“输出”复选框则每次处理后的结果都可以即时输出到当前工作簿。如果取消勾选则仅做数据处理,不输出数据。默认情况下是勾选的。
2)分解
分解操作可以自动将原数据分解成趋势性、季节性和残差三个部分。如下图所示:
数据分解会忽略其它所有平稳性处理操作仅处理原始数据,并且数据分解之后不可以再做其它平稳性处理。后续的模型拟合和预测仅在分解后的数据上进行。
如果在分解操作前需要做对数变换,则可在Excel里面先用LN函数处理原始数据,最后用EXP函数还原预测结果。
3)差分
差分是对等周期间隔的数据线性求减,它是最常用的平稳性处理方法,是ARIMA模型的重要组成部分。
差分的期数是线性相减的周期间隔,一般应小于3,或设为周期数。差分复选框可多次勾选或取消勾选,每次勾选都会在原数据的基础上做一次差分处理。
需要注意的是如果需要做对数变换和移动平均操作需在差分前进行。
4)对数变换
对数变换要求所有的数据均大于0。它可以很好的消除数据的波动性(趋势性和周期性)。是平稳性处理比较理想的选择。
5)移动平均
移动平均可以很好的消除周期性。但是它会引起预测结果较大的波动,它对近期的预测具有较好的效果。
5、模型拟合
模型拟合的关键是设置AR模型的阶数p和MA模型的阶数q。选择阶数可以通过观察相关图判断或者通过AIC准则或BIC准则自动判断。
1)相关图观察
完成平稳性处理后,我们可以点击“相关图”按钮生成当前数据的相关图。自相关图(Autocorrelation)用于确定MA(q),偏自相关图(Partial Autocorrelation)用于确定AR(p)。一般从自相关系数超出置信边界的阶数中选取阶数较小且系数较大的阶数作为p和q的值。然后通过检验模型拟合优度适当调整p和q的值
2)AIC准则
AIC准则以严谨的统计量选择p和q的值。首先设定最大阶数(maxlags),然后点击“AIC准则”按钮。将生成AIC准则列表和AIC选择结果。AIC准则的判断标准是AIC值越小对应的p和q阶数越合理。如下:
其中最大阶数(maxlags)设置的越大,判断的时间越长。
3)BIC准则
BIC准则的选择方法与AIC准则相似。当两者在模型选择上不同时,我们可以参考残差DW检验从而得出更优的一个选择。
模型拟合
设定p和q后点击“开始拟合”按钮将会输出拟合优度检验报告,如下:
AIC和BIC的值越小说明模型拟合得越充分。残差DW检验的值越接近2说明模型拟合越充分。
同时还会输出残差QQ图,如下:
如果QQ图中的点基本围绕着直线分布,说明残差基本符合正态分布,原数据的信息提取得比较完全,模型拟合较充分。
6、时序预测
模型拟合完毕接下来即可使用拟合好的模型进行预测了。设定向前预测的期数,然后点击“开始预测”。此时输出预测结果的时序图,如下:
同时可向当前工作簿输出预测的结果值。
三、预测原理
根据平稳性处理方法的不同分两种预测方法。
1)分解
ARIMA模型仅预测分解后的平稳序列(残差),趋势性和季节性则是根据分解后的数据分别预测,之后汇总三部分预测结果即为最终的预测结果。
2)其它平稳性处理
ARIMA模型仅预测处理后的平稳序列(残差),所作的每一步平稳性处理操作都会进行还原,在还原平稳性操作之前会对平稳性处理前的数据做预测,之后汇总残差预测和每一步还原结果的预测值即为最终的预测结果。
总结
以上是生活随笔为你收集整理的pgsql 两个时间字段相减_如何在Excel做专业的时间序列分析的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: tms570 can 接收大量数据_CA
- 下一篇: docker always_介绍两款Do