这几天一直看ARIMA模型的相关资料,感觉越看越迷糊。。
求指点~~
- ARIMA模型中,纳入建模的数据,应该是平稳化后的数据,还是原始数据呢?---见过一篇文章(博客园里的大熊猫淘沙写的python时间序列分析),里面提到ARIMA模型传入差分后的数据,进行还原时会出问题。。因此,也有人怀疑说是因为模型里还会进行一次差分处理(ARIMA模型传入数据时,一样得给pdq定阶,这样的话,很可能会二次差分)。---因此,我个人怀疑是数据差分后进行平稳性检验,也只是和后面的观察ACF和PACF图确定p和q值一样,确定下d值而已。而实际传入数据时,仍旧应该是原始数据。只是在参数中告诉模型,需要进行几阶差分。不知道这个想法对不对~~
- 数据进行平稳化处理后,通过了ADF和LB检验,满足平稳且非白噪声序列。但是观察ACF和PACF图,却发现两张图都无法快速收敛。这种情况下,到底是什么意思呢?--正常情况下,平稳序列不是应该会很快收敛么?
- SARIMAX模型,与ARIMA模型对比,多了seasonal_order的参数,要求传入P,D,Q,s,分别代表:P--节性自回归阶数;D--季节性差分阶数;Q--季节性移动平均阶数;s--单个季节期间的时间步数。这四个参数应该如何确定呢?
- 周期性因素和季节性因素,有没什么区别?statsmodels库中的decompose模块可以把数据分解成趋势因素、周期性因素和剩余值三部分。。那这个剩余值里,是否包含了季节性因素?差分又是否仅能消除趋势因素?还是说阶数是消除趋势,而步长消除周期?
还有好多问题。。。感觉不知道如何学下去了。