python 销量预测模型_时间序列ARIMA模型详解:python实现店铺一周销售量预测-程序员宅基地

技术标签: python 销量预测模型  

顾名思义,时间序列是时间间隔不变的情况下收集的时间点集合。这些集合被分析用来了解长期发展趋势,为了预测未来或者表现分析的其他形式。但是是什么令时间序列与常见的回归问题的不同?

有两个原因:

1、时间序列是跟时间有关的。所以基于线性回归模型的假设:观察结果是独立的在这种情况下是不成立的。

2、随着上升或者下降的趋势,更多的时间序列出现季节性趋势的形式,如:特定时间框架的具体变化。即:如果你看到羊毛夹克的销售上升,你就一定会在冬季做更多销售。

常用的时间序列模型有AR模型、MA模型、ARMA模型和ARIMA模型等。

一、时间序列的预处理

拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。

先说下什么是平稳,平稳就是围绕着一个常数上下波动且波动范围有限,即有常数均值和常数方差。如果有明显的趋势或周期性,那它通常不是平稳序列。序列平稳不平稳,一般采用三种方法检验:

(1)时序图检验

看看上面这个图,很明显的增长趋势,不平稳。

(2)自相关系数和偏相关系数

还以上面的序列为例:用SPSS得到自相关和偏相关图。

分析:左边第一个为自相关图(Autocorrelation),第二个偏相关图(Partial Correlation)。

平稳的序列的自相关图和偏相关图要么拖尾,要么是截尾。截尾就是在某阶之后,系数都为0,怎么理解呢,看上面偏相关的图,当阶数为1的时候,系数值还是很大,0.914.二阶长的时候突然就变成了0.050.后面的值都很小,认为是趋于0,这种状况就是截尾。什么是拖尾,拖尾就是有一个缓慢衰减的趋势,但是不都为0。

自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形,说明这个序列不是平稳序列。

(3)单位根检验

单位根检验是指检验序列中是否存在单位根,如果存在单位根就是非平稳时间序列。

不平稳,怎么办?

答案是差分,转换为平稳序列。什么是差分?一阶差分指原序列值相距一期的两个序列值之间的减法运算;k阶差分就是相距k期的两个序列值之间相减。如果一个时间序列经过差分运算后具有平稳性,则该序列为差分平稳序列,可以使用ARIMA模型进行分析。

还是上面那个序列,两种方法都证明他是不靠谱的,不平稳的。确定不平稳后,依次进行1阶、2阶、3阶...差分,直到平稳为止。先来个一阶差分,上图:

从图上看,一阶差分的效果不错,看着是平稳的。

平稳性检验过后,下一步是纯随机性检验。

对于纯随机序列,又称白噪声序列,序列的各项数值之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列。

对于平稳非白噪声序列,它的均值和方差是常数。通常是建立一个线性模型来拟合该序列的发展,借此提取该序列的有用信息。ARMA模型是最常用的平稳序列拟合模型。

二、平稳时间序列建模

某个时间序列经过预处理,被判定为平稳非白噪声序列,就可以进行时间序列建模。

建模步骤:

(1)计算出该序列的自相关系数(ACF)和偏相关系数(PACF);

(2)模型识别,也称模型定阶。根据系数情况从AR(p)模型、MA(q)模型、ARMA(p,q)模型、ARIMA(p,d,q)模型中选择合适模型,其中p为自回归项,d为差分阶数,q为移动平均项数。

下面是平稳序列的模型选择:自相关系数(ACF)偏相关系数(PACF)选择模型

拖尾p阶截尾AR(p)

q阶截尾拖尾MA(q)

p阶拖尾q阶拖尾ARMA(p,q)

ARIMA 是 ARMA 算法的扩展版,用法类似 。

(3)估计模型中的未知参数的值并对参数进行检验;

(4)模型检验;

(5)模型优化;

(6)模型应用:进行短期预测。

三、python实例操作

以下为某店铺2015/1/1~2015/2/6的销售数据,以此建模预测2015/2/7~2015/2/11的销售数据。

#-*- coding: utf-8 -*-#arima时序模型importpandasaspd#参数初始化discfile ='E:/destop/text/arima_data.xls'forecastnum =5#读取数据,指定日期列为指标,Pandas自动将“日期”列识别为Datetime格式data = pd.read_excel(discfile,index_col=u'日期')#时序图importmatplotlib.pyplotasplt

#用来正常显示中文标签

plt.rcParams['font.sans-serif'] = ['SimHei']

#用来正常显示负号

plt.rcParams['axes.unicode_minus'] =Falsedata.plot()plt.show()

#自相关图fromstatsmodels.graphics.tsaplotsimportplot_acfplot_acf(data).show()

#平稳性检测fromstatsmodels.tsa.stattoolsimportadfullerasADFprint(u'原始序列的ADF检验结果为:', ADF(data[u'销量']))

#返回值依次为adf、pvalue、usedlag、nobs、critical values、icbest、regresults、resstore原始序列的单位根(adf)检验

adfcValuep值

1%5%10%

1.81-3.7112-2.9812-2.63010.9984

Pdf值大于三个水平值,p值显著大于0.05,该序列为非平稳序列。

#差分后的结果D_data = data.diff().dropna()D_data.columns = [u'销量差分']

#时序图

D_data.plot()plt.show()

#自相关图

plot_acf(D_data).show()

plt.show()

fromstatsmodels.graphics.tsaplotsimportplot_pacf

#偏自相关图

plot_pacf(D_data).show()

#平稳性检测

print(u'差分序列的ADF检验结果为:', ADF(D_data[u'销量差分']))

一阶差分后序列的单位根(adf)检验

adfcValuep值

1%5%10%

-3.15-3.6327-2.9485-2.61300.0227

Pdf值小于两个水平值,p值显著小于0.05,一阶差分后序列为平稳序列。

#白噪声检验fromstatsmodels.stats.diagnosticimportacorr_ljungbox

#返回统计量和p值

print(u'差分序列的白噪声检验结果为:', acorr_ljungbox(D_data,lags=1))

一阶差分后序列的白噪声检验

statP值

11.3040.007734

P值小于0.05,所以一阶差分后的序列为平稳非白噪声序列。

fromstatsmodels.tsa.arima_modelimportARIMA#定阶

#一般阶数不超过length/10

pmax =int(len(D_data)/10)

#一般阶数不超过length/10

qmax =int(len(D_data)/10)

#bic矩阵

bic_matrix = []forpinrange(pmax+1):  tmp = []forqinrange(qmax+1):

#存在部分报错,所以用try来跳过报错。

try:tmp.append(ARIMA(data, (p,1,q)).fit().bic)except:      tmp.append(None)  bic_matrix.append(tmp)#从中可以找出最小值

bic_matrix = pd.DataFrame(bic_matrix)#先用stack展平,然后用idxmin找出最小值位置。

p,q = bic_matrix.stack().idxmin()

print(u'BIC最小的p值和q值为:%s、%s'%(p,q))

取BIC信息量达到最小的模型阶数,结果p为0,q为1,定阶完成。

#建立ARIMA(0, 1, 1)模型

model = ARIMA(data, (p,1,q)).fit()

#给出一份模型报告

model.summary2()

#作为期5天的预测,返回预测结果、标准误差、置信区间。

model.forecast(5)

最终模型预测值如下:

2015/2/72015/2/82015/2/92015/2/102015/2/11

4874.04923.94973.95023.85073.8

利用模型向前预测的时间越长,预测的误差将会越大,这是时间预测的典型特点。

参数检验如下:Coef.Std.Err.tP值

const49.95620.1392.48060.0182

ma.L1.D.销量0.6710.16484.07120.0003

从检验结果p值来看,建立的模型效果良好。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_39990660/article/details/112827015

智能推荐

约瑟夫环各种实现方法的总结_约瑟夫环代码实现-程序员宅基地

文章浏览阅读3.7k次,点赞2次,收藏7次。约瑟夫问题约瑟夫问题(有时也称为约瑟夫斯置换,是一个出现在计算机科学和数学中的问题。在计算机编程的算法中,类似问题又称为约瑟夫环。又称“丢手绢问题”.)一般形式NN个人围成一圈,从第一个开始报数,第MM个将淘汰,退出圈外,重复上述过程nn-11次,最后剩下一个,最后留下来的人获胜。求出最后获胜者的编号。 例如NN=66,MM=44,被杀掉的顺序是:44,22,11,33,66,55 获胜者便是5_约瑟夫环代码实现

就这样,我只用一天就开发出了一款APP_一天做一个软件厉不厉害-程序员宅基地

文章浏览阅读1.4w次,点赞9次,收藏58次。一个人花一天时间就能开发出一个Android、iOS双平台的APP,一起来看看是怎么实现的_一天做一个软件厉不厉害

linux C语言实现文件锁之flock_linux flock c 语言-程序员宅基地

文章浏览阅读9.9k次。一:flock函数特点:1.flock只能加全局锁。2.当一个进程用flock给一个文件加锁时,用另一个进程再给这个文件加锁,它会阻塞或者也可以返回加锁失败(可以自己设置)。3.当给一个文件加fcntl的独占锁后,再给这个文件加flock的独占锁,其会进入阻塞状态。4.当给一个文件加flock的独占锁后,用fcntl去获取这个锁信息获取不到,再用fcntl仍然可以给文件加锁。5_linux flock c 语言

强制Edge浏览器以深色模式渲染网页_edge 网页颜色渲染-程序员宅基地

文章浏览阅读4.1k次,点赞10次,收藏8次。强制Edge浏览器以深色模式渲染网页_edge 网页颜色渲染

linux 安装nginx cc1: all warnings being treated as errors解决办法_linux 安装cc1-程序员宅基地

文章浏览阅读7.2k次,点赞8次,收藏9次。进入nginx文件夹下的objs里面有个Makefilevim Makefile进去编辑看到将CFLAGS = -pipe -O -W -Wall -Wpointer-arith -Wno-unused -Werror -g后的 -Werror -g 去掉 变成CFLAGS = -pipe -O -W -Wall -Wpointer-arith -Wno-unused保存退出 重新make 即可..._linux 安装cc1

C3P0工具类-程序员宅基地

文章浏览阅读775次。文件命名必须为c3p0-config.xml<?xml version="1.0" encoding="UTF-8"?><c3p0-config> <default-config> <property name="driverClass">com.mysql.jdbc.Driver</property&am_c3p0工具类

随便推点

task_structde(PCB)的结构剖析_struct desc_struct ldt[3];-程序员宅基地

文章浏览阅读2.6k次。进程是处于执行期的程序以及它所管理的资源(如打开的文件、挂起的信号、进程状态、地址空间等等)的总称。注意,程序并不是进程,实际上两个或多个进程不仅有可能执行同一程序,而且还有可能共享地址空间等资源。每一个进程都有一个进程描述符,具体是task_struct结构体存储相关的信息,task_struct就是我们通常所说的PCB(进程控制块,控制进程的唯一手段)。_struct desc_struct ldt[3];

Android 关于佳博和汉印蓝牙热敏打印机开发_android 实现便携式热敏打印机-程序员宅基地

文章浏览阅读4.1k次。接上篇文章Android之BLE(低功耗)蓝牙开发,本篇文章针对上篇博文中提出的两款打印机的开发流程进行记录。首先不管时佳博打印机还是汉印打印机,都是先对他们各自的lib进行导入,如图:导入lib之后,一定要记得进行sync project。一切准备就绪后接着就是根据他们各自提供的文档说明进行开发。本文不做详细说明,下面先贴汉印的打印关键代码(他们家的比较简单):public v..._android 实现便携式热敏打印机

ERROR: Could not find a version that satisfies the requirement scipy (from versions: none)-程序员宅基地

文章浏览阅读6.5k次,点赞6次,收藏9次。问题:ERROR: Could not find a version that satisfies the requirement scipy (from versions: none)解决办法:检查一下源,看是否是http,如果是的话,改为https像下面的都是http,可能会出现这个错误,则改为https就行。清华: http://pypi.tuna.tsinghua.edu.cn/simple豆瓣: http://pypi.douban.com/simple/阿里: http://mirro_error: could not find a version that satisfies the requirement scipy (from v

resttemplate-程序员宅基地

文章浏览阅读103次。

C#如何调用阿里云短信接口_阿里短信接口 vsnet c#-程序员宅基地

文章浏览阅读2.7k次,点赞2次,收藏13次。第一步:登录阿里云管理控制台,短信管理,添加签名和设置模板第二步:申请AccessKey第三步:获得开发api的代码第四步:在VS中下载SDK并且添加引用第六步:复制阿里云Demo代码到VS中,以下提供一个C#的短信帮助类 /// <summary> /// 短信帮助类 /// </summary> public class SmsHelper { /// <summary>_阿里短信接口 vsnet c#

项目上总是有小红叉或者红色叹号以及不能被TomCat发布解决方案_tomcay工件有x-程序员宅基地

文章浏览阅读2.6k次,点赞2次,收藏4次。项目上总是有小红叉或者红色叹号以及不能被TomCat发布解决方案 文章原创,转载请注明出处在项目名上总是有小红叉或者有一个红色的叹号,而项目内部的代码又没有错误。 解决方案:首先查看项目配置的JDK(JRE)版本是否正确,是否是电脑安装的JDK。 查看方法:window-preferences-搜索JRE-installed jres 如果不是,可以..._tomcay工件有x

推荐文章

热门文章

相关标签