1预测指标的确定
参考近年来研究建筑施工事故预测的文献,当前用来衡量建筑业安全生产水平的指标主要有单一指标,如建筑事故次数[5]和建筑事故死亡人数[6],选择这类指标在一定程度上体现了行业安全生产水平,但同时存在未综合考虑生产规模的问题.例如同期相比北京的建筑事故次数以及死亡人数数据比西藏的要高,但不能简单据此判断北京的建筑业安全生产水平比西藏的低,应该同时考虑到两地建筑业规模之间的区别;以及复合指标如百万工时事故次数[7-8],这类指标能够较为综合地体现某时段的行业安全生产水平,但工时数据往往由各施工企业单独统计,并未对外公开.因此,本文选择综合考虑事故死亡人数以及建筑业总产值的复合指标百万元产值死亡率用来衡量建筑业安全生产水平[9],也将之作为本文的预测研究对象(详见表1).
2单项预测模型以
1999-2010年全国建筑施工事故百万元产值死亡率为样本建立单项预测模型,以2011-2013年数据作为模型预测精度的检验,其拟合与预测曲线如图1所示.从图1可看出,样本数据呈现明显的非线性,因此所有的线性预测模型都不予考虑.2.1非线性回归模型应用SPSS软件对样本数据进行曲线估计,其中指数曲线所建模型的判定系数R2=0.916,F=109.6,sig=0,模型显著,拟合精度高[9],所得的预测模型为:利用上述模型所得计算结果见表2,其拟合平均误差为14.36%,预测平均误差为24.20%.拟合及预测误差均较大,这是由实际数据与理想曲线有较大偏差造成的,因此非线性回归的精度往往较低.
2.2指数平滑指数平滑法只需要历史数据资料,是一种比较简单易行、能快速地获得结果的预测方法,三次指数平滑是在二次平滑值的基础上又进行了一次平滑,从而使其能够跟踪时序的非线性变化趋势[9-10].考虑到样本数据是非线性的时间序列,选择三次指数平滑法对其进行拟合.指数平滑加权系数a代表模型对时间序列变化的反应速度[11],本文经过试算比较,取a=0.48.另根据经验取初始平滑值为1999年百万元产值死亡率.应用Matlab建立预测模型,所得计算结果见表2,其拟合平均误差为31.37%,预测平均误差为5.67%.其拟合误差较大,预测精度较高,这是因为前期数据的时序变化率较大,而后期其时序变化率逐渐趋于稳定造成的.
2.3灰色模型灰色系统理论是邓聚龙教授1982于年创立的[12],灰色预测方法己广泛应用于各个领域的预测之中,适合于随时间序列变化不大的数据序列的预测[7,13].应用Matlab建立灰色预测模型,所得计算结果见表2,其拟合平均误差为3.68%,预测平均误差为10.48%.其拟合精度较高,预测误差较大,但其对2011年及2012年的预测误差均小于5%,这与灰色预测模型预测区间较短[3]的特点相符合.
3组合预测模型
组合预测方法是由Bate和Grange于1969年首次提出的实用预测方法[14].它是对同一个预测对象采用不同的单项预测模型,以适当的加权平均形式在某个准则下求得最优加权系数,从而可以充分利用各种单项预测方法所提供的信息,达到提高预测精度的目的[3-4].
3.1线性组合预测模型
当式(2)中p取1时,就得到线性加权组合预测模型.建立该模型的关键在于确定各单项预测模型的权重.本文以预测误差平方和最小为准则。
3.2基于BP神经网络的非线性组合预测模型
上述线性组合模型是式(2)中p值取1的结果,是最简单的形式.p的取值大小势必会影响组合预测模型的精度,但如何确定p的最优值目前还没有一个明确的方法[15],即p取何值才能实现各单项模型的最优组合依然有待研究.然而,如果能够在避开p取值问题的同时有效利用各单项模型的信息,就能从另一个角度进行组合建模,而BP神经网络恰好具备实现这一思路的特性.BP神经网络,是基于误差反向传播算法的人工神经网络.由于BP神经网络具有高度的非线性映射能力、有很强的容错性和很快的处理速度、强有力在线自学习和自适应能力,因此它可以实现输入和输出的任意非线性映射[17-18].
即在实现各单项预测模型拟合、预测值与实际值的非线性映射的同时,不用考虑上述p的取值,也不用求解各单项预测模型在组合模型中的权重,只需确定合适网络结构以及激活和训练函数,就能够构建基于BP神经网络的非线性组合预测模型.预测模型构建分三步:1)输入因子与输出因子.将前文所构建的三种单项预测模型对1999-2010年的拟合结果作为输入因子,各年的实际百万元产值作为输出因子,从而确定模型的输入节点数为3;输出节点数为1.2)激活函数和训练函数.激活函数采用tansig-purelin,训练函数选择带自适应学习率和动量的用梯度下降法的训练函数traingdx.网络进行训练时,学习速率选为0.01,训练次数上限为10000次,训练精度要求为0.0001.3)隐含层神经元数目.理论证明3层BP神经网络,当各层神经元均采用S型函数,可满足任意复杂的非线性函数拟合逼近问题[19].
因此本文选择3层BP神经网络模型,即3-j-1结构.当前对于隐含层神经元数目j的确定还没有统一的结论,但普遍认为增加隐含层神经元数目可以提高模型的精度,主要的观点有[20-21]:结合上述观点,分别取隐含层神经元个数为10、20、30和40进行了模拟训练,结果表明,只有当隐含层神经元个数为30个时,该网络的收敛速度及训练精度能够满足要求(见图2),进而取隐含层神经元为29、31进行模拟训练,得到与上一步相同的结论,因而最终确定的是3-30-1的神经网络结构.利用Matlab编制程序,所得计算结果见表2,其拟合平均误差为0.46%,预测平均误差为1.88%.
4结果及分析
利用所构建的单项及组合预测模型进行计算,所得结果见表2.由表2可得以下3个主要结果.:1)对于各单项预测方法而言,拟合精度较高的不一定预测精度也高,反之拟合精度较低的,也可能预测精度却比较高.证明了各单项预测方法都有其自身特点的论点.2)线性组合预测模型的拟合与预测精度均较高,但其拟合精度低于灰色模型,预测精度低于三次指数平滑.证明线性组合在一定程度上综合了各单项预测方法提供的信息,但并不是最优组合模型.3)基于BP神经网络的非线性组合预测模型的拟合及预测精度较之其它预测模型均有明显提高.因此,该组合模型较好地综合利用了各单项预测方法提供的信息,有效地提高了拟合和预测精度,将BP神经网络应用于非线性组合预测模型的构建是可行的.鉴于前述,应用基于BP神经网络的非线性组合预测模型,以1999-2013年数据为样本,对2014-2016年全国建筑施工百万元死亡率进行了预测,结果见表3.
5结语
1)以提高全国建筑施工事故的预测精度为目的,根据统计数据的特点,以百万元产值死亡率为预测对象,分别建立了非线性回归模型、三次指数平滑模型、灰色预测模型,以最小误差平方和为准则建立了线性组合预测模型,基于BP神经网络建立了非线性组合预测模型.2)拟合及预测结果证明各单项预测模型都有其自身特点,均能提供部分有效信息,线性组合模型在一定程度上综合利用了各单项模型的信息,但不是最优组合模型.3)基于BP神经网络的非线性组合较好地利用各单项模型所提供的信息,拟合及预测精度较其它模型均有明显提高.证明应用BP神经网络进行非线性组合建模是可行的.4)应用基于BP神经网络的非线性组合预测模型对2014-2016年全国建筑施工百万元死亡率进行了预测,结果表明,今后几年建筑安全生产的发展将会较为平缓,需要从管理或技术角度进行创新,以提供新的发展动力.