自适应神经网络交通流预测的混沌麻雀优化方法

王敬月,楼俊钢

(1.湖州师范学院 湖州长三角智慧交通研究院,浙江 湖州 313000;
2.浙江省现代农业资源智慧管理与应用研究重点实验室,浙江 湖州 313000)

交通流预测模型是智能交通领域最热门的研究方向之一.实时准确的交通流预测可以针对路面交通状况制定相应的管理方案,以有效缓解道路交通拥堵,提高民众出行效率,降低交通事故的发生概率等[1].目前,国内外研究者已提出很多交通流预测模型,包括非参数回归模型[2]、K近邻模型[3-4]、混沌理论模型[5]、神经网络模型(Artificial Neural Network,ANN)[6]和深度学习模型[7]等.

ANNs模型是最常用的交通流预测方法之一,其具有很强的非线性映射能力和柔性的网络结构,可通过对网络层数、神经元个数等的设定,以任意精度逼近各类非线性问题.因此,ANNs被广泛用于软件失效预测、电力负荷预测等非线性预测问题[8-9].群优化算法[10-11]是通过模拟生物界群体行为特征而得出的一种新兴元启发式算法,其结构简洁,擅长并行处理.将群优化算法融入各类ANNs,可以极大地提升其预测效果[12-13].Vlahogianni等提出基于遗传算法(Genetic Algorithm,GA)的多层ANN结构优化策略,该策略有助于精确描述交通流数据,指导ANN的结构选择[14].Chan等运用多尺度分析交通流参数,并结合Levenberg-Marquardt算法和指数平滑的混合ANN来优化多尺度系数[15].Ghadami等提出一种无系统模型,该模型仅使用预警指标和分叉方法预测环形道路的拥堵状态[16].Peng等针对静态混合城市的交通网络结构和基于历史交通流站点间的动态时空关系,建模新的时空关联动态预测图结构[17].李松等针对混沌时间序列,提出使用GA优化误差反向传播神经网络(Back Propagation Neural Networks,BPNN)预测交通流,使预测值较好地拟合实际值,从而提高预测准确性[18].寇飞采用自适应人工鱼群算法改进BP参数,较好地体现了预测过程交通流变化的特性[19].

麻雀搜索算法(Sparrow Search Algorithm,SSA)是由Xue等[20]于2020年提出的,它是一种新型群体智能优化算法,其主要思想是根据麻雀种群觅食及反捕食等一系列行为,选取具有最优适应度值的麻雀.该算法在收敛速度和精度等方面优于粒子群算法(Particle Swarm Optimization,PSO)和引力搜索等群体智能优化算法.本文引入Tent混沌映射来增加SSA的遍历均匀性和随机性,提出混沌麻雀算法(Chaos Sparrow Search Algorithm,CSSA),以提高SSA的全局寻优能力;
利用CSSA优化BP神经网络交通流预测模型的参数,建立CSSA-BPNN交通流预测模型,并将其应用于国内3个不同城市的真实交通数据集,以验证该模型的有效性.

1.1 SSA算法

麻雀种群分为生产者、跟随者和侦察者.生产者具有较好的觅食技能,且负责引领其他麻雀觅食;
跟随者主要跟随1只麻雀觅食且监视争夺食物;
侦察者负责在危险时发出信号,使所有麻雀进行位置移动以躲避危险.种群麻雀适应度值可用以下矩阵表示:

(1)

其中,n为麻雀数量,d为待优化变量维数.

在种群迭代过程中,生产者的位置更新如下:

(2)

跟随者会时刻监控生产者,一旦发现生产者具有更好的食物,它们就会去争夺,如果赢了,则获得食物,否则继续监控.跟随者的位置更新如下:

(3)

其中,Xp为生产者所占据的最佳位置;
Xworst为当前最差位置;
A为元素被随机分配1和-1的1×d矩阵,A+=AT(AAT)-1.当i>n/2时,第i个跟随者由于饥饿,所以其适应度值较差.

在危险时,麻雀的位置更新如下:

(4)

其中,Xbest为当前最佳位置;
β是一个均值为0、方差为1的正态分布;
K∈[-1,1]为一个随机数;
fi为目前麻雀的适应度值;
fg,fw分别为当前麻雀的最佳和最差适应度值;
ε为避免零分区误差的最小常数;
fi>fg表示麻雀在群体的边缘;
fi=fg表示处于种群中间的麻雀意识到危险,需要靠近其他麻雀;
K为麻雀移动方向,为步长控制系数.

1.2 Tent混沌映射

为避免算法过早收敛而加快迭代速度,可使用混沌系统初始化种群.混沌是指在一个确定性系统中存在的貌似随机的不规则运动,其行为表现为不确定、不可重复和不可预测的混沌现象.logistic映射和Tent映射是当前应用较广的离散混沌映射系统.研究表明,Tent映射比Logistic映射具有更优的遍历均匀性和收敛速度[21].因此,本文采用Tent混沌映射初始化种群.Tent混沌映射的表达式为:

(5)

其在可行域中先随机产生初值Z0,直到迭代达到最大次数,最终产生Z序列.

1.3 CSSA算法

CSSA算法流程见图1.其具体步骤为:

图1 CSSA算法流程图

Step 1:构建BP神经网络模型,初始化网络参数;

Step 2:初始化麻雀算法的各项参数,如空间维数、麻雀规模、迭代次数、种群上下边界、生产者数量等;

Step 3:采用Tent混沌映射初始化种群,加入混沌扰动,使种群尽可能地均匀分布;

Step 4:计算种群中麻雀的适应度值;

Step 5:在1到迭代次数之间,根据适应度值对种群进行排序;

Step 6:生产者的位置更新、跟随者的位置更新、在危险时麻雀的位置更新;

Step 7:先进行个体最优更新,再进行群体最优更新;

Step 8:将上述步骤得到的最优适应度值和全局最优位置赋予BP神经网络模型,以优化其权值和阈值,从而进行预测.

CSSA算法主要部分的伪代码见表1.

表1 CSSA算法主要部分的伪代码

基于CSSA-BPNN的交通流预测模型如图2所示.该模型采用3层BP神经网络:输入层取4、隐藏层取8、输出层取1.模型的输入包括车间距(m)、车速(m/s)、车道数n、车密度(veh/km).输出为下一时间段的交通流量.

图2 基于CSSA-BPNN的交通流预测模型

3.1 模型实验

实验数据集来自:上海市中心近陕西路西侧延安高架路段,时间为2020年2月1日14:10-17:10,天气下雪;
北京市北四环近中关村路段,时间为2020年11月3日8:30-11:00,天气晴;
西安南二环长安立交路段,时间为2020年8月4日11:25-18:15,天气晴.采集路面数据信息的记录时间间隔为0.8 s.

在实验中,种群最大迭代次数为100次,学习率为0.1,目标值为0.000 01,麻雀种群规模为100,种群边界值为[-5,5].将遗传算法结合BP(GA-BP)、粒子群算法结合BP(PSO-BP)、麻雀算法结合BP(SSA-BP)、Logistic映射优化SSA结合BP (Logistic Sparrow Search Algorithm,LSSA-BP)、CSSA-BP 5种模型分别输入训练集数据进行网络训练,并在训练完成后将其输入测试集数据进行预测.

图3为5种模型分别使用3组数据集进行实验的结果,x轴为预测次数,y轴为预测值与实际值之间的误差百分值.误差百分值越小,说明预测值越接近实际值,交通流预测效果越好.

图3 5种模型在3组数据集上的预测误差对比图

图3(a)为使用第1组数据集进行的实验.第1组数据集有1 868组数据,选取前1 400组作为训练集,后468组作为测试集.根据预测第125~140次的实验结果误差对比,可以看出,CSSA-BP模型比其他4种模型的预测误差更接近0,预测效果更好.图3(b)为使用第2组数据集进行的实验,第2组数据集有4 552组数据,选取前3 500组作为训练集,后1 052组作为测试集.根据预测第145~165次的实验结果误差对比,可以看出,CSSA-BP模型比其他4种模型的预测误差更稳定.图3(c)为使用第3组数据集进行的实验,第3组数据集有2 830组数据,选取前2 200组作为训练集,后630组作为测试集.根据预测第135~145次的实验结果误差对比,可以看出,CSSA-BP模型的预测过程更稳定,预测误差变化幅度更小.由此可见,本文提出的CSSA-BP交通流预测模型的预测误差最小,其预测值更接近实际值,预测精度最高,效果最优.

图4为5种模型在3组数据集上的网络迭代次数对比图,x轴为预测模型的迭代次数,y轴为模型迭代结束时所达到的最小均方误差(MSE).迭代次数越小,说明模型的预测速度越快,MSE值越小,精度越高.

图4 5种模型在3组数据集上的网络迭代次数对比图

图4(a)为5种模型在第1组数据集上的训练结果.从0开始进行第1次训练,可以看出,CSSA-BP网络迭代7次结束,SSA-BP网络迭代8次结束,GA-BP网络迭代10次结束,PSO-BP网络迭代10次结束,LSSA-BP网络迭代7次结束.图4(b)为5种模型在第2组数据集上的训练结果.从0开始进行第1次训练,可以看出,CSSA-BP网络迭代6次结束,SSA-BP网络迭代10次结束,GA-BP网络迭代8次结束,PSO-BP网络迭代10次结束,LSSA-BP迭代11次结束.图4(c)为5种模型在第3组数据集上的训练结果.从0开始进行第1次训练,可以看出,CSSA-BP网络迭代9次结束,SSA-BP网络迭代13次结束,GA-BP网络迭代12次结束,PSO-BP网络迭代9次结束,LSSA-BP网络迭代12次结束.5种模型在3组数据集上的预测均方误差(MSE)随着迭代次数的增加而逐渐减小,其中CSSA-BP模型的MSE最小.经综合分析发现,相比其他4种模型,CSSA-BP模型的收敛速度更快.

3.2 模型评价

选用RMSE、MAE、MAPE和预测准确率为评价指标,其计算公式为:

(6)

(7)

(8)

预测准确率=(1-MAPE)×100%,

(9)

其中,ypred为预测值,ytrue为实际值,N为预测次数.

BP神经网络权值和阈值是随机产生的,且群体优化算法的全局寻优效果不一,所以需要对这5种模型分别使用3组数据集进行10次实验,以计算最优值F1、最差值F2、平均值F3.表2结果表明,在3组数据集的实验中,CSSA-BP模型的MAE、RMSE、MAPE均值均比GA-BP、PSO-BP、SSA-BP、LSSA-BP模型小.而评估指标MAE、RMSE、MAPE值越小,说明模型预测交通流的测试值与实际值的拟合度越高,其预测精度越高.因此,CSSA-BP模型的误差分布离散程度更小,误差更小,预测效果更好.

表2 5种模型的误差评价指标

表3为在3组数据集的实验中,CSSA-BP模型的4项评价指标相对其他4种模型的变化率.从表3可以看出:CSSA-BP的平均绝对误差(MAE)比GA-BP降低了34.5%,比PSO-BP降低了35.4%,比SSA-BP降低了23.8%,比LSSA-BP降低了19.5%;
CSSA-BP的均方根误差(RMSE)比GA-BP降低了40.3%,比PSO-BP降低了44%,比SSA-BP降低了20.1%,比LSSA-BP降低了25%;
CSSA-BP的平均绝对百分比误差(MAPE)比GA-BP降低了36.5%,比PSO-BP降低了51.8%,比SSA-BP降低了23.7%,比LSSA-BP降低了23.3%.CSSA-BP模型的平均预测准确率比GA-BP提升了1.25%,比PSO-BP提升了4.01%,比SSA-BP提升了0.62%,比LSSA-BP提升了0.52%.由此可以看出,CSSA-BP模型预测交通流的测试值与实际值的拟合度更高,误差更小,整体的预测效果更优.

表3 CSSA-BP相对其他4种模型的评价指标变化率

表3 (续)

本文在3组真实交通流数据集上对5种模型进行预测,结果表明,相比GA-BP、PSO-BP、SSA-BP、LSSA-BP4,CSSA-BP模型的预测精确度更高,迭代速度更快.虽然3组数据集的采集时间、天气状况不一,但实验结果未受影响.从总体看,CSSA-BPNN模型结构精简,预测效果较优,具有实际应用价值.未来的研究将进一步考虑加入空间因素.此外,某一条道路车流量也会受邻近道路车流量的影响而发生变化,若排除天气、时间和空间因素,该模型将能更精准地预测道路车流量.

猜你喜欢 交通流适应度种群 基于LSTM的沪渝高速公路短时交通流预测研究中国交通信息化(2022年9期)2022-10-28改进的自适应复制、交叉和突变遗传算法计算机仿真(2022年8期)2022-09-28山西省发现刺五加种群分布今日农业(2022年15期)2022-09-20京德高速交通流时空特性数字孪生系统中国交通信息化(2022年5期)2022-07-23基于ANFIS混合模型的短时交通流预测①计算机系统应用(2019年6期)2019-07-23“最大持续产量”原理分析生物学教学(2018年3期)2018-08-08由种群增长率反向分析种群数量的变化中学生物学(2018年8期)2018-03-01启发式搜索算法进行乐曲编辑的基本原理分析当代旅游(2016年10期)2017-04-17基于人群搜索算法的上市公司的Z—Score模型财务预警研究财经理论与实践(2015年2期)2015-04-16基于宏观模型的协作式巡航控制交通流方法汽车文摘(2014年2期)2014-12-14

推荐访问:通流 神经网络 麻雀