摘要
为实现高铁客运枢纽换乘客流分担率的精准辨识,研究结合多模式公共交通大数据,提出了一类基于广义出行链的高铁客运枢纽换乘方式选择模型。通过对不同公共交通方式换乘阶段的关联和融合,提取以高铁客运枢纽为端点的个体广义出行链,分析高铁客运枢纽换乘客流的时空分布特征;综合考虑高铁客运枢纽乘客的个体经济社会属性、主观心理因素及其个体出行特征对换乘方式选择行为的影响,并结合个体广义出行链的特征,基于多指标多原因(MIMIC)模型和多元logit(MNL)模型提出高铁客运枢纽乘客换乘方式选择模型。以北京南站实际数据作为模型的输入,得到了换乘客流方式分担率的估计值。比对分析估计值和真实值可知,误差在可接受范围内。
随着我国高铁客运枢纽建设日渐完善,各配套设施逐步开放,枢纽区域的出行需求急剧增长,高铁客运枢纽逐步成为衔接不同区域交通网络的关键节点。但当前我国高铁客运枢纽对复杂的客流时空分布特征适应能力较弱,多模式公交之间无法根据客流实际需求执行高效协同的服务机制。同时由于缺乏系统科学的多模式换乘客流方式分担率估计的方法,加剧了联合调度多模式交通接驳运力资源的难度。随着各种新兴技术的发展完善,城市居民日常出行活动促使交通系统每天产生的多源海量出行数据,为估计高铁枢纽换乘客流方式分担率提供了新的视角。因此,结合多模式交通大数据,提出高铁枢纽换乘客流方式分担率精准估计的方法对于提高高铁客运枢纽的服务水平、优化运力资源配置具有重要意义。
针对乘客换乘出行方式分担率的研究,主要集中在衔接换乘行为影响因素分析和出行方式选择建模上面。如贾洪飞
综上可知,基于交通出行数据的交通需求辨识与公共交通协同换乘的研究,取得了一定成果。但同时使用多方式出行数据进行换乘方式选择行为辨识的研究,缺乏在时空域范围同时使用公交、地铁刷卡数据、出租车数据以及移动互联等多源异构数据,对个体出行链进行挖掘,尤其是以客运枢纽为起点的出行链的挖掘。
因此,本文通过纠正错误刷卡记录、修补异常站点信息等数据处理手段,完成不同公共交通方式换乘阶段的关联和融合,提取以高铁客运枢纽为端点的个体广义出行链,分析高铁客运枢纽城内换乘客流的时空分布特征;并在此基础上,综合考虑高铁客运枢纽乘客的个体经济社会属性、出行特性及其主观心理因素对换乘出行方式选择行为的影响,建立基于个体广义出行链的换乘行为选择模型,最终估计换乘客流方式分担率,探索高铁客运枢纽乘客的换乘行为特性。
模型构建的整体思路为:结合公交、地铁、出租车等多模式交通出行数据,在数据清洗、推断和融合的基础上,提出个体广义出行链提取的方法;综合考虑高铁枢纽乘客的个体经济社会属性及其个体主观心理因素对换乘出行方式选择行为的影响,构建多指标多原因模型(MIMIC),研究影响因素的相互关系;并将换乘乘客的主观感受变量设为解释变量,结合个体经济社会属性信息和广义出行链的特征,建立高铁客运枢纽换乘方式混合选择模型。模型构建的框架如

图1 换乘选择模型构建的框架
Fig.1 Framework of travel mode choice model
利用公共交通大数据和出租车轨迹数据,提取高铁枢纽换乘乘客的广义出行链,其目的在于挖掘乘客的个体出行特征,如出行时间、出行距离、出行费用等,用于高铁枢纽乘客换乘方式选择行为模型的构建。由于公共交通运营数据的割裂,不同公共交通出行方式产生的出行记录关联不高,现有研究通常只对公交‒公交、地铁‒地铁等相同交通方式间的换乘行为进行研
结合换乘乘客采取地铁、公交两类公共交通出行方式产生的出行记录数据,确定数据关联融合的方法。具体步骤为:首先分别对公交IC卡刷卡数据和地铁AFC数据中的编号编码规则进行分析,确定两类数据之间的关联列;其次,将关联数据中代表地铁、公交进出站时间的字段进行字符串提取,统一转换为标准时间格式。最后,根据两类数据的关联规则,选取相同字段,将两类刷卡数据进行合并,并增加出行方式类型标识,完善出行链出行方式属性信息。
本文考虑高铁枢纽换乘乘客采用公共交通的三种换乘模式:公交‒公交(B‒B)、公交‒地铁(B‒M)、地铁‒公交(M‒B),并假设乘客以步行方式完成换乘,以此对乘客换乘出行的过程进行简化。考虑换乘时间和换乘距离对乘客换乘方式选择行为的影响,首先对换乘空间阈值和换乘时间阈值进行定义。
换乘空间阈值是指相邻两阶段换乘的站间距,以500 m作为空间限制;换乘时间阈值是指相邻两阶段换乘乘客所能接受的最大换乘时间。若两阶段之间的站间距、换乘时间超过了换乘空间或时间阈值,则判定为两次出行;若两阶段的时空距离处于阈值范围内,则认为两阶段之间乘客并未进行其他活动,属于一次出行,即属于同一条公共交通出行链。
研究针对3种换乘模式分别给出换乘时间阈值的计算方法。B‒M模式的换乘时间阈值根据公交下车刷卡时间与地铁进站刷卡时间的时间差来确定,M‒B模式的换乘时间阈值根据地铁出站刷卡时间与公交上车刷卡时间的时间差来确定,B‒B模式的换乘时间阈值根据公交下车刷卡时间与下一阶段公交上车刷卡时间的时间差来确
本文旨在研究高铁枢纽换乘乘客的出行方式选择行为,不考虑乘客的到站行为,即不考虑乘客到站时间对其出行时间的影响。本文将影响高铁枢纽换乘乘客出行方式选择行为的因素划分为可直接观测度量的显变量和不可直接观测度量的潜变量。
显变量包括了个体经济、社会属性和出行链出行特征属性。其中,个体经济、社会属性主要包括年龄、性别、学历程度、是否拥有私家车、出行目的、出行方式等。出行链出行特征属性主要包括基于个体广义出行链提取得到的出行时间、出行费用、出行距离、出行方式、出行目的地等。
潜变量通常用于反映乘客出行方式选择行为的心理偏好,衡量出行者对出行过程的满意度及效用值。研究参考相关文献的研究成
潜变量模型和离散选择模型共同构成混合选择模型,如

图2 混合选择模型结构示意图
Fig.2 Framework of hybrid choice model
单一的离散选择模型,如MNL, NL,R-MNL模型通常是将影响乘客换乘方式选择行为的心理因素转化为可直接量化的指标或采取问卷打分的形式对其进行量化,无法客观体现心理变量之间的内在联系。而多指标多原因(multiple indicators and multiple causes, MIMIC)模型通过构建潜变量与指标变量之间的关联关系,对乘客换乘方式选择行为的心理因素进行更细粒度的刻
MIMIC模型的优势在于不需要进行严格的前提假设,也不需要被各种条件严格约
MIMIC模型之所以被称之为多因果多指标模型,原因在于其测量方程部分实质为多指标模型。潜变量“经济性”的测量方程式如下:
(1) |
(2) |
(3) |
式(
结构方程部分实质为多因果模型,是对出行者个体经济、社会属性、出行特征等可观测的外生变量与潜变量之间的关系分析,如下:
(4) |
式中:、为待估计参数;为年龄、性别等可观测的个体属性与出行特征;为被调查个体。
由此, “舒适性”和“快捷性”的MIMIC模型如下:
(5) |
(6) |
(7) |
(8) |
(9) |
(10) |
(11) |
(12) |
本文将换乘乘客的出行链划分为简单出行链、复杂出行链两类。简单出行链是指乘客以高铁枢纽站为起点,以一种出行方式(公交、地铁或出租车)完成一次出行的过程。复杂出行链是指乘客至少采用两种出行方式完成一次出行的过程。同时,乘客的复杂出行链只考虑地铁和公交之间的换乘,即乘客的整个过程仅借助公共交通完成。
每条出行链都可看作是一种出行方式选择方案。当乘客选择第种出行方式选择方案且为简单出行链时,其效用函数可表示为
(13) |
式中:为出行者个人社会经济属性集合;为个体经济社会属性;为出行特征属性集合;为出行特征属性;为潜变量集合;n为潜变量特征属性;、、均为待估参数;为个体经济社会属性的量值;Sjm为第m个出行链出行特征的量值;为潜变量;为误差项。
当乘客选择第种出行方式选择方案且为复杂出行链时,其效用函数可表示为
(14) |
式中:为不同的出行方式;为复杂出行链的多个阶段(简单出行链t为1,复合出行链t为各阶段之和)。
基于本文提出的个体广义出行链的提取方法,对已有数据进行处理并对以北京南站为出行链起点的数据进行筛选。在研究时间范围内,提取得到的有效出行链见
基于提取得到的个体公共交通出行链,进行乘客换乘方式选择行为及其出行特征分析。

图3 公交接驳乘客出行热力图
Fig.3 Heatmap of bus transferring passengers

图4 公交接驳乘客时间和距离分布
Fig.4 Trip time and distance distributions of bus transferring passengers

图5 地铁接驳乘客出行热力图
Fig.5 Heatmap of subway transferring passengers

图6 地铁接驳乘客时间和距离分布
Fig.6 Trip time and distance distributions of subway transferring passengers

图7 出租车接驳乘客出行热力图
Fig.7 Heatmap of taxi transferring passengers

图8 出租车接驳乘客时间和距离分布
Fig.8 Trip time and distance distributions of taxi transferring passengers

图9 出租车与公共交通接驳乘客时间分布对比
Fig.9 Comparison of trip time distributions between taxi and bus passengers
考虑到列车到站时间和接驳客流的换乘出行时间对出行方式选择的影响,本文在不同日期的3个时段分别对前往北京南站的乘客进行问卷调查。调查时段为8:00―12:00、13:00―17:00、19:00―24:00。调查问卷实际下发的数量为238份,其中,有效问卷201份,有效问卷回收率达85.0%。从年龄上看,被调查者中男性占比54.2%,女性占比45.8%;18以下群体占比8.9%,18~30岁群体占比45.8%,30~40岁群体占比22.4%,40~60岁群体占比18.9%,60岁以上群体占比4.0%。从受教育程度上看,高中及以下群体占比10.0%,大专及本科学历群体占56.2%,研究生群体占33.8%。从个体属性的角度上看,21.9%的被调查者拥有私家车,45.7%的群体来京目的为工作或公务出行等。调查样本的整体分布比较均匀,部分属性的分布略显集中,如被调查者的年轻群体占比较高、高学历群体占比较高。
本文借助AMOS软件将问卷调查数据和出行链数据导入,运用最大似然估计进行模型估计。模型结构如

图10 换乘方式选择潜变量模型结构示意图
Fig.10 Structure of transfer mode choice model with latent variables
MIMIC模型的拟合度评价指标如
注: “*”表示P值小于0.05;“**”表示P值小于0.01;“***”表示P值小于0.001。
运用主成分分析法和凯撒正态化最大方差法,对成分矩阵(也称因子载荷矩阵)进行标准化求解,得到潜变量的适配值,见
传统对综合交通枢纽出行者换乘选择行为的推断,大多基于个体问卷或单一行程数据,得到的结果精度较低,应用范围受限。因此,本文基于多模式交通数据,提出了一种综合考虑出行者心理潜变量、个体经济、社会属性以及个体出行链出行特性的换乘方式选择行为模型,对高铁客运枢纽接驳客流的出行分担率进行了估计。主要结论如下:
(1)该模型的本质是MIMIC模型和MNL模型结合的混合选择模型,经样本数据拟合的结果可以看出,考虑的潜变量(舒适性、快捷性、经济性)对出行者换乘出行方式的选择有显著影响。
(2)通过对上下层模型参数估计结果进行分析,得到了个体特征、心理潜变量和出行方式之间的相互影响关系。其中,从潜变量模型标定的结果可以看出,经济性要求较低的出行者更倾向选择出租车出行,更不倾向选择复杂出行链出行,且对舒适度要求较高;从离散选择模型的标定结果可以看出,出发时间越晚或出行费用越高的出行者越倾向于选择出租车出行。
(3)将参数估计结果和样本数据带入下层模型,估计得到高铁枢纽换乘乘客的出行方式分担率,通过与真实值对比,可以看出估计结果和真实值的绝对误差在3%以内,在可接受范围内。
尽管本文对丰富的多源交通数据进行了较为充分的应用,但由于不同交通方式之间的使用记录存在数据壁垒,如对乘坐公交后打车或骑乘共享单车的乘客无法识别,使得部分出行链的构建还不够完整,同时对高铁客运枢纽换乘方式分担率的研究也仅限于公共交通和出租车。因此后续研究将进一步考虑私家车、共享单车等出行数据,以丰富乘客广义出行链的构成,提高换乘方式分担率估计的精度。
刘 兵:研究成果整理,论文书写,方法梳理,算法设计。
姚李亮:算法设计,模型实现,数据处理与分析。
作者贡献声明
马晓磊:研究方案构思,整体思路设计,算法、数据处理指导,文稿修改。
参考文献
贾洪飞,孙宝凤,王苏娟,等.基于计划行为理论的换乘决策机理解析[J].吉林大学学报(工学版),2012,42:1481. [百度学术]
JIA Hongfei, SUN Baofeng, WANG Sujuan, et al. Analysis of transfer decision mechanism based on planned behavior theory [J]. Journal of Jilin University (Engineering and Eechnology),2012,42:1481. [百度学术]
SRINIVASAN K K, MAHMASSANI H S. Analyzing heterogeneity and unobserved structural effects in route-switching behavior under ATS:a dynamic kernel logit formulation[J].Transportation Research Part B:Methological,2003, 37:793. [百度学术]
DE VOS J, SINGLETON P A, GARLING T. From attitude to satisfaction: introducing the travel mode choice cycle[J]. Transport Reviews, 2021,42: 1. [百度学术]
程龙, 陈学武, 杨硕. 基于态度‒行为模型的低收入通勤者出行方式选择[J]. 交通运输系统工程与信息, 2016, 16: 176. [百度学术]
CHENG Long, CHEN Xuewu, YANG Shuo. Travel mode choice of low-income commuters based on attitudinal behavior model [J]. Transportation System Engineering and Information Technology, 2016, 16: 176. [百度学术]
PAULSSEN M, TEMME D, VIJ A, et al. Values, attitudes and travel behavior: a hierarchical latent variable mixed logit model of travel mode choice[J]. Transportation, 2014, 41:873. [百度学术]
姚恩建, 陈伟迪, 卢天伟, 等. 考虑出行者选择偏好的出行方式选择模型[J].北京交通大学学报,2020,44:42. [百度学术]
YAO Enjian, CHEN Weidi, LU Tianwei, et al. Travel mode choice model considering traveler's choice preference[J]. Beijing Jiaotong University,2020,44:42. [百度学术]
马书红, 李阳, 岳敏. 考虑出行链的城际乘客换乘选择行为研究[J]. 北京交通大学学报, 2020, 44: 74. [百度学术]
MA Shuhong, LI Yang, YUE Min. Research on intercity passenger transfer choice behavior considering trip chain[J]. Beijing Jiaotong University, 2020, 44: 74. [百度学术]
LEE D, DERRIBLE S, PEREIRA F C. Comparison of four types of artificial neural network and a multinomial logit model for travel mode choice modeling[J]. Transportation Research Record, 2018, 2672: 101. [百度学术]
马晓磊, 刘从从, 刘剑锋, 等. 基于公交 IC 卡数据的上车站点推算研究[J]. 交通运输系统工程与信息, 2015, 15: 78. [百度学术]
MA Xiaolei, LIU Congcong, LIU Jianfeng, et al. Research on bus boarding station based on IC card cata [J]. Traffic And Transportation Systems Engineering and Information Technology, 2015, 15: 78. [百度学术]
周雨阳, 赵倩阳, 陈艳艳, 等. 基于IC卡数据的长距离公交客流特征分析[J].重庆交通大学学报(自然科学版), 2018, 37: 80. [百度学术]
ZHOU Yuyang, ZHAO Qianyang, CHEN Yanyan, et al. Analysis of long-distance bus passenger flow characteristics based on IC card data [J]. Journal of Chongqing Jiaotong University (Natural Science), 2018, 37: 80. [百度学术]
张政, 陈艳艳, 梁天闻. 基于网约车数据的城市区域出行时空特征识别与预测研究[J].交通运输系统工程与信息, 2020, 20: 89. [百度学术]
ZHANG Zheng, CHEN Yanyan, LIANG Tianwen. Research on spatial and temporal characteristics of urban travel based on ride-hailing data [J]. Transportation Systems Engineering and Information, 2020, 20: 89. [百度学术]
MA X, LIU C, WEN H, et al. Understanding commuting patterns using transit smart card data[J]. Journal of Transport Geography, 2017, 58:135. [百度学术]
CHANG X, WU J, HE Z, et al. Understanding user’s travel behavior and city region functions from station-free shared bike usage data[J]. Transportation Research Part F: Traffic Psychology and Behaviour, 2020, 72: 81. [百度学术]
XING Y, WANG K, LU J J. Exploring travel patterns and trip purposes of dockless bike-sharing by analyzing massive bike-sharing data in Shanghai, China[J]. Journal of Transport Geography,2020, 87:102787. [百度学术]
靳海涛, 金凤君, 陈卓, 等. 基于换乘链断裂点时空信息的公交换乘行为识别[J]. 交通运输工程学报, 2018, 18: 176. [百度学术]
JIN Haitao, JIN Fengjun, CHEN Zhuo, et al. Identification of bus bransfer behavior based on spatio-temporal information of transfer chain breaking point[J]. Journal of Traffic and Transportation Engineering, 2018, 18: 176. [百度学术]