摘要
铁路信号设备是保障行车安全、提高运输效率的核心装备,加强信号设备智能运维是降低铁路运行风险的必要基础保障。目前,针对我国基于建筑信息模型(BIM)的智能运维平台存在不能精准映射各设备的行为规律和相互之间互馈作用的机理,须同时依靠经验知识进行推断等问题。首先构建了铁路设备运维文本知识图谱;其次构建卷积神经网络(CNN) ‒ 团组图卷积神经网络(cgGCN)模型对BIM图像模态数据进行处理,完成对20种铁路信号设备零件图信息的标注,实验结果表明模型准确率达到95.38 %,精确率和召回率的调和平均值F1达到95.58 %;最后将BIM图像信息以视觉模态嵌入运维文本知识图谱,利用Neo4j图数据库实现多模态知识图谱可视化展示,从而精准映射各信号设备相互之间互馈作用的机理,为后续现场铁路运维人员实施安全管理和运维决策提供在线服务和指导。
关键词
随着我国高速铁路网的快速发
知识图谱(knowledge graph,KG)作为表示结构化知识的描述框架,能够以简洁的形式表达描述性数据和实例数据。目前已被广泛应用于电
综上,本文从实际应用出发,提出基于BIM和数据驱动的铁路设备运维多模态知识图谱构建方法。首先利用已有的铁路信号设备运维文本数据,构建运维文本知识图谱;接着以铁路四电BIM工程设备管理系统获取的图像模态数据为研究对象,构建卷积神经网络(convolutional neural networks,CNN)‒团组图卷积神经网络(clique group graph convolutional neural networks,cgGCN)模型对BIM图像数据进行信息标注;最后将图像信息以视觉模态嵌入到运维文本知识图谱中,完成BIM图像数据与运维文本数据的集成融合,构建铁路设备运维多模态知识图谱,为后续现场铁路运维人员实施安全管理和运维决策提供在线服务和指导。
本文提出的铁路信号设备运维多模态知识图谱构建总体框架如

图1 铁路设备运维多模态知识图谱构建总体框架
Fig. 1 Overall framework of multimodal knowledge graph construction for railway equipment operation and maintenance
由于铁路信号设备运维数据具有强专业性,故采用自顶向下与自底向上相结合的方法构建知识图谱。首先根据不同类型数据的结构化特征,自顶向下形成对应的概念节点和关联关系,然后自底向上构建相应的数据层,利用知识源之间的数据冗余性进行知识抽取,文本模态的知识抽取操作主要包括实体、关系抽取和知识融合。
首先,针对铁路信号设备非结构化运维文本数据命名实体识别任务识别精度低、识别不全问题,采用BERT-BiLSTM-CRF(bidirectional encoder representations from transformers-bi-directional long short-term memory-conditional random fields)模型进行实体抽取:由BERT将文本数据转为字符级嵌入向量,送入BiLSTM提取上下文特征信息,CRF学习标签之间的内部关系以获取最优标签序列。然后,基于BERT-CNN模型进行关系抽取,将文本数据送入BERT中进行编码生成词向量,然后送入CNN中进行训练,最后添加全连接层和softmax层抽取出目标实体之间的关系。由于运维文本数据记录方式存在差异,对同一设备、故障现象、处理措施等内容的描述不同,导致知识重复抽取,例如“密贴检查器”和“密检器”实际为同一设备实体。为避免知识图谱中构建重复节点,本文基于铁路信号设备运维数据中的实体构建词典,针对抽取实体采用cosine相似度算法在词典中进行实体匹配,将抽取实体链接到对应实体上。
最后,将非结构化的源文本数据转化为结构化的知识三元组数据并存储至Neo4j图数据库,完成运维文本知识图谱的构建。
铁路领域存在诸多专有名词,在实际运维环境中,基于BIM的铁路信号设备运维平台可对信号设备进行三维几何信息的可视化。将此类BIM图像模态数据表征和关联在知识图谱中,能更直观形象地显示铁路设备内部的上下游关系,实现故障发生后的快速定位。对于BIM图像模态数据,本文借助计算机视觉处理技术进行表征,其流程如下所述。
为了从输入的铁路设备BIM图像中自动学习具有代表性的图数据,将原始图像送入CNN进行自适应图的构造,过程如

图2 自适应图的构造过程
Fig. 2 Process of adaptive graph construction
首先给定输入的铁路设备图像,H和W分别为图像高度和宽度,采用CNN网络对其进行高维特征的学习,由卷积层和池化层生成多通道的特征图,和分别为特征图的高度和宽度,C为通道数。接着将多通道特征图中相同空间位置的像素拼接起来,形成特征向量,该向量被视为一个图节点,代表原始图像中的一个空间区域。最后将多通道特征映射调整为节点嵌入矩阵,其中N为节点数。基于节点嵌入,由k近邻法(k-nearest neighbor,kNN)根据节点特征之间的距离生成边来构造图。
kNN中评价两个节点之间相似度的距离函数,计算方式为
(1) |
其中:vi和vj分别为第i和第j个节点嵌入,。然后,选择离每个节点最近的k个节点作为相邻节点。
图的边可以计算为
(2) |
其中:如果图中第i和第j个节点之间有边连接,则为eij=1,eij=0则为无边连接。
由于自适应图的构造嵌入到整个图像分类模型框架中,因此在训练过程中,节点特征和边缘连接都会随着整个网络的优化而更新。因此,图可以自适应更新和构造,随后图卷积网络可以学习更有效的图表示进行分类。
对构建的图数据进行图卷积,进一步学习铁路设备图像的空间特征。采用cgGCN替代传统的GCN,以捕捉节点间强大的空间相关性,学习有效的空间特征用于分类任务。
cGCN通过循环反馈网络(Clique Net)最大化信息流,进而有效重用高维图像特征,引导分层特征的细化。具体过程如

图3 cGCN结构示意图
Fig. 3 Illustration of clique graph convolution structure
在阶段I中,输入层通过单向连接初始化所有层。更新后的层被串联起来以更新下一层。cGCN正向传播中第i层的图卷积可以表示为
(3) |
其中:X0为cGCN的输入;为阶段I中第i个图卷积层的输出;Wij为连接第i层和第j层的权值矩阵。
在阶段II中,各层开始交替更新。除了顶层待更新外,所有的图卷积层都作为底层串联,对应的参数也进行串联。cGCN的反馈过程可以表示为
(4) |
其中:表示阶段II中第i个图卷积层的输出。
具有f维节点特征向量的cGCN输出图表示可以表示为
(5) |
其中“{}”表示将向量进行拼接。
利用gGCN来减少冗余信息,并在相邻层之间的特征传播过程中进一步隐式地选择更优的特征表示。其结构如

图4 gGCN结构示意图
Fig. 4 Illustration of group graph convolution structure
首先,表示gGCN的输入,将其分成两个子图G1和G2,分别经过图卷积运算后产生线性图特征和,计算过程如
(6) |
其中:b1和b2分别是图卷积运算过程对应的偏置。
然后,用得到的和计算经BN+ReLU模块产生的非线性图特征和,计算过程如
(7) |
式中:BN和ReLU分别表示批量归一化和ReLU激活函数。
接着,由GConv(Group Conv, 分组卷积)和Tanh激活函数结合成门控机制,输出和,计算过程如下:
(8) |
(9) |
其中:“”表示元素的乘积。逐元素相乘可避免维数增加,降低后续计算的复杂性,同时可有效捕捉两个子图之间的复杂特征交互,以学习高级特征表示。
最后,gGCN的输出图表示计算为
(10) |
其中:,和是可训练的权重变量。
gGCN可以简化学习过程,从而细化节点特征的学习,增强图表示固有的多样性,使学习特性更具鲁棒性。此外,gGCN还实现了对偶分支中不同信息的选择和融合,生成丰富的图表示。
(3) 图像标签预测
将cGCN和gGCN学习到的特征送入图池化层,通过全连接层对输出进行整合,随后采用softmax实现图像标签预测。
铁路设备图像数据集来源于铁路四电工程BIM设备管理系统,共计2 135张,如

图5 BIM图像示例
Fig. 5 Example of BIM image
本文实验环境如
实验环境 | 环境配置 |
---|---|
操作系统 | Linux操作系统 |
CPU | Intel i9 12900K |
GPU | NVIDIA GeForce RTX3080Ti |
编程语言 | Python3.8 |
编程环境 | pycharm2021.2 |
深度学习框架 | TensorFlow-GPU-1.14.0 |
名称 | 参数值 |
---|---|
学习率 | 0.5 |
权值衰减 | |
批处理大小 | 64 |
Epoch | 200 |
最优邻节点数k | 8 |
为验证本实验所提出的模型在铁路设备图像数据集上分类的有效性,将CNN-cgGCN与ResNet5

图6 不同模型图像分类结果
Fig. 6 Image classification results of different models
实验结果表明,CNN-cgGCN算法优于ResNet50、CNN-SAGEConv、CNN-GATConv、CNN-tGCN、CNN-cGCN和CNN-gGCN等所有比较算法。下面对实验结果进行具体分析:
(1) 基于CNN-GCN框架的所有算法在所有指标上的性能都优于基线模型ResNet50,说明CNN-GCN框架的有效性,因为图卷积网络能够从相应的铁路信号设备BIM图像中学习各构件间的空间信息,从而提高分类性能。
(2) 与CNN-tGCN相比,CNN-cGCN在分类准确率、精确率、召回率和F1值上分别提高了2.34 %、2.30 %、2.10 %和2.33 %,表明cGCN中的循环反馈机制能够有效提高图卷积的性能。与此同时,CNN-gGCN的结果优于CNN-tGCN,因为gGCN将原始图划分为两个子组,然后分别提取各分支特征和融合特征,获取不同的图信息,同时还隐式地执行特征选择进而减少冗余信息,提高图卷积的分类性能。
(3) 与CNN-cGCN相比,CNN-cgGCN分类准确率提高了4.04 %,表明cgGCN中的gGCN可以通过图卷积简化学习过程,从而细化节点特征,使学习的特性更具鲁棒性。此外,gGCN还可以选择和融合各分支中的不同信息,生成丰富的图表示,提高分类性能;与CNN-gGCN相比CNN-cgGCN模型分类准确率提高了3.03 %,表明cgGCN中的cGCN通过循环反馈机制能够最大化信息流,获得更优的特征表示,提高分类性能。综上,CNN-cgGCN分类性能最好,证明将cGCN和gGCN结合用于铁路设备BIM图像处理的优越性。
基于所述方法,首先抽取铁路设备运维文本中的知识,以三元组形式存入Neo4j图数据库,实现铁路设备运维文本知识图谱的可视化展示。接着通过BIM图像模态知识抽取获取对应信号机、自动开闭器、齿轮组、电动机、锁闭器等20种铁路设备零件图信息,然后令图像信息以视觉模态嵌入到运维文本知识图谱中,直观准确地反映信号设备信息之间的内在联系。另外,考虑在不同环境下各设备工作的可靠性和安全性,将转辙机、信号机等设备零部件实体节点所处的自然环境以及应用环境等相关信息作为附加属性添加。部分铁路设备运维多模态知识图谱可视化展示如

图7 铁路设备运维多模态知识图谱
Fig. 7 Multimodal knowledge graph for operation and maintenance of railway equipment
铁路设备运维多模态知识图谱的决策辅助功能包括查询分析和运维决策措施反馈。通过知识检索和图计算实现,知识检索能够在知识图谱中快速获取运维决策者所需的信息,从而形成结构化的知识结果并反馈给运维决策者。图计算利用图分析算法对知识图谱进行分析,获得更深层次的设备运维决策规则。
为进一步对比多模态数据为铁路信号设备运维图谱带来的跨模态检索和查询能力,将本文构建的多模态知识图谱与去除BIM图像模态的知识图谱进行对比。
图谱模态 | 构建耗时/min | 查询耗时/ms | 故障处置耗时/min |
---|---|---|---|
文本 | 6 | 345 | 25 |
文本‒图像 | 10 | 351 | 20 |
由
如

图8 铁路设备运维多模态知识图谱的应用流程
Fig. 8 Application process of multimodal knowledge graph of railway equipment operation and maintenance
(1) 基于非结构化运维文本数据,首先构建BERT-BiLSTM-CRF模型进行实体抽取,由于抽取实体中存在“多词一义”问题,故经余弦相似度算法进行实体消歧,然后构建BERT-CNN模型抽取实体间的关系。最终将源数据转化为知识三元组数据构建运维文本知识图谱;
(2) 以铁路设备BIM图像模态的数据为对象,采用CNN-cgGCN模型对铁路设备BIM图像进行分类,得到20种铁路信号设备零件图类别,经对比实验分析,说明将该模型用于铁路领域图像模态数据知识抽取的有效性;
(3) 将BIM图像信息以视觉模态嵌入到运维文本知识图谱中,最终构建铁路信号设备运维多模态知识图谱并进行可视化展示,完成BIM图像数据与运维文本知识的集成融合,直观地映射各设备的行为规律和相互之间互馈作用的机理,同时通过知识检索和图计算可快速获取运维决策者所需的信息,辅助运维人员进行运维决策。
本文是从自然语言处理角度出发,通过构建铁路信号设备运维多模态知识图谱实现BIM图像模态数据与运维文本数据的多维呈现,实质是知识图谱的补全。后续在本文所构建的多模态图谱的基础上会添加更多如音频、视频等模态的数据进行扩充,并且会对多模态信息融合进行研究,将尝试更多先进的方法提高图谱构建质量。在图谱应用方面,未来将结合图神经网络以探究运维图谱自动补全生成的可行性。
作者贡献声明
林海香:数据收集,方案设计,建模思路。
胡娜娜:知识图谱构建,初稿撰写。
何 乔:数据分析,论文修改。
赵正祥:实验结果可视化。
白万胜:数据整理。
参考文献
叶玉玲,李文卿,张俊.高速铁路网络复杂特性及其传播动力学研究[J].同济大学学报(自然科学版),2019,47(5):655. [百度学术]
YE Yuling, LI Wengqing, ZHANG Jun. Research on the complex characteristics and propagation dynamics of high speed railway networks[J]. Journal of Tongji University (Natural Science), 2019,47(5):655. [百度学术]
韩自力,马战国,谷牧, 等. 重载铁路线路设备智能运维关键技术研究[J].铁道建筑,2022,62(8):23. [百度学术]
HAN Zili, MA Zhanguo, GU Mu, et al. Research on key technologies of intelligent operation and maintenance of heavy haul railway line equipment[J].Railway Engineering, 2022,62(8):23. [百度学术]
朱庆,张利国,丁雨淋, 等.从实景三维建模到数字孪生建模[J].测绘学报,2022,51(6):1040. [百度学术]
ZHU Qing, ZHANG Liguo, DING Yulin, et al. From real 3D modeling to digital twin modeling[J].Journal of Surveying and Mapping, 2022,51(6):1040. [百度学术]
XIAO N, PENG B, LI X, et al. Research on the construction and implementation of power grid fault handling knowledge graphs[J]. Energy Reports, 2023, 9: 182. [百度学术]
吴闯,张亮,唐希浪, 等.航空发动机润滑系统故障知识图谱构建及应用[J/OL]. 北京航空航天大学学报, 1-14.[2023-06-06].https://doi.org/10.13700/j.bh.1001-5965.2022.0434. [百度学术]
WU Chuang, ZHANG Liang, TANG Xilang, et al. Construction and application of fault knowledge graph for aviation engine lubrication system [J/OL]. Journal of Beijing University of Aeronautics and Astronautics, 1-14.[2023-06-06]. https://doi.org/10.13700/j.bh.1001-5965.2022.0434. [百度学术]
AYOUB H, MARYEM R, MOUNIA M, et al. BERT based clinical knowledge extraction for biomedical knowledge graph construction and analysis[J]. Computer Methods and Programs in Biomedicine Update, 2021, 1:100042. [百度学术]
MAO X, SUN H, ZhU X, et al. Financial fraud detection using the related-party transaction knowledge graph[J]. Procedia Computer Science, 2022, 199: 733. [百度学术]
林海香,白万胜,陆人杰, 等.基于BMBC模型的高速铁路道岔故障信息实体识别[J].铁道科学与工程学报,2023,20(4):1149. [百度学术]
LIN Haixiang, BAI Wansheng, LU Renjie, et al.Entity recognition of high-speed railway turnout fault information based on BMBC model[J].Journal of Railway Science and Engineering, 2023,20(4):1149. [百度学术]
LIU C, YANG S. A text mining-based approach for understanding Chinese railway incidents caused by electromagnetic interference[J]. Engineering Applications of Artificial Intelligence,2023,117: 105598. [百度学术]
薛莲,姚新文,郑启明,等.高铁列控车载设备故障知识图谱构建方法研究[J].铁道科学与工程学报,2023,20(1):34. [百度学术]
XUE Lian, YAO Xinwen, ZHENG Qiming , et al. Research on the construction method of fault knowledge graph of CTCS on-board equipment[J]. Journal of Railway Science and Engineering, 2023, 20(1):34. [百度学术]
LIU J, SCHMID F, LI K, et al. A knowledge graph-based approach for exploring railway operational accidents[J]. Reliability Engineering & System Safety, 2021, 207: 107352. [百度学术]
LIU C, YANG S. Using text mining to establish knowledge graph from accident/incident reports in risk assessment[J]. Expert Systems with Applications, 2022, 207: 117991. [百度学术]
陈烨,周刚,卢记仓.多模态知识图谱构建与应用研究综述[J].计算机应用研究,2021,38(12):3535. [百度学术]
CHEN Ye, ZHOU Gang, LU Jicang. A Review on the construction and application of multimodal knowledge graph[J]. Application Research of Computers, 2021,38(12):3535. [百度学术]
XIONG J, LIU G, LIU Y, et al. Oracle Bone Inscriptions information processing based on multi-modal knowledge graph[J]. Computers & Electrical Engineering, 2021, 92: 107173. [百度学术]
FAN T, WANG H, HODEL T. Multimodal knowledge graph construction of Chinese traditional operas and sentiment and genre recognition[J]. Journal of Cultural Heritage, 2023, 62: 32. [百度学术]
GAO F, LI F, WANG Z F, et al. Research on multilevel classification of high-speed railway signal equipment fault based on text mining[J]. Journal of Electrical and Computer Engineering,2021(2): 1. [百度学术]
LI C, POLLING M, CAO L, et al. Analysis of automatic image classification methods for Urticaceae pollen classification[J]. Neurocomputing, 2023, 522: 181. [百度学术]
BURKHOLZ R, QUACKENBUSH J, BOJAR D. Using graph convolutional neural networks to learn a representation for glycans[J]. Cell Reports, 2021, 35(11): 109251. [百度学术]
CORIZZO R, SLENN T. Distributed node classification with graph attention networks[C]// 2022 IEEE International Conference on Big Data (Big Data). Osaka, Japan: IEEE Xplore, 2022: 3720-3725. [百度学术]
CHEN B, GUO W, TANG R, et al. TGCN: Tag graph convolutional network for tag-aware recommendation[C]// Proceedings of the 29th ACM International Conference on Information & Knowledge Management. [S.l.]: ACM Digital Library, 2020: 155-164. [百度学术]