摘要
采用数据挖掘的方法,在装配式建筑质量的文献中提取影响因素,利用Apriori算法得到筛选后的关键指标并分析。研究发现,基于大数据能够减少人为因素对指标选取的干扰,并通过寻找影响因素和装配式建筑质量的相关关系,可得到更具普遍性的规律。在5M1E分析法的影响因素中,“法”的影响因素支持度较大,表明该板块包含的影响因素对装配式建筑的质量有更显著的影响。通过置信度分析,提出使用强关联规则分析,并发现“构件生产企业的标准化程度”不仅具有较高的支持度,在关联因素中出现的频率也最高,从而提出建议并为合理评价质量影响因素及制定管理措施提供有效参考。
关键词
装配式建筑于上世纪50年代开始在我国发展,并于70年代达到繁荣期,但是由于理论、技术及工业化程度的限制,于80年代中后期又逐渐淡出公众视
质量研究一直是国内外学者研究装配式建筑的关注热点之一。Chang
本文采用数据挖掘的方法,在已有关于装配式建筑质量的文章中提取相关因素,利用Apriori算法生成频繁项集,通过控制最小支持度和置信度,得到筛选后的关键指标并进行分析,为装配式建筑的项目管理提供有效参考,并为后续装配式建筑的质量评价体系建设提供有力的依据。
Apriori核心思想是用先验知识预测数据的关联规则,通过计算支持度和置信度发现频繁项集,从而找到关联规
(1) |
置信度是对关联规则准确度的衡量,表示规则的可信程度,即数据的条件概率。如项集A发生B也发生的概率,为包含A与B的项数与所有包含A的项数之比:
(2) |
频繁项集是指支持度大于或等于某个阈值的项集,若频繁项集包含k个项,则称为频繁k项集。
Apriori算法作为一种发现频繁项集的算法,用来从事务数据库中挖掘出满足最小支持度阈值和最小置信度阈值的关联规则。
设为频繁项集的集合,为候选项集的集合。扫描数据库,得到候选1项集及其支持度,若其支持度低于最小支持度,则进行剪枝去除非频繁项集,得到频繁1项集;若两个项集相同项为,不同项为和,则两者连接得到候选集:,通过该方法对得到的频繁1项集进行连接,得到候选2项集及其支持度,以此类推进行迭代,直到无法得到频繁项集为止。其中,针对每个频繁项集产生其所有非空真子集,若频繁项集的支持度与非空真子集的支持度比值大于等于最小置信度,则产生强关联规则。具体实现流程如

图1 Apriori实现流程图
Fig.1 Apriori implementation flowchart
通过知网主题栏搜索关键词“装配式&质量”,得到“发文量-年份”可视化分析图(

图2 以“装配式&质量”为关键词“发文量-年份”可视化分析
Fig.2 “Output-year”visual analysis chart with “Assemble & Quality”as key words
随着技术进步和管理提升等现象,发表年份较早的文章所阐述的装配式建筑质量问题,现阶段可能不具备代表性。同时,发表年份较近的文章也会涉及到先前文章中所提到且仍存在的装配式建筑质量问题。为此,通过在知网中以关键词检索“装配式&质量”,并限定发表时间范围为2018年至今,共检索得到160篇文章。在对内容检视后剔除2篇无效文章,共计有效样本文章158篇(编号为P1-P158)。从中提取装配式建筑的质量影响因素作为研究样本,形成文章与其包含的装配式建筑质量影响因素表,见
对原始数据的处理与分类需要确立相应的指标。本文采用5M1E分析法作为确定分类指标的科学方法,人(man)、机(machine)、料(material)、法(method)、环(environment)以及测(measurement)6大因素可视作影响项目工程质量的主要因
随后,将样本文章P1-P158中的评价指标与
主要设置的参数为最小置信度和最小支持度,原则上好的关联规则一般同时具有较高的最小支持度和最小置信
首先,将最小支持度设置为3%、最小置信度设置为50%,得到初步结果;随后以此为基础,通过调整和设置不同的最小支持度和置信度,直至得到所有影响因素的支持度,并最终得到如

图3 不同影响因素的支持度输出结果
Fig.3 Output of “Support” on different impact factors
若设置最小支持度为0.1,则在图中支持度大于0.1的所有影响因素构成频繁1项集,且影响因素的支持度越大,表示该影响因素在数据集中出现的概率越大。从
此外,
以
置信度输出结果有利于项目方通过控制关联规则的前者因素来降低关联因素可能带来的质量问题,有效把控装配式建筑的质量。此外,对于存在直接监控困难的影响因素,可以利用强关联规则间接把控。例如,
进一步观察
采用Apriori算法进行数据挖掘,在关于装配式建筑质量的158篇文章中提取相关因素,通过控制最小支持度和置信度,得到筛选后的关键指标并分析其关联性。研究发现,通过大数据的方法,可以减少人为因素对装配式建筑质量影响因素分析的干扰。通过寻找影响因素和装配式建筑质量的相关关系,发现在各类影响因素中,“法”所包含的影响因素普遍支持度较大,表明所筛选的样本文章认为该板块的影响因素对于装配式建筑的质量有极为显著的影响。同时采用强关联规则的关联分析方法,发现构件生产企业的标准化程度(D8)具有较高支持度和出现频率。在装配式建筑的全过程中,提升构件生产企业的标准化程度将有效提升构件质量并降低装配式建筑的质量安全风险。通过Apriori强关联规则的关联分析方法可以为影响质量因素的合理评价及管理措施的制定提供有效参考。
作者贡献声明
李唐振昊:数据分析,论文撰写。
尤筱玥:学术指导,论文修改。
参考文献
徐雨濛. 我国装配式建筑的可持续性发展研究[D]. 武汉:武汉工程大学, 2015. [百度学术]
XU Yumeng. Prefabricated construction sustainable development research of our country [D]. Wuhan: Wuhan Institute of Technology, 2015. [百度学术]
YU S, LIU Y, WANG D, et al. Review of thermal and environmental performance of prefabricated buildings: Implications to emission reductions in China [J]. Renewable and Sustainable Energy Reviews, 2021, 137: 110472. [百度学术]
PENG J, ZHOU J, MENG F, et al. Analysis on the hidden cost of prefabricated buildings based on FISM-BN [J]. PLoS ONE, 2021, 16(6): e0252138. [百度学术]
中华人民共和国中央人民政府. 中共中央 国务院关于进一步加强城市规划建设管理工作的若干意见[EB/OL]. [2016-02-21]. http://www.gov.cn/zhengce/2016-02/21/content_5044367.htm. [百度学术]
The State Council of the People’s Republic of China. Opinions of the CPC Central Committee and the State Council on further strengthening the management of urban planning and construction. [EB/OL]. [2016-02-21]. http://www.gov.cn/zhengce/2016-02/21/content_5044367.htm. [百度学术]
中华人民共和国住房和城乡建设部. 住房城乡建设部关于印发《“十三五”装配式建筑行动方案》《装配式建筑示范城市管理办法》《装配式建筑产业基地管理办法》的通知[EB/OL]. [2017-03-23]. http://www.mohurd.gov.cn/wjfb/201703/t20170327_231283.html. [百度学术]
Ministry of Housing and Rural Development of the People’s Republic of China. Circular of the Ministry of Housing and Urban-Rural Development on the issuance of the action plan for prefabricated buildings during the 13th Five-Year Plan Period, management measures for prefabricated building model cities, and management measures for prefabricated building industrial bases [EB/OL].[2017-03-23]. http://www.mohurd.gov.cn/wjfb/201703/t20170327_231283.html. [百度学术]
中华人民共和国住房和城乡建设部. 住房和城乡建设部等部门关于加快新型建筑工业化发展的若干意见 [EB/OL].[2020-08-28]. http://www.mohurd.gov.cn/wjfb/202009/t20200904_247084.html. [百度学术]
Ministry of Housing and Rural Development of the People’s Republic of China. Opinions of Ministry of Housing and Urban-Rural Development and other departments on accelerating the industrialization development of new construction [EB/OL]. [2020-08-28]. http://www.mohurd.gov.cn/wjfb/202009/t20200904_247084.html. [百度学术]
CHANG Y F , ISHII H. Fuzzy multiple criteria decision making approach to assess the project quality management in project [J]. Procedia Computer Science, 2013, 22: 928. [百度学术]
吴水根, 柏建韦. 装配式建筑结构部品施工的质量评价[J]. 建筑施工, 2013, 35(2): 116. [百度学术]
WU Shuigen, BAI Jianwei. Construction quality assessment of prefabricated building structure components [J]. Building Construction, 2013, 35(2): 116. [百度学术]
常春光, 王嘉源, 李洪雪. 装配式建筑施工质量因素识别与控制[J]. 沈阳建筑大学学报(社会科学版), 2016, 18(1): 58. [百度学术]
CHANG Chunguang, WANG Jiayuan, LI Hongxue. Identification and control of quality elements for prefabricated concrete constructions[J]. Journal of Shenyang Jianzhu University (Social Science), 2016, 18(1): 58. [百度学术]
张守峰. 提质增效是装配式建筑发展的必由之路[N]. 中国建设报, [2021-05-20](006). [百度学术]
ZHANG Shoufeng. Improving quality and efficiency is the only way for the development of prefabricated buildings[N]. China Construction News, [2021-05-20](006). [百度学术]
崔妍, 包志强. 关联规则挖掘综述[J]. 计算机应用研究, 2016, 33(2): 330. [百度学术]
CUI Yan, BAO Zhiqiang. Survey of association rule mining [J]. Application Research of Computers, 2016, 33(2): 330. [百度学术]
AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules [C]//Proceedings of the 20th International Conference on Very Large Data Bases. Santiago: Morgan Kaufmann, 1994: 487-499. [百度学术]
JOHN M, SHAIBA H. Apriori-based algorithm for Dubai road accident analysis [J]. Procedia Computer Science, 2019, 163: 218. [百度学术]
姜东民, 张哲, 何栋良. 装配式建筑安全事故承灾体脆弱性评价指标体系构建——基于Apriori算法[J]. 沈阳建筑大学学报(社会科学版), 2020, 22(3): 259. [百度学术]
JIANG Dongmin, ZHANG Zhe, HE Dongliang. Construction of vulnerability index system of safety accident disaster - bearing body in prefabricated building: based on Apriori algorithm [J]. Journal of Shenyang Jianzhu University (Social Science), 2020, 22(3): 259. [百度学术]
聂盼盼, 李英海, 王永强, 等. 基于Apriori算法的水库优化调度规则提取方法[J]. 水利水电技术(中英文), 2021, 52(10): 164. [百度学术]
NIE Panpan, LI Yinghai, WANG Yongqiang, et al. Apriori algorithm-based method for extraction of reservoir optimal operation rules [J]. Water Resources and Hydropower Engineering, 2021, 52(10): 164. [百度学术]
郭进涛. 基于5M1E方法在建筑施工质量控制中的应用[J].黑龙江科技信息, 2016(33): 263. [百度学术]
GUO Jintao. Application of 5M1E method in quality control of building construction [J]. Heilongjiang Science and Technology Information, 2016(33): 263. [百度学术]
王颖志, 沈雅婕, 王立君. 基于改进兴趣度度量与Apriori算法的交通事故多发点成因分析[J]. 浙江大学学报(理学版), 2021, 48(3): 349. [百度学术]
WANG Yinzhi, SHEN Yajie, WANG Lijun. The causes analysis of traffic accident black spots based on improved interest measurement and Apriori algorithm [J]. Journal of Zhejiang University (Science Edition), 2021, 48(3): 349. [百度学术]
XIE H. Research and case analysis of Apriori algorithm based on mining frequent item-sets [J]. Open Journal of Social Sciences, 2021( 9): 458 [百度学术]