摘要
结合最优最劣法(best worst method,BWM)、三角模糊数和逼近理想解排序(TOPSIS)方法,提出了一种用于评估数据资产质量的多准则决策框架。首先通过专家访谈构建评价指标体系。其次,采用BWM方法确定评价指标的权重信息。随后,邀请专家根据指标对数据资产质量进行语言评价,并引入三角模糊数克服单个实数表达不完整问题。最后,根据评价指标权重及专家评价信息,采用TOPSIS方法对数据资产质量进行排序。通过将提出的方法应用于商业银行的数据资产质量评估, 验证方法的可行性。
随着大数据、云计算、人工智能、区块链等技术的快速发展,以数字化、网络化、集成化、数据化、智能化为特征的数字化转型浪潮席卷全
目前针对数据资产质量问题的研究仍然较少,现有研究主要关注数据资产的概念和数据资产的运营。中国信通院发布的《数据资产管理实践白皮书》将数据资产定义为由企业拥有或者控制,能够为企业带来未来经济效益,以物理或电子方式记录的数据资源,如文件、电子数
关于质量评价方法研究已经比较成熟,其中多准则决策(MCDM)方法在质量评价领域已被广泛采用。MCDM是现代决策理论的重要内容之一,该方法在比较不同方案时,根据决策问题设定相应的准则和模型进行评
结合BWM、TOPSIS和三角模糊数等方法,提出一种用于评估数据资产质量的MCDM框架。该框架主要包括指标体系构建、指标权重确定、专家评价以及质量排序等步骤。在确定指标权重时,采用BWM方法,该方法是对AHP方法的改进,所需的评价数据较少,可以减少专家的评价偏颇,评价数据更为准
步骤1:根据不同评价对象和场景构建评价指标体系。
构建评价指标是对数据资产质量进行评价的关键步骤。但不同于传统实体资产,数据资产具有规模大、流转快、类型多等特点,不同场景、不同主体对的数据资产的质量要求各不相同,数据资产的质量评价指标具有相对性和动态性。因此,数据资产质量评价指标的确定应在特定场景下,结合文献研究、专家访谈方法进行分析构建。假设存在个评价指标,个对指标评价的专家,用表示。
步骤2:评价指标比较。
专家针对某一具体问题判断在个指标中的最重要指标和最不重要指标;随后,使用1–9量表确定对于所有指标的重要程度,重要度越高,则数值越大。同理,确定其他指标对的重要程度。通过比较可获得:
(1) |
(2) |
式中:表示评价最重要指标对其他指标的重要程度,且有;表示评价其他指标对最不重要指标的重要程度,且有。
步骤3:计算指标的最优权重。
假设基于BWM方法,评价得到的权重为。为了得到指标最优权重,和值应该最小化。因而,可以通过构建模型(3)求得每个指标的最优权重,即
(3) |
当存在多个专家时,依据专家权重信息,聚合每个专家得到的最优指标权重如下:
(4) |
式中:是给出的第个指标的权重;是专家的权重。
步骤4:构造专家评价矩阵。
构造三角模糊数,其中,分别是的下界元素、主元素和上界元素。当时,三角模糊数则退化为普通的实
(5) |
当存在多个专家时,根据专家将个专家的评价进行聚合,得到综合评价矩阵如下:
(6) |
步骤5:构建加权评价矩阵。
根据BWM方法确定的指标权重为,指标加权后的评价矩阵如下:
(7) |
步骤6:根据
(8) |
(9) |
其中,是指标的加权指标值对应的模糊极大集。是指标的加权指标值对应的模糊极小集。
步骤7:根据式(
(10) |
其中,
(11) |
其中,
(12) |
将提出的数据资产质量评估框架应用于某银行对其支行的数据资产质量评估,并对评价结果进行讨论。
近年来,商业银行在业务快速发展过程中,积累了客户数据、交易数据、外部数据等海量数据。数据已经成为银行的重要资产和核心竞争力。为了解数据资产质量现状,某地区商业银行分行邀请5位专家(2位研究人员和3位银行中高层管理人员)采用本文提出的评价模型,对该分行5家支行数据资产质量进行评估。
(1)构建商业银行数据资产质量评价指标。结合文献研究、专家访谈方法,构建商业银行数据资产质量评价指标框架。指标框架构建过程中,首先对现有文献进行分析。从目前研究来看,研究者主要关注数据的相关性、一致性、准确性、完整性等指
(2)指标重要程度评价。专家基于专业知识和经验,确定在商业银行数据资产质量评价中的和;随后,用1–9实数来评价对其他指标的重要程度和其他指标对的重要程度,结果见
(3)根据BWM模型,利用Lingo 软件求解出指标最优权重。邀请的5位专家权重相同,最终得到的每位专家的权重以及综合权重,结果见
(4)构建指标评价语言变量与三角模糊数的对照
(5)根据指标权重,获得加权后的评价矩阵
(6)计算PIS和NIS,为PIS,为NIS。
(7)计算贴近度,并进行排序,结果如
指标构建与权重确定是数据资产质量评价的关键步骤。本文在指标构建过程中,通过对观点的归纳总结,认为数据资产质量不仅包括数据质量特征,还应该体现数据作为资产的重要特性,如收益性和风险性。数据作为资产产生收益和价值已被广泛认可,如银行通过对客户数据分析,了解客户风险偏好、消费能力、信用状况等信息,帮助银行了解客户业务需求,从而帮助银行提供更精准的服务和控制风险。因此,收益性是数据资产质量的重要特性之一。数据资产的安全和风险也是质量评价的重要维度,比如银行在收集、存储过程中可能会丢失或者泄露客户的信息;运营过程中滥用行为可能触发法律风险,数据资产一旦触发上述风险,将会对数据的质量和价值产生影响。
从
为进一步说明本文提出的质量评价框架的有效性和与优点,首先计算专家评价初始模糊值的期望值,并用

图1 各银行在各指标上的评价得分期望值
Fig.1 Expectation of banks' evaluation scores on each index
根据
通过对商业银行数据资产质量的评估,得出管理建议如下:①提升数据完整性、准确性。数据的准确性和完整性是数据资产化的基础,也是影响数据资产质量的关键指标。数据存在错误或缺失,将对企业的运营决策产生不利影响,尤其是金融机构,可能会产生一定风险;②梳理数据资产及其应用场景。当前多数银行对数据资产的应用仅限于为当前业务辅助决策,从案例评价结果来看,数据资产的收益性得分仍然较低,如何发挥数据本身的价值需要企业进一步根据业务需求进行拓展;③保障数据安全。银行的相关数据资产往往涉及多方信息,包括客户隐私数据。相关数据泄露、流失也将会触及法律风险。监管机构需要银行进一步规范数据的收集和存储流程,从银行层面也需要完善相关的流程与规定,保障数据安全。
数据已经成为新的生产要素和战略资产,为技术创新和产业升级提效增能。评价和提升数据资产质量,对发挥数据资产价值具有重要意义。本文结合BWM、TOPSIS和三角模糊数等方法,提出一种用于评估数据资产的质量的MCDM框架,为数据资产质量评价问题提供模型参考。通过案例验证与对比分析,本文提出的数据资产质量评价框架操作过程清晰、结果科学准确、易于实现,且排序结果的区分度高于传统方法。通过将提出的方法应用于商业银行的数据资产质量评估,提出商业银行的数据资产质量评价指标体系,并从数据完整准确性、梳理数据资产与应用场景和加强数据安全等角度为商业银行数据资产质量提升提供相应管理建议。
作者贡献声明
尤建新:提出选题,设计论文框架。
徐涛:负责整理文献,开展调研,论文撰写与修订。
参考文献
中国信息通信研究院.数字经济治理白皮书(2019年)[R].北京:中国信息通信研究院,2019. [百度学术]
China Academy of Information and Communication Research. White paper on digital economy governance (2019) [R]. Beijing:China Academy of Information and Communication Research,2019. [百度学术]
MAYER-SCHONBERGER V, CUKIER K. Big data: a revolution that will transform how we live, work, and think[M]. New York: Houghton Mifflin Harcourt, 2013. [百度学术]
尤建新. 大数据时代呼唤数据质量治理[J]. 上海质量, 2019(10):20. [百度学术]
YOU Jianxin. Calling for data quality governance in the era of big data[J]. Shanghai Quality, 2019,(10):20. [百度学术]
中国信息通信研究院.数据资产管理实践白皮书[R].北京:中国信息通信研究院,2019. [百度学术]
China Academy of Information and Communication Research. White paper on data asset management practices [R]. Beijing:China Academy of Information and Communication Research, 2019. [百度学术]
王汉生.数据资产论[M].中国人民大学出版社.北京,2019 [百度学术]
WANG Hansheng. Theory of Data Assets [M]. Beijing: People's University of China Press.2019 [百度学术]
虞正,高红冰,徐盈,等.数据资产化之路-数据资产的估值和行业实践[R].上海:德勤&阿里研究院,2019. [百度学术]
YU Zheng, GAO Hongbin, XU Ying,et al. The Road to data assetization-valuation of data assets and industry practices[R]. Shanghai:Deloitte & Ali Research Institute,2019. [百度学术]
孙俐丽,吴建华, 袁勤俭. B2C企业数据资产质量影响因素研究[J]. 情报理论与实践, 2017(7):99. [百度学术]
SUN Lili, WU Jianhua, YUAN Qinjian. Research on factors influencing data asset quality of B2C enterprises[J]. Intelligence Theory and Practice, 2017(7):99. [百度学术]
OMARA E, SAID T, MOUSA M. Employing neural networks for assessment of data quality with emphasis on data completeness[J]. International Journal on Artificial Intelligence and Machine Learning, AIML, 2011, 11(1): 21. [百度学术]
黄莺. 元数据质量的定量评估方法综述[J]. 图书情报工作, 2013(4):145. [百度学术]
HUANG Ying. A review of quantitative assessment methods for metadata quality[J]. Library Intelligence Work, 2013(4):145. [百度学术]
PELTIER J, ZAHAY D, LEHMANN D. Organizational learning and crm success: a model for linking organizational practices, customer data quality, and performance[J]. Journal of Interactive Marketing, 2013, 27(1): 1. [百度学术]
JORGE M , ISMAEL C , BIBIANO R , et al. A data quality in use model for big data[J]. Future Generation Computer Systems, 2016, 63(10):123. [百度学术]
宋立荣. 基层科技报告资源建设中元数据质量评估研究——以中国科学技术信息研究所为例[J]. 中国科技资源导刊, 2016, 48(1):57. [百度学术]
SONG Lirong. Research on metadata quality assessment in the construction of grassroots science and technology reporting resources: the case of China Institute of Scientific and Technological Information[J]. China Science and Technology Resource Guide, 2016, 48(1):57. [百度学术]
YOON K P, HWANG C L. Multiple attribute decision making: an introduction[M]. Thousand Oaks: Sage publications, 1995. [百度学术]
HWANG C L, MASUD A S M. Multiple objective decision making-methods and applications: a state-of-the-art survey[M]. New York: Springer Science & Business Media, 2012. [百度学术]
SAATY T L. What is the analytic hierarchy process? In mathematical models for decision support[M]. Berlin/Heidelberg: Springer, 1988. [百度学术]
FENG C, MA R. Identification of the factors that influence service innovation in manufacturing enterprises by using the fuzzy DEMATEL method[J]. Journal of Cleaner Production, 2020, 253.DOI:10.1016/j.jclepro.2020.120002 [百度学术]
REZAEI J. Best-worst multi-criteria decision-making method[J]. Omega, 2015, 53: 49. [百度学术]
LIANG D, LIU D, PEDRYCZ W, et al. Triangular fuzzy decision-theoretic rough sets[J]. International Journal of Approximate Reasoning, 2013, 54(8):1087. [百度学术]