摘要
针对现有模糊零和博弈难以适应环境复杂度变化及忽视收益矩阵构造的不足,提出了一种基于混合动态专家集成权重确定模型的T阶球形模糊零和博弈多目标求解方法,以帮助博弈方在资源总量保持相对恒定且局中各方追求自身利益最大化的情境下选择最优竞争策略。首先,提出了一种同时考虑客观个体和主观评价信息的混合变动专家集成权重计算模型,该机制下得到的专家权重会随专家的主观评价信息而变化,更接近实际情况。其次,利用加权平均法搭建了T阶球形模糊零和博弈多目标规划模型,该方法不受策略数量的影响,且求得的最优混合策略能反映博弈各方竞争策略的具体可行性和分歧程度。最后,通过实例计算和对比分析,验证了所提出方法的实用性和优越性。结果表明,所提出的模型具有决策效率高、计算复杂度低、受方案数量影响小的特点,且得到的概率形式的混合解可以有效地反映策略间的差异程度,当最优策略失效时可提供替代建议,有助于避免重复决策,浪费决策资源。
零和博弈是一种在资源总量保持相对恒定、局中各方追求自身利益最大化的情形下,解决主体间利益冲突的完全竞争博弈方法,其结果不但能够反映任意两种竞争策略在实施概率上的具体差异,还具有计算复杂度低的特征。然而,受环境波动干扰、信息传递壁垒等影响,博弈各方很难准确评估出各策略的收益值。因而,如何将策略收益的隐形不确定性融入到零和博弈模型搭建中至关重要。
模糊数论已被证明在显性化不确定性方面具备突出优
此外,博弈各方收益矩阵的准确度决定了结果的合理与否。现有研究缺少对收益矩阵的构造过
本文旨在考虑混合变动专家集成权重的同时搭建T-SF零和博弈多目标规划求解模型,主要贡献在于:① 创新性地运用T-SFSs将零和博弈的搭建和求解理论拓宽到三维空间,赋予决策者更大的自由度,能够借助一个可变动的构造参数有效刻画更为复杂的动态模糊零和博弈环境;② 打破经典Hausdorff距离的计算壁垒,首次提出三维T-SF-Hausdorff距离公式,并将其与所提出的可信度分析量表整合设计了一个混合动态专家集成评价权重确定方法,能够同时反映专家客观个体信息和主观评价信息,所得到的专家权重更加合理和贴近真实;③ 搭建的模糊零和博弈求解机制能够描述各策略的博弈行为特征,受策略数量限制较小,具备高效、低复杂度、低计算负担的良好特性,与简单排序结果相比,概率形式的模糊博弈混合解可以更好地凸显各个策略间的具体差异程度。
定义1 [
(1) |
其中,分别为的隶属度、中立度和非隶属度,受限于,为正整数。函数为T-SFS的犹豫度,则称三元组为一个T阶球形模糊数(T-spherical fuzzy number,T-SFN)。
定义2 [
(2) |
的精确度函数为
(3) |
定义3 [
(1)若,则;
(2)若,,则;
(3)若,,则;
(4)若,,则。
定义4 [
(1) ;
(2) ;
(3) ;
(4);
(5) 。
定义5 [
(4) |
Nadle
定义6 [
零和博弈是由两个博弈方组成的严格竞争系统,其中一位博弈方的损失由另一位博弈方的收益弥补,即两位博弈方的收益之和为零。假设博弈方I和博弈方II构成了一个零和博弈,博弈方I追求最大收益,博弈方II追求最小损失,为博弈方I的收益矩阵,那么博弈方II的收益矩阵为。
定义7 [
定义8 [
令和分别是所有和的集合。
定义9 [
定义10 [
原始对偶线性规划模型求解博弈方I和II的最优策略和分别为
(5) |
和
(6) |
基于冯诺伊曼的最大最小理论和单纯形法求解上述对偶规划模型可求得博弈方I的最优策略、博弈方II的最优策略和博弈值。
对于一个零和博弈竞争问题,假设有限集和分别是博弈方I和博弈方II的策略集合。为了求解T-SF环境下博弈方完全竞争策略选择的零和博弈模型,首先邀请位专家组成一个评价委员会,综合考虑各个策略的成本和效益属性,分别使用T-SFSs语言对博弈方I和II策略的相对优势进行评价,得到个评价矩阵,第位专家的评价矩阵为
;然后,假设是第位专家的初始权重,满足,。通过提出一种度量T-SFNs间差异程度的Hausdorff距离来计算变动专家权重,并依此利用T-SFWA算子聚合个评价矩阵求得综合专家评价收益矩阵;最后,利用多目标规划法求得博弈方I和博弈方II组成的零和博弈结果概率值,并得到最优混合策略解。
(1)借助可信度分析量表确定初始专家集成权重
参考文献[
(7) |
(8) |
式中:为第位专家的可信度综合值;为专家可信度指标赋值。
(2)借助T-SF-Hausdorff距离计算变动专家集成权重
定义11 设和为定义在有限集的任意两个T-SFNs,和为上的两个子区间,有,, ,为正整数,则和间的T-SF-Hausdorff距离见
(9) |
(10) |
定理1 设为一固定集合,则
证明 显然,具有性质(1)~(3),故性质(1)~(3)的证明过程略。
性质(4) 由于,那么对于,都有,和成立。由定义11可知:
, |
情形1 当时,根据定义11可知:,且,,,。
因此,基于前述不等式可知,, ,也即,。
情形2 当,,,,时,证明过程类似于情形1,故略。证明成立。
定理2 和间的归一化Hausdorff距离会随着参数值的增大而增大。
证明 情形1:如果且,那么,则,这说明与参数值为正相关关系。因而,和间的归一化Hausdorff距离会随参数值的增大而增大,即证。
情形2:如果且,那么,则,这说明与参数值为正相关关系。因而,和间的归一化Hausdorff距离会随参数值的增大而增大,即证。
其他10种情形证明过程类似于情形1和情形2,故略。证明成立。
定理2说明基于同样的评价信息,增大的参数值会导致计算得到的和间的归一化Hausdorff距离与实际值产生偏误,也即,给予专家过度的评价自由度并不总是一个明智的决策。
变动专家权重可由
(11) |
(1)构建博弈方I和博弈方II的策略预期收益
博弈方I的预期收益为
(13) |
同理,博弈方II的预期收益为
(14) |
设博弈方I的最小收益为,博弈方II的最大损失为,则有
若,则是零和博弈模型的均衡模糊博弈值。
利用
s.t. ,
, |
, |
(15) |
显然,上述规划模型是非线性的,尚未有求解方法能够直接求得结果。这里,基于加权平均理论提出了一个将
若,与同解,与同解。因而,当时,与同解。同理,、分别与、同解。因此,当,,,,,时,
, |
(16) |
其中,、用于刻画目标优先程度的权重,由博弈方I决定。
鉴于是连续集合,
(17) |
同理,利用
, |
(18) |
显然,当时,与同解。因此,当,,,,,时,
, |
(19) |
其中,、为目标优先程度权重,由博弈方II决定。
鉴于是连续集合,
, |
(20) |
然而,当时,;当时,;当,。在这些情形下,
, |
(21) |
和
, |
(22) |
根据对偶理论,
这里,借鉴文献[
现A公司和B公司考虑以下3种备选竞争策略来最大限度地扩大市场份额:提高用户质量()、投资广告()和工艺改进()。为了提高专家评价的有效性,采取产学研合作的评价模式,邀请5位专家~组成一个评价委员会,其中,为来自高校运营管理领域的专家,为博弈论领域的专家,为某共享电动汽车公司的研发部门主管,为某共享电动汽车公司的市场营销部门主管,为某营销咨询公司的CEO。专家们综合考虑资金需求、劳动力成本、时间成本、执行难度系数和可持续性等因素,对博弈方间的相对竞争优势进行综合评价,给出博弈方的收益矩阵。专家提供的公司的T-SF收益矩阵,见
专家 | 公司策略集 | 公司策略集 | ||
---|---|---|---|---|
(1)借助可信度分析量表确定初始专家集成权重
基于5位专家提供的个人信息,利用
可信度指数 | |||||
---|---|---|---|---|---|
教育背景() | 8 | 10 | 8 | 8 | 8 |
职业与研究问题的 关联度() | 10 | 10 | 8 | 8 | 8 |
评价依据() | 10 | 6 | 10 | 6 | 6 |
问题熟悉度() | 10 | 10 | 8 | 8 | 8 |
自信水平() | 8 | 10 | 8 | 8 | 8 |
经验水平() | 8 | 8 | 8 | 6 | 8 |
54 | 54 | 50 | 44 | 46 | |
0.217 7 | 0.217 7 | 0.201 6 | 0.177 4 | 0.185 5 |
(2)计算变动专家集成权重
首先,运用T-SF-Hausdorff距离计算公式求得专家间的距离,利用
0 | 0.765 5 | 0.902 0 | 0.757 2 | 0.985 2 | 3.409 8 | 0.154 9 | |
0.765 5 | 0 | 0.913 7 | 0.838 2 | 0.675 9 | 3.193 3 | 0.211 7 | |
0.902 0 | 0.913 7 | 0 | 0.550 9 | 0.726 7 | 3.093 2 | 0.220 4 | |
0.757 2 | 0.838 2 | 0.550 9 | 0 | 0.786 0 | 2.932 3 | 0.228 3 | |
0.985 2 | 0.675 9 | 0.726 7 | 0.786 0 | 0 | 3.172 7 | 0.184 7 |
基于5位专家提供的A公司主观收益信息和步骤求得的变动专家权重,利用
公司策略集 | B公司策略集 | ||
---|---|---|---|
令,,依据
和
借助单纯形法计算上述模型,求得A公司最优混合策略为,B公司最优混合策略为,T-SF均衡博弈值为。博弈均衡结果表明:① A公司有0.924 1的概率用策略与B公司竞争新能源共享电动汽车市场份额,有0.075 9的概率用策略与B公司竞争新能源共享电动汽车市场份额;② B公司有0.182 8的概率用策略与A公司竞争新能源共享电动汽车市场份额,有0.817 2的概率用策略与A公司竞争新能源共享电动汽车市场份额。
为了突出T-SFSs在显性化阐释复杂问题上的优势,这里将其与模糊
除了本文所整合的加权平均方法,理想点
方法 | 是否需要 中间变量 | 时间复杂度 比值 | 最优策略 | ||
---|---|---|---|---|---|
本文方法 | × | 1 | (0,0.924 1,0.075 9) | (0,0.828 0,0.817 2) | (0.642 5,0.370 1,0.334 0) |
理想点法 | √ | ≥2 | (0.711 3,0.288 7,0) | (0,0.211 3,0.788 7) | (0.632 1,0.537 3,0.443 5) |
分层优化法 | √ | ≥2 | (0,1,0) | (0,0,1) | (0.641 4,0.353 4,0.434 9) |
前述两种对比强调了本文所搭建模型在求解复杂模糊决策问题的优越性,不论备选策略的数量多少,其都能高效、简便地计算出直观的概率形式的最优混合策略排序结果。
本文提出了一种T-SF环境下的零和竞争博弈多目标规划求解方法。首先,借助T-STFs刻画博弈环境的不确定性,可更全面地反映专家主观评价信息,且可变动参数的设置赋予了决策者较大的自由度。然后,通过定义一种新的T-SF-Hausdorff距离,构建了混合专家变动集成评价权重模型,将主客观评价信息纳入到权重求解中以获得更接近决策者的真实权重,且能自发响应评价信息的动态变化,保证了集成收益矩阵结果可靠性。接着,构建了T-SF零和博弈非线性多目标规划决策模型,并设计了一种非线性多目标规划模型的求解机制。与现有方法相比,本文模型能适应博弈环境的动态变化,策略数量受限小,计算复杂度较低,得到的混合策略解可清晰显示策略间的具体差异,且能在最优方案失效时提供替代建议。
作者贡献声明
丁雪枫:研究选题,提供研究思路和技术指导,论文审定,论文整体结构指导,论文修改并完善。
杨育豆:确定整体研究思路和方法,撰写论文初稿并修改完善,采集和处理原始数据。
参考文献
DING X F, LIU H C. A new approach for emergency decision-making based on zero-sum game with Pythagorean fuzzy uncertain linguistic variables[J]. International Journal of Intelligent Systems, 2019, 34(7): 57. [百度学术]
YANG Y D, DING X F. A q‑rung orthopair fuzzy non‑cooperative game method for competitive strategy group decision‑making problems based on a hybrid dynamic experts’ weight determining model[J]. Complex & Intelligent Systems, 2021, 7: 3077. [百度学术]
ZADEH L A. Fuzzy sets[J]. Information & Control, 1965, 8(3): 338. [百度学术]
GRZEGORZEWSKI P. Distances between intuitionistic fuzzy sets and/or interval-valued fuzzy sets based on the Hausdorff metric[J]. Fuzzy Sets and Systems, 2004, 148(2): 319. [百度学术]
MAHMOOD T, ULLAH K, KHAN Q, et al. An approach toward decision-making and medical diagnosis problems using the concept of spherical fuzzy sets[J]. Neural Computing & Applications, 2019, 31: 7041. [百度学术]
CHAI J H, SU Y, LU S C. Linguistic Z-number preference relation for group decision making and its application in digital transformation assessment of SMEs [J]. Expert Systems with Applications, 2023, 213: 118749. [百度学术]
LIU P D, KHAN Q, MAHMOOD T, et al. T-Spherical fuzzy power Muirhead mean operator based on novel operational laws and their application in multi-attribute group decision making[J]. IEEE Access, 2019, 7: 22613. [百度学术]
JU Y B, LIANG Y Y, LUO C, et al. T-spherical fuzzy TODIM method for multi-criteria group decision-making problem with incomplete weight information [J]. Soft Computing, 2021, 25: 2981. [百度学术]
NADLER S B. Hyperspaces of sets[M]. New York: Marcel Dekker Incorporation, 1978. [百度学术]
CHEN Y W, LARBANI M. Two-person zero-sum game approach for fuzzy multiple attribute decision making problems[J]. Fuzzy Sets and Systems, 2006, 157(1): 34. [百度学术]
ATANASSOV K T. Intuitionistic fuzzy sets[J]. Fuzzy Sets and Systems, 1986, 20(1): 87. [百度学术]
YAGER R R. Pythagorean fuzzy subsets [J].2013 Joint IFSA World Congress and NAFIPS Annual Meeting (IFSA/NAFIPS).[S.l.]:IFSA/NAFIPS, 2013: 57-61. [百度学术]
MAHMOOD T. A novel approach towards bipolar soft sets and their applications[J]. Journal of Mathematics, 2020,2020(1): 4690808. [百度学术]
CUONG B C, KREINOVICH V. Picture fuzzy sets-a new concept for computational intelligence problems[C].2013 Third World Congress on Information and Communication Technologies (WICT 2013). Hanoi:WITC, 2013: 1-6. [百度学术]
RIAZ M, GARG H, FARID H, et al. Multi-criteria decision making based on bipolar picture fuzzy operators and new distance measures[J]. Computer Modeling in Engineering & Sciences, 2021, 127(2): 771. [百度学术]
南江霞,汪亭,王冠雄,等. 异类值多目标二人零和约束矩阵对策及求解方法[J]. 模糊系统与数学, 2016, 30(4): 121. [百度学术]
NAN Jiangxia, WANG Ting, WANG Guanxiong, et al. The method for solving multi-objective zero-sum and constrained matrix games with heterogeneous values[J]. Fuzzy Systems and Mathematics, 2016, 30(4): 121. [百度学术]
NAN J X, LI D F, ZHANG M J. A lexicographic method for matrix games with payoffs of triangular intuitionistic fuzzy numbers [J]. International Journal of Computational Intelligence Systems, 2010, 3(3): 280. [百度学术]