网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

考虑知识扩散的大型产品装配生产调度模型及算法  PDF

  • 陆志强
  • 马新一
同济大学 机械与能源工程学院,上海 201804

中图分类号: TP18F273

最近更新:2025-03-21

DOI:10.11908/j.issn.0253-374x.23442

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

人力资源的技能结构可以显著影响生产线的效率,而线内师徒培训引起的知识扩散现象是改善人力资源结构的手段之一。引入社交网络描述知识扩散现象,提出在已知目标人力资源结构的条件下考虑知识扩散下资源技能效率提升的多技能资源受限项目调度问题,建立以最小化达成培训目标所需项目个数和平均每个项目所需成本为目标的混合整数规划模型。针对该模型,设计了一种改进的基于分解的多目标进化算法,并嵌入动态规划资源分配算子和任务聚类贪婪调度计划生成机制。通过数值实验证明算法优越性。

由于客户需求变化以及减少库存等需求,现代制造业逐渐从大批量生产向定制化生产转变,项目需求反复变化对制造企业人力资源管理带来新的挑战。在项目生产稳定阶段,团队成员的技能水平能够充分满足项目需求。然而,在项目启动初期往往存在现有人力资源结构与项目需求不匹配的现象。在这一时期团队将经历较长的试生产和培训过程以进行人力资源结构优化,更好地满足项目稳定生产需求。本文旨在缩短项目试生产过程,并降低相关培训过程的成本。

学习效

1指在生产过程中工人会随时间逐渐提高其技能水平,在项目试生产过程中,员工通常需要学习复杂的操作流程。线内学习过程有边做边练、师徒培训等。线内师徒培训可以用于培养操作员正确、高效地操作生产设备和工具,以生产出符合要求的产品。在生产线中,对人力资源学习效应的研究有助于提高生产效率,降低成本。近年来,调度和学习效应集成问题逐渐成为热点。Chen2研究了多项目调度和多技能员工分配问题,考虑工人学习效应和在工人缺口时雇佣外部工人的情况。胡金昌3研究了基于学习效应的一人多机模式下的调度问题。Jemmali4在并行机调度问题中考虑DeJong学习效应,并以最小化完工时间为目标。Heuser5在单机调度问题中考虑工人学习效应和遗忘效应。Zhang6在无关并行机调度问题中考虑工人学习效应,并根据技能等级对工人分组,提出可以嵌入多种启发式规则的组合进化算法求解该问题。陆志强7在以飞机生产为背景,在多技能资源投入问题中考虑工人学习效应,并以快速、低成本地提高现有资源的效率为目标。现有文献研究主要集中于资源通过自身实践引起的效率提高,而对团队中由师徒培训的知识扩散现象引起的学习效应研究较少。李斌8定义团队交互学习效应,建立以最小化完工时长为目标的作业可中断的项目调度问题,但没有考虑人力资源多技能属性。Hosseinian9首次利用社交网络描述团队中的知识扩散,但在研究中将知识扩散引起的效率提高和调度分离,没有考虑在参与不同作业时资源团队结构异质性对知识扩散的影响。

知识扩散是指将知识从一个人或一个团体传播给其他人或团体的过程,在生产线中,知识扩散是人力资源提高技能水平的重要途径。目前对知识扩散的描述主要从扩散方式展开,李柏洲

10考虑不同个体知识异质性,提出知识生态位概念,知识生态位重叠会影响知识扩散的效果。余谦11利用多维临近创新网络描述知识扩散,将临近性分为地理临近、技术临近和社会临近,并分别建立知识扩散模型。社交网络模型利用网络结构研究社会个体之间社交互动对整个社会以及一些社会现象的影响。目前社交网络已经广泛应用于企业知识管理领12。Zheng13将个体分为易感者S、感染者I和犹豫不决者H,并在传染病模型和社交网络基础上建立SIH知识扩散模型。Song14利用社交网络描述隐性知识扩散,并利用蒙特卡洛仿真证明该方法的有效性。现有文献对知识扩散的研究主要集中于企业合作等宏观层面,对微观层面的生产线中师徒培训的知识扩散机制研究较少。

基于当前研究局限性,本文考虑资源多技能属性,进一步完善Cremonini

15提出的知识扩散模型,规定只有在使用相同技能共同参与同一作业的资源之间才会发生知识扩散,且知识扩散呈现为高效资源与低效资源之间的一对一培训,从而更加具体地描述实际作业中师徒培训学习过程。并构建在目标人力资源结构已知情况下以最短化培训时长与最小化平均项目成本为目标的混合整数规划模型。

1 问题描述与数学模型

1.1 问题描述与基本假设

图1所示,企业根据生产线内外部因素确定目标人力资源效率结构。生产线中m名工人重复装配N件某型号大型产品,每件产品可视为一个项目,项目由n项具有时序约束的作业组成,工期均为T。生产初期人力资源结构已知,生产线中人力资源掌握产品生产所需的所有技能S={1,2,,s,,k},但不同技能效率不同。每项作业需要至少一种技能,作业对所需技能有标准效率要求和资源数量要求,实际作业时长受参与作业的资源效率影响。在参与同一项作业同一种技能的活动时资源会通过线内师徒培训发生从高技能水平资源向低技能水平资源的知识扩散,提高低技能水平资源的技能熟练度,资源技能效率增长采用社交网络模型描述。在项目依次进行的同时,资源技能效率通过培训得到提升,达成目标人力资源结构后对培训效果进行评估。

图1  问题描述

Fig. 1  Description of problem

问题决策涵盖资源分配决策和调度计划决策2个主要方面。资源分配决策包括将资源分配给不同作业以及将参与同一作业的资源分配给不同技能2个方面。由于高效率资源能够更迅速地培训其他资源,并缩短项目完成时间,但用工成本较高,因此,考虑这2个相互矛盾的因素,选取每个项目的平均成本和达到目标资源结构经过的项目数量作为目标函数。为更清晰地描述问题,给出以下假设:

(1) 参与作业每个所需技能的资源中至少需要1个效率水平不小于标准效率要求的资源参与才能保证作业顺利开展。

(2) 实际作业时长由作业所需所有技能中耗时最长的技能决定,考虑到作业中各技能耦合效应,参与作业的所有资源在整项作业完成后方可释放。

(3) 人力资源培养目标的确定受到多种内外部因素影

16,不在问题研究范围内,因此假设人力资源培训目标事先已知且合理。

(4) 所有项目依次生产,新项目仅可在当前项目完成后开展。

(5) 项目允许拖期,但拖期需要承担拖期成本。

1.2 基于社交网络的知识扩散模型

一对一师徒培训是生产线中常见的知识扩散模

17,本文知识扩散模型以一对一学徒培训为背景,做出以下假设:

(1) 作业中资源当前使用技能效率超过作业在该技能所需标准效率时具备培训资格,可以对其他参与该技能的效率低于该资源的资源进行培训。

(2) 具备培训资格的资源在作业时对受培训资源进行一对一培训,且所有受培训资源获得的培训时长平均分配。

(3) 由于技能增长速度较慢,假设在同一项目中资源效率不变,在项目结束后更新效率。

采用社交网络模型描述资源间知识扩散和技能效率增长,如图2所示。假设当前项目i中作业j需要s=1s=2这2种技能,对技能s所需资源数量为ljs,在对作业分配资源后则可以得到2张社交网络。网络中每个节点表示一个资源,资源r的效率η(i-1)rs超过作业标准技能效率要求ejs则具有培训资格,如灰色节点所示,效率低于ejs的资源不具备培训资格,如白色节点所示。节点间有向弧表示两资源之间的知识扩散方向,可引起受培训资源技能效率提高。培训形式为一对一培训,根据参与作业资源的效率计算作业时长与各资源受培训时长,采用Cremonini

15提出的知识扩散模型进行效率更新。

图2  基于社交网络的效率增长模型示意

Fig. 2  Schematic diagram of efficiency growth model based on social network

Cremonini等提出的模型定义如式(1)所示。

Δηijrs=q=1mη(i-1)qs-η(i-1)rsγ+ρe-h(i-1)rqθ,i,j,r,s (1)

式中:η(i-1)qs-η(i-1)rs为项目i结束前两资源qr在技能s上的效率差距;h(i-1)rq为在项目i结束前两资源qr历史交互培训总时长,用以描述双方信任程度;γρθ为学习率参数,分别控制效率增长比例上限和下限以及双方信任程度的影响。当一个资源在作业中接受多个不同资源培训时,其效率增量Δηijrs为所有资源对其培训效率增长总和。在该知识扩散模型基础上考虑本次培训交互时长影响,效率增长量与本次交互时长成正比,如式(2)所示:

Δηijrs=q=1mη(i-1)qs-η(i-1)rsΔhijrqγ+ρe-h(i-1)rqθ,i,j,r,s (2)

式中:Δhijrq为两资源在参与项目i作业j的交互培训时长。两资源在作业中交互时长Δhijrq与作业完工时长相关。作业中各技能实际作业时长t¯ijs由分配给该技能的资源平均效率与标准效率ejs的比值决定,如式(3)所示:

t¯ijs=tjejsr=1mλijrsη(i-1)rs/r=1mλijrs,i,j,s (3)

式中:tj为作业标准工时;λijrs为资源r是否参与项目i作业j技能s的变量,λijrs为0或1。作业实际作业时长t¯ij由作业所需各项技能中耗时最长的技能决定,如式(4)所示:

t¯ij=maxs(t¯ijs) (4)

资源效率增长采用一对一师徒培训模式,具有培训资格的资源将作业实际完工时长均等地用于培训其他资源,交互培训时长Δhijrq定义如式(5)所示:

Δhijrq=κijrqst¯ijr=1mκijrqs,i,j,r,q (5)

式中:κijrqs为该作业中资源q是否对资源r进行培训的变量,κijrqs为0或1。

1.3 符号定义

模型中涉及的变量与参数分别如表1表2所示。

表1  模型所涉及变量
Tab. 1  Variables involved in the model
变量符号定义
xijd 0-1变量,项目i的作业jd时刻正在执行为1,否则为0
yijrsd 0-1变量,资源rd时刻使用技能s操作项目i的作业j为1,否则为0
zrra 0-1变量,资源r的培训方向为资源ra则为1,否则为0
λijrs 中间变量,0-1变量,资源r使用技能s参与项目i的作业j为1,否则为0
μi 中间变量,0-1变量,在项目i后达到目标人力资源结构为1,否则为0
κijrqs 中间变量,0-1变量,在项目i作业j中资源q对资源r的技能s进行培训则为1,否则为0
表2  模型所涉及参数
Tab. 2  Parameters involved in the model
参数符号定义参数符号定义
I 项目集合I={1,2,,i,} Δηijrs 资源r在项目i作业j中技能s的效率增长值
T 项目工期 ηirs i项目后资源r技能s的效率
Ti 项目i实际工期 η^ras 资源ra对技能s的目标效率
c 单位时间拖期成本 t¯ij 项目i作业j的实际作业时长
ΔTi 项目i拖期时间 ejs 作业j使用技能s部分的标准效率要求
J 作业集合J={1,2,3,,j,,n} ljs 使用技能s参与作业j的资源数量
Pj 作业j的紧前作业集合 γ 学习率参数,控制单位时间技能增长上限
R 现有资源集合R={1,2,3,,r,,m} ρ 学习率参数,控制单位时间技能增长下限
Ra 目标资源集合Ra={1,2,3,,ra,,ma} θ 学习率参数,控制交互作用的影响
S 技能集合S={1,2,,s,,k} cir 项目i中使用资源r的(单位时间)成本
Δhijrq 资源r与资源q在项目i作业j中的交互时长 M 一个极大的常数
hirq 项目i完成后资源r与资源q的总交互时长

1.4 数学模型

目标函数为

minF=(f1,f2) (6)
f1=i=1f2j=1nr=1ms=1kcirλijrst¯ij+cΔTi/f2 (7)
f2=miniI{iμi+(1-μi)M} (8)

约束条件为

λijrs=1,d=1Tiyijrsd1,i,j,r,s0,其他 (9)
μi=1, ηirszrraηras,r,ra,s0,其他  (10)
        κijrqs=1, (η(i-1)qs>η(i-1)rs)(η(i-1)qs>ejs)                     (λijqs=1)(λijrs=1)0,其他,                                  i,j,r,q,s (11)
ΔTi=Ti-T,Ti-T>00,其他,i (12)
d=1Tixijd=t¯ij,i,j (13)
t¯ipxijdτ=1d-1xipτ,pPj,i,j,d (14)
t¯ijxijd-t¯ijxij(d+1)+τ=d+2Tixijτt¯ij,i,j,d (15)
ljs=r=1mλijrs,i,j,s (16)
maxrRλijrsη(i-1)rs>ejs,i,j,s (17)
t¯ij×yijrsd=d=1Tiyijrsd,i,j,r,s,d (18)
Δhijrq=Δhijqr,i,j,r,q (19)
hirq=h(i-1)rq+j=1nΔhijrq,i,r,q (20)
   Δηijrs=q=1m(η(i-1)qs-η(i-1)rs)γ+ρe-h(i-1)rqθΔhijrq,i,j,r,s (21)
ηirs=η(i-1)rs+j=1nΔηijrs,i,r,s (22)
j=1ns=1kyijrsd1,i,r,d (23)
ra=1mazrra1,r (24)
r=1mzrra=1,ra (25)
xijd,yijrsd,zrra{0,1},i,j,r,s,d,ra (26)

式(6)表示最小化达成资源培训目标所需要项目个数和平均每个项目的成本;式(7)表示现有资源达成培训目标时所需要的项目平均成本;式(8)表示现有资源达成培训目标所需要经过的项目个数;式(9)式(11)表示决策变量与中间变量的函数关系;式(12)表示项目拖期时间计算;式(13)表示作业必须全部完成;式(14)表示作业时序约束;式(15)表示作业不允许中断;式(16)表示作业所需技能的资源数量约束;式(17)表示在使用某项技能参与作业的所有资源中,至少要有1个资源的效率大于标准效率要求;式(18)表示资源为非抢占式;式(19)表示交互时长增长是双向的;式(20)表示一个项目完成后资源交互总时长更新;式(21)表示作业中资源效率增量计算;式(22)表示一个项目完成后资源技能效率更新;式(23)表示某时刻一个资源只能为一项作业的技能提供需求;式(24)表示每个资源最多有一个培训目标;式(25)表示每个培训目标只能应用于一个资源;式(26)表示决策变量取值范围。

2 改进的MOEA/D-NG算法设计

多技能资源受限项目调度问题(Multi-Skill Resource-Constrained Project Scheduling Problem,MS-RCPSP)已被证明为NP-Hard问

18,本问题考虑资源多技能属性以及资源间交互培训产生的知识扩散,解空间广泛,且现有商用软件无法求得多目标优化问题精确帕累托前沿。MOEA/D(Multi-objective Evolutionary Algorithm Based on Decomposition)是一种多目标进化算法,本文在标准MOEA/D算法基础上提出基于分解的考虑小生境的多目标进化算法(Niche-Guided Multi-objective Evolutionary Algorithm Based on Decomposition, MOEA/D-NG),算法上层利用动态规划对参与作业的资源和技能进行分配,下层根据各作业的资源使用情况聚类进行优先级分配并利用资源插空机制生成调度计划。算法流程如图3所示。

图3  MOEA/D-NG算法流程

Fig.3  Flow of MOEA/D-NG algorithm

MOEA/D-NG使用双子串实数编码,如图4所示。第1子串编码为资源目标层编码,编码长度为资源培养目标的个数,编码数字为资源编号,表示资源培训方向。第2子串的资源分配层编码为一个矩阵,矩阵每行表示一个项目中资源和作业的分配关系,每行编码长度为当前项目中所有作业所需资源数之和,编码数字为资源编号,矩阵行数受限于项目数量上限。对于违反作业标准技能效率要求的资源分配层编码,则将其中一个分配给该作业的资源随机替换成另一个满足效率要求的资源。两子串染色体的交叉复制均采用POX(precedence operation crossover)交叉算

19。目标层的变异算子为互换两培训目标对应的资源或选择其他无培训目标的资源替换当前具有培训目标的资源,资源分配层的编码变异算子为用其他未参与该作业的资源替换参与该作业的资源。

图4  MOEA/D-NG编码示意

Fig. 4  MOEA/D-NG encoding

MOEA/D算法目标函数如式(27)所示:

ming=(xλ,z*)=max1<i<m{λifi(x)-zi*},xΩ (27)

式中:z*为理想点;λi为权重向量在第i个目标维度的权重。MOEA/D算法规定了每个权重的领域权重,较优个体的替换均在领域内进行,更新如式(28)所示,新个体y'将替换邻域内所有适应度低于y'的个体。

xj=y',g(y'λj,z)g(xjλj,z)xj,其他,jB(i) (28)

MOEA/D-NG相比MOEA/D算法改进之一是限制领域内较优个体的替换次数,设在邻域内替换次数上限为v,防止少量较优解的出现让算法快速收敛陷入局部最优。MOEA/D-NG相比标准MOEA/D改进之二是采用基于小生境的父代选择,小生境被定义为相似个体组成的领域。标准MOEA/D算法的2个父代均从领域B(i)中随机选择,而MOEA/D-NG将首先计算邻域B(i)中个体的相似度φ(i),如式(29)所示:

φ(i)=j=1TωoOijmo+ωrDijmd/T,jB(i) (29)

式中:ωoωr分别为资源目标层编码和资源分配层编码相似度的权重;momd分别为资源培训目标数和资源分配层中每个项目的所有作业所需的资源总数;OijDij分别为种群中个体i和个体j中资源编号和培训目标对应关系相同的资源数量和各项目各作业中资源分配情况相同的资源数量。MOEA/D-NG第1个父代个体i从种群中依次选择,第2个父代个体选取范围P2则根据φ(i)确定,如式(30)所示:

P2=B(i),φ(i)<ξ{1,2,,N}/B(i),其他 (30)

式中:ξ为邻域相似度阈值,当相似度大于ξ时,父代选择范围将扩大到种群中除邻域B(i)以外的所有个体,减少两父代个体相似的情况。

2.1 基于动态规划的资源分配算法

资源分配编码确定每个作业的可用资源池,资源和技能合理配对可以提高培训效率。采用逆向动态规划算法对参与作业的资源进行技能配对。动态规划(Dynamic Programming,DP)资源分配算法以作业所需的技能s为阶段,状态变量ss为第s阶段剩余的未分配资源,决策变量xs为分配给s技能的资源组合,状态转移方程如式(31)所示,表示ss阶段剩余资源在分配xs资源给第s个技能后剩余资源为下一阶段的状态。阶段指标函数vs(ss,xs)表示xs决策下资源在技能s下的效用值U。最优值函数fs(ss)表示将ss个资源分配给第s至该作业所需的最后一种技能k的最大效用值。逆向动态规划递推公式如式(32)

ss+1=ss-xs (31)
fk+1(sk+1)=0fs(ss)=max(vs(ss,xs)+fs+1(ss+1)),                             s=k+1,k,,1 (32)

效用值U定义为加权效率增长量,计算如式(33)所示:

U=ω1Δη1+ω2Δη2 (33)

式中:ω1ω2分别为有培训目标的效率增长量权重和无培训目标的效率增长量权重;Δη1Δη2分别为与培训目标相符的效率增长量与无培训目标的效率增长量。有无培训目标由资源目标编码判断,若资源在当前所分配技能的效率尚未达到培训目标,则归为有培训目标的效率增长。通过DP得到最大效用值后可反推出作业中资源和技能的配对关系。

2.2 聚类插空调度计划生成机制

Myszkowski

20在MS-RCPSP求解中提出Task-Greedy SGS(TG SGS)进行优先级分配和调度,本文在TG SGS基础上,嵌入基于U-K-means的优先级分配算法和基于插空的调度计划生成机制,提出聚类插空调度计划生成机制(Task-Cluster-Calking SGS,TCC SGS),TCC SGS算法流程如下所示:

步骤1:将项目中n项作业与m个资源的分配情况用n×m独热编码表示。

步骤2:以n×m独热编码为输入,使用U-K-means算法将资源使用情况相似的作业聚类,输出n×c的隶属度矩阵b,其中c为簇的个数。其中U-K-means算法具体描述见2.2.1节。

步骤3:计算每个簇内作业的平均最晚开始时间(latest start time,LST),并将各个簇根据 LST按升序排序,同一个簇内的作业按索引排序,得到所有作业优先级。

步骤4:根据有无紧后任务将所有作业划分为有紧后任务作业和无紧后任务作业,同时将2类中的作业按照步骤3获得的优先级进行排序。

步骤5:基于资源插空算法对有紧后任务作业按优先级、时序约束和资源约束进行调度。其中资源插空算法具体描述见2.2.2节。

步骤6:基于资源插空算法对无紧后任务作业按优先级、时序约束和资源约束进行调度。

2.2.1 基于聚类(U-K-means)的优先级分配算法

TG SGS关键思想在于有紧后任务作业相比无紧后任务作业更可能处在关键路径上,该方法将作业分成有紧后任务作业和无紧后任务作业2类,并优先调度有紧后任务作业。但该算法对类内作业按索引赋优先级,未使用作业的资源使用数据,容易因部分资源任务堆积导致项目完工时间增加。本文在TG SGS基础上,在2类作业的内部根据各作业资源利用情况相似性,利用聚类方式对2类作业中的作业进一步分配优先级,减少资源竞争。

K-means是一种被广泛使用的聚类算法,但该算法需要手动设置聚类数量和聚类初始点,Sinaga

21为K-means算法构建了一个无监督学习模式,提出无监督K-means算法(Unsupervised K-means clustering algorithm,U-K-means),该算法可以在没有参数选择的情况下免于初始化,并能够同时找到最优数量的聚类。U-K-means目标函数如式(34)所示:

   min JU-K-means(b,A,α)=i=1nj=1cbijxi-aj2-βcnj=1cαjlnαj-γci=1nj=1cbijlnαj (34)

式中:b为数据隶属度;A为聚类中心;α为数据点隶属于该簇的概率;βcγc分别为比例因子和学习率,随着迭代过程更新。该目标函数由三部分组成。第1部分是数据点到聚类中心的距离平方和,第2部分和第3部分基于信息熵理论提出,用于衡量聚类中心分布情况。通过最小化目标函数,U-K-means算法可以自动确定最优聚类中心和聚类数量。U-K-means算法通过迭代不断更新聚类中心A和数据点的隶属度b,以最小化目标函数。如图5所示,以作业数n=8、资源数m=8为例,其中J1和J10为虚拟作业,将资源分配情况以8×8独热编码输入,经过U-K-means计算后输出8×3隶属度矩阵,表示8个作业被分成3个簇。分到同一个簇的作业资源用同种颜色阴影表示,簇内作业的资源使用情况相似。

图5  U-K-means示意

Fig. 5  Schematic diagram of U-K-means

簇内作业存在资源竞争,簇与簇之间资源竞争则相对较小。为减少资源竞争对完工时长的影响,需对各簇赋优先级,使较为紧急的簇内作业尽早开始。采用平均LST对各簇赋优先级,同一簇内作业按索引排序。

2.2.2 资源插空机制

优先级排序并不充分考虑资源冲突情况,按照优先级顺序调度作业可能导致资源闲置。引入资源插空机制,让可执行作业跳出优先级限制,灵活利用空闲资源提前执行,减少资源浪费。资源插空的调度计划生成机制伪代码如算法1所示:

1 输入: 待调度作业优先级排序pry_job、时序约束、n×m的资源使用集合job_res、作业时长job_dur

2 初始化 时间指针t=0, 当前正在执行的作业集合set_doing, 正在作业的资源集合set_working

3 while pry_job非空 do

4 for current_job in pry_job do

5 if current_job紧前作业均完成 & 根据set_working所需资源均为空闲 do

6 set_working.add(job_res(current_job))

7 set_doing.add(set_working, current_job)

8 current_job的开始时间 = t

9 current_job的结束时间 = t + job_dur(current_job)

10 end if

11 end for

12 更新时间指针t = min(set_doing中作业的结束时间)

13 set_doing.remove(在t时刻完成的作业)

14 set_working.remove(在t时刻完成的作业所占用的资源)

15 pry_job.remove(在t时刻完成的作业)

16 end while

17 输出: 所有作业开始时刻和完成时刻

第4至11行根据t时刻的资源空闲情况判断是否允许其他作业提前开始,若提前开始则对当前正在执行的作业集合和正在作业的资源集合进行更新,并计算插入作业的开始和结束时间。第12至15行表示当无法再插入新的作业后,跳出循环,更新时间指针到正在作业集合中最先完工的作业的结束时刻,释放该作业占用的资源,并从待调度作业和正在执行作业集合中移除该作业。到所有作业均完成调度后停止循环,输出所有作业开始和结束时刻。

图5所示算例,TCC SGS和TG SGS得到的甘特图如图6 a和b所示,利用执行作业6时的空闲资源提前开始执行优先级较低的作业2,在执行作业5时利用空闲资源提前开始作业7,总完工时长为25,而TG SGS按照索引依次开始各作业,在进行作业2时没有利用闲置资源提前开始作业6,造成时间浪费,总作业时长增加到27。

图6  TCC SGS与TG SGS调度计划甘特图对比

Fig. 6  Comparison of Gantt charts for TCC SGS and TG SGS scheduling plans

3 数值实验

目前尚无考虑知识扩散的MS-RCPSP标准测试集,因此采用对PSPLIB中现有算例进行改造的方式。改造方式如下:① 作业时长,时序约束来自PSPLIB。② 技能数量为4,每项技能所需资源数量不少于2人,每个技能所需的标准效率服从N(0.6,0.082)的正态分布。③ 考虑企业中存在通用工人与专业工人的实际情况,根据资源效率的平均值与极大值两者的算术平均从高到低将资源划分成4级,初始资源各等级数量占比分别为10%、20%、30%、40%,目标资源结构各等级占比分别为20%、40%、40%、0。④ 考虑作业数量n={10,14,20}、资源数量m={10,15,20}共9种问题规模进行测试,每种问题规模均设计5个算例,所有数值实验均使用改造后的数据集。

由于本问题难以获得真实Pareto前沿,因此选定多样性指标纯粹距离(Pure Distance, PD

22、收敛性指标高维空间体积(Hyperarea, H23和综合性指标超体积指标(Hypervolume,HV243项指标,以全面评估算法的性能,GAP定义为当前算法的性能指标与表现最好的算法之间的差距比例。

实验平台使用Windows 11 64位操作系统,CPU为Intel Core i7-12700H 2.30 GHz,内存16.0 GB。开发环境为MATLAB R2021b。

3.1 MOEA/D-NG算法性能评价

将本文提出的MOEA/D-NG算法(A1)与标准MOEA/D算法(A2)以及广泛应用的MOEA/D-DE算法(A3)进行比较,3种算法均使用DP资源分配算法与TCC SGS,对比结果如表3所示,表中n×m表示算例规模。MOEA/D-NG算法在不同规模的算例中均有较优的表现,其多样性指标PD相较MOEA/D提高1.1%~21.7%,较MOEA/D-DE提高2.2%~15.8%。收敛性指标H较MOEA/D降低5.5%~31.4%,较MOEA/D-DE降低1.3%~15.4%。综合性指标HV较MOEA/D提高9.7%~39.3%,较MOEA/D-DE提高4.8%~13.3%。

表3  算法性能比较
Tab. 3  Comparison of algorithm performance
n×m算法编号PDHHV
AVGGAP/%AVGGAP/%AVGGAP/%
10×10 A1 485.1 -0.7 123 274.8 0 38 870.8 0
A2 488.6 0 143 829.4 16.7 32 447.0 -16.5
A3 466.8 -4.5 132 769.4 7.7 35 356.2 -9.0
10×15 A1 920.7 0 358 160.2 0 50 928.2 0
A2 801.8 -12.9 470 634.4 31.4 41 104.0 -19.3
A3 822.4 -10.7 413 225.3 15.4 44 175.8 -13.3
10×20 A1 1295.3 0 408 882.4 0.0 92164.6 0.0
A2 1014.2 -21.7 476 408.8 16.5 79409.4 -13.8
A3 1107.4 -14.5 464 552.3 13.6 87284.6 -5.3
14×10 A1 458.0 0 139 338.2 0 55 782.6 0
A2 432.2 -5.6 156 159.3 12.1 50 365.4 -9.7
A3 426.6 -6.9 145 670.6 4.5 53 100.2 -4.8
14×15 A1 618.1 0 342 402.0 0 81 411.3 0
A2 611.6 -1.1 361 161.2 5.5 49 424.4 -39.3
A3 600.9 -2.8 346 766.6 1.3 71 370.5 -12.3
14×20 A1 836.8 0 525 743.4 0.0 62 188.2 0
A2 777.3 -7.1 593 693.4 12.9 53 016.2 -14.7
A3 818.4 -2.2 565 573.4 7.6 58 042.6 -6.7
20×10 A1 450.9 0 137 732.6 0 36 311.8 0
A2 395.2 -12.4 17 9847.8 30.6 30 037.2 -17.3
A3 410.2 -9.0 149 197.4 8.3 33 737.8 -7.1
20×15 A1 859.5 0 434 772.4 0 118 492.8 0
A2 779.5 -9.3 558 082.8 28.4 100 918.4 -14.8
A3 733.7 -14.6 460 908.8 6.0 108 180.3 -8.7
20×20 A1 851.2 0 511 553.2 0 60 348.2 0
A2 693.8 -18.5 545 736.8 6.7 47 531.8 -21.2
A3 716.4 -15.8 554 977.8 8.5 54 848.2 -9.1

图7为3种算法下各算例CPU平均运行时间

图7  不同作业规模下3种算法的CPU运行时间

Fig. 7  CPU running time of the three algorithms across different example sizes

tCPU,由于不同规模算例运行时间差异较大,为方便在不同规模中比较3种算法运行时间的差异,对tCPU做底数为10的对数处理,若不取对数,小规模算例的柱形很短,难以对比3种算法的运行时间差异。由于本文提出的MOEA/D-NG需要计算父代与邻域内个体的相似度值,因此在不同规模算例中,MOEA/D-NG的CPU时间较MOEA/D长约8.1%,较MOEA/D-DE长约16.1%。

3.2 资源分配算法性能比较与评价

将本文提出的基于DP的资源分配算法与其他广泛应用的算法进行对比,其中D2表示基于排序的资源分配算法,即根据每种资源分配情况的效用值高低进行排序,李斌等[8]采用该算法,D3表示基于搜索的资源分配算法,即利用随机搜索的方式迭代选择资源分配情况,陆志强等[7]采用该算法。将这几种资源分配算法进行比较,比较结果如表4所示。

表4  资源分配算法实验结果
Tab. 4  Experimental results of resource allocation algorithm
n×m算法编号PDHHV
AVGGAP/%AVGGAP/%AVGGAP/%
10×10 D1 485.1 -2.3 123 274.8 2.5 38 870.8 -3.6
D2 274.6 -44.7 173 836.4 44.5 30 361.4 -24.7
D3 496.3 0 120 301.2 0 40 324.4 0
10×15 D1 920.7 0 358 160.2 0 50 928.2 -0.5
D2 508.8 -44.7 485 318.8 35.5 35 611.2 -30.4
D3 867.5 -5.8 359 532.4 0.4 51 202.2 0
10×20 D1 1295.3 0 408 882.4 3.3 92 164.6 0
D2 1022.5 -21.1 614 352.2 55.2 81 941.6 -11.1
D3 1102.4 -14.9 395 832.5 0 91 546.5 -0.7
14×10 D1 458.0 0 139 338.2 0 55 782.6 0
D2 406.4 -11.3 170 537.2 22.4 41 620.2 -25.4
D3 432.4 -5.6 169 862.2 21.9 40 356.3 -27.7
14×15 D1 618.1 0 342 402.0 0 81 411.3 0
D2 565.4 -8.5 597 089.8 74.4 75 668.4 -7.1
D3 598.3 -3.2 576 323.6 68.3 79 653.2 -2.2
14×20 D1 836.8 0 525 743.4 0 62 188.2 0
D2 827.6 -1.1 636 842.2 21.1 53 127.7 -14.6
D3 836.7 0.0 645 632.7 22.8 51 237.8 -17.6
20×10 D1 450.9 -4.6 237 732.6 0 36 311.8 0
D2 472.7 0 338 412.5 42.4 32 451.6 -10.6
D3 402.3 -14.9 359 682.5 51.3 29 649.8 -18.3
20×15 D1 859.5 -13.3 434 772.4 0 118 492.8 0
D2 991.0 0 705 263.4 62.2 113 580.8 -4.1
D3 865.7 -12.6 735 893.4 69.3 108 932.6 -8.1
20×20 D1 851.2 0 511 553.2 0 60 348.2 0
D2 768.8 -9.7 733 876.4 43.5 51 430.6 -14.8
D3 782.4 -8.1 785 337.2 53.5 50 237.7 -16.8

n=10的小规模算例中,由于解空间有限性,基于搜索的算法D3表现最为出色,DP资源分配算法的综合性指标HV与D3差距在4%以内,性能接近;基于排序的算法D2性能最差。而在n=14n=20规模算例中,DP算法综合性能最佳,解空间的扩大导致基于搜索的算法D3性能下降,收敛性指标H相较于DP算法增加21.9%~69.3%,综合性指标HV相较DP算法下降2.2%~27.7%。在n=20规模算例中,基于搜索的算法D3在相同次数迭代下难以收敛,表现差于另外2种算法。为进一步衡量3种算法下资源培训的效率,定义有效培训占比π=(ηT-η0)/(ηF-η0),其中ηT表示目标资源效率值,η0表示资源初始效率值,ηF表示培训完成后资源实际效率值。选取3种算法在每个规模下其中一个算例的5次实验得到的5组非支配解,绘制有效培训占比箱型图如图8所示。

图8  各算法有效培训占比箱形图

Fig. 8  Box diagram of effective training proportion of each algorithm

DP算法具有良好的性能表现。其中在n=14n=20的算例中,DP算法的π均值高于排序算法和基于搜索的算法。在n=10的小规模算例中,虽然DP的π均值低于基于搜索的算法,但二者之间差距较小。通过箱形图的四分位范围分析可知,排序算法与DP算法的数据分布紧凑,而基于搜索的算法则呈现较大的数据分散程度,表明DP算法和排序算法在鲁棒性方面表现较为出色。

3.3 优先级分配和调度算法性能比较与评价

为研究本文所提出的优先级分配和调度算法性能,将TCC SGS记为S1,将Myszkowski

20提出的TG SGS记为S2,将没有使用U-K-Means聚类但使用了资源插空规则的TG SGS(TGC SGS)记为S3。通过测试,得到如表5所示的对比结果。

表5  优先级分配和调度算法实验结果
Tab. 5  Experimental results of priority allocation and scheduling algorithm
n×m算法编号PDHHVn×m算法编号PDHHV
AVGGAP/%AVGGAP/%AVGGAP/%AVGGAP/%AVGGAP/%AVGGAP/%
10×10 S1 485.1 0 123 274.8 0 38 870.8 0 14×20 S1 836.8 -5.0 525 743.4 0 62 188.2 0
S2 482.7 -0.5 124 733.2 1.2 38 583.4 -0.7 S2 880.4 0 558 999.2 6.3 58 066.3 -6.6
S3 475.6 -2.0 123 592.4 0.3 38 768.5 -0.3 S3 856.6 -2.7 540 782.3 2.9 59 867.6 -3.7
10×15 S1 920.7 0 358 160.2 0 50 928.2 0 20×10 S1 450.9 -0.3 137 732.6 0 38 311.8 0
S2 858.3 -6.8 363 272.2 1.4 48 432.6 -4.9 S2 420.8 -7.0 152 095.8 10.4 35 654.8 -6.9
S3 900.4 -2.2 362 880.5 1.3 49 556.6 -2.7 S3 452.3 0 147 602.3 7.2 36 254.7 -5.4
10×20 S1 1295.3 -4.2 408 882.4 0 92 164.6 0 20×15 S1 859.5 -4.3 434 772.4 0 12 0492.8 0
S2 1155.9 -14.5 420 194.8 2.8 87 444.2 -5.1 S2 898.2 0 454 155.3 4.5 11 4651.2 -4.8
S3 1352.6 0 410 211.1 0.3 90 356.7 -2.0 S3 834.5 -7.1 452 302.5 4.0 11 5234.2 -4.4
14×10 S1 458.0 -2.2 139 338.2 0 55 782.6 0 20×20 S1 851.2 -1.4 511 553.2 0 60 348.2 0
S2 468.4 0 145 983.2 4.8 53 408.8 -4.3 S2 821.6 -4.8 565 766.8 10.6 55 654.8 -7.8
S3 449.1 -4.1 142 576.8 2.3 54576.8 -2.2 S3 863.4 0 550 236.7 7.6 57 266.1 -5.1
14×15 S1 618.1 -6.6 342 402.0 0 81 411.3 0
S2 653.7 -1.2 350 852.4 2.5 78 920.2 -3.1
S3 661.7 0 348 954.8 1.9 79 216.3 -2.7

本文提出的TCC SGS在收敛性方面具有优越性,且随着算例规模的增大收敛性优势更加明显。在n=10规模的算例中,TCC SGS的H比TGC SGS降低0.2%~1.3%,而在n=14n=20规模的算例中,其H平均降幅则分别达到2.3%和6.3%。在综合性指标HV方面,在3个不同规模的算例中,TCC SGS比TGC SGS分别提高1.7%、2.9%和5.0%。TG SGS收敛性最差。由于作业完工时长与拖期成本直接相关,可以通过平均每个项目拖期成本在总成本占比研究调度算法对成本的优化效果。选取3种算法在每种规模其中一个算例的5次实验得到的5组非支配解,绘制平均项目拖期成本占比箱型图,如图9所示。

图9  各算法平均项目拖期成本占比箱形图

Fig. 9  Box plot showing the average project delay cost proportion for each algorithm

在所有9个算例中,TCC SGS均具有最好的性能表现,其均值和中位数在3个算法中均为最小,并且随着算例规模的增大,其优势更加显著。在n=10规模算例中,使用TCC SGS得到的结果平均项目拖期成本比使用TGC SGS和TG SGS分别降低2.9%和4.5%;在n=14规模算例中,降幅升至5.9%和8.3%;在n=20规模算例中,降幅为9.1%和14.5%,表明TCC SGS能够有效缩短作业时长。

4 结语

考虑生产线中的知识扩散现象,以最短化培训时长与最小化平均项目成本为目标,建立考虑团队学习效应的多技能资源受限项目调度模型。采用社交网络模型描述知识扩散,提出基于动态规划的资源技能分配算法与基于聚类的优先级分配和基于资源插空的调度计划生成机制,并将其嵌入基于小生境父代选择的MOEA/D-NG算法求解该问题。利用数值实验结果验证算法有效性。

本文仅考虑师徒一对一培训这一种知识扩散形式,后续还可以考虑离线培训、集体培训等其他形式。此外,还可以在一对一培训中,进一步根据被培训资源的效率值高低分配培训时长,提高识扩散效率。

作者贡献声明

陆志强:提出研究选题,设计研究思路和论文框架。

马新一:设计研究思路,完成实验设计并实施,分析数据,撰写论文。

参考文献

1

BISKUP D. Single-machine scheduling with learning considerations[J]. European Journal of Operational Research19991151): 173. [百度学术] 

2

CHEN J CCHEN Y YCHEN T Let al. Multi-project scheduling with multi-skilled workforce assignment considering uncertainty and learning effect for large-scale equipment manufacturer[J]. Computers & Industrial Engineering2022169108240. [百度学术] 

3

胡金昌刘紫薇马文凯.考虑学习效应的单人作业车间多目标调度算法[J].计算机集成制造系统2021275):1361. [百度学术] 

HU JinchangLIU ZiweiMA Wenkaiet al. Multi-objective scheduling algorithm for one worker job shop considering learning effect[J]. Computer Integrated Manufacturing Systems2021275): 1361. [百度学术] 

4

JEMMALI MHIDRI L. Bounding schemes for the parallel machine scheduling problem with DeJong's learning effect[J]. Journal of Parallel and Distributed Computing2021156101. [百度学术] 

5

HEUSER PTAUER B. Single-machine scheduling with product category-based learning and forgetting effects[J]. Omega2023115102786. [百度学术] 

6

ZHANG LDENG QLIN Ret al. A combinatorial evolutionary algorithm for unrelated parallel machine scheduling problem with sequence and machine-dependent setup times, limited worker resources and learning effect[J]. Expert Systems with Applications2021175114843. [百度学术] 

7

陆志强陈丞.考虑柔性资源技能进化的多项目组合调度问题[J].湖南大学学报(自然科学版)20214810):10. [百度学术] 

LU ZhiqiangCHEN Cheng. Multi-project portfolio scheduling problem considering skill evolution of flexible resource[J], Journal of Hunan University(Natural Sciences)20214810):10. [百度学术] 

8

李斌谢乃明.考虑团队交互学习效应的单工作组可中断任务调度模型[J].计算机集成制造系统2022281):161. [百度学术] 

LI BinXIE Naiming. Single workgroup interruptible task scheduling model considering team interactive learning effect[J]. Computer Integrated Manufacturing Systems2022281): 161. [百度学术] 

9

HOSSEINIAN A HBARADARAN VBASHIRI M. Modeling of the time-dependent multi-skilled RCPSP considering learning effect: An evolutionary solution approach[J]. Journal of Modelling in Management2019142): 521. [百度学术] 

10

李柏洲曾经纬董恒敏.实践社群知识扩散模型及仿真研究[J].运筹与管理2021301):130. [百度学术] 

LI BozhouZENG JingweiDONG Hengminet al. A model for knowledge diffusion in communities of practice and its simulation[J]. Operations Research and Management Science2021301): 130. [百度学术] 

11

余谦朱锐芳.多维邻近创新网络中知识扩散模型与仿真研究[J].情报科学2020385):65. [百度学术] 

YU QianZHU Ruifang. Knowledge Diffusion Model and Simulation in Multi-dimensional Proximity Innovation Network[J]. Information Science2020385): 65. [百度学术] 

12

LI NHUANG QGe Xet al. A review of the research progress of social network structure[J]. Complexity202120211. [百度学术] 

13

ZHENG WPAN HSUN C. A friendship-based altruistic incentive knowledge diffusion model in social networks[J]. Information Sciences2019491138. [百度学术] 

14

SONG LMA Y. Evaluating tacit knowledge diffusion with algebra matrix algorithm based social networks[J]. Applied Mathematics and Computation2022428127125. [百度学术] 

15

CREMONINI M. Introducing serendipity in a social network model of knowledge diffusion[J]. Chaos, Solitons & Fractals, 20169064. [百度学术] 

16

温跃杰李炤坤张泓翊.基于模型的人力资源管理系统工程:以某企业为例[J].系统工程学报2023382):225. [百度学术] 

WEN YuejieLI ZhaokunZHANG Hongyi. Model-based human resource systems engineering: an enterprise case example[J]. Journal of Systems Engineering2023382): 225. [百度学术] 

17

SHARMA G GSTOL K J. Exploring onboarding success, organizational fit, and turnover intention of software professionals[J]. Journal of Systems and Software2020159110442. [百度学术] 

18

CORREIA ILOURENCO L LSaldanha-da-Gama F. Project scheduling with flexible resources: formulation and inequalities[J]. OR Spectrum201234635. [百度学术] 

19

XU ELI YLIU Yet al. Energy saving scheduling strategy for job shop under TOU and tiered electricity price[J]. Alexandria Engineering Journal2022611): 459. [百度学术] 

20

MYSZKOWSKI P BLASZCZYK M. Diversity based selection for many-objective evolutionary optimisation problems with constraints[J]. Information Sciences2021546665. [百度学术] 

21

SINAGA K PYANG M S. Unsupervised K-means clustering algorithm[J]. IEEE Access2020880716. [百度学术] 

22

WANG HJIN YYAO X. Diversity assessment in many-objective optimization[J]. Cybernetics IEEE Transactions on2017476):1510. [百度学术] 

23

ZITZLER ETHIELE L. Multiobjective optimization using evolutionary algorithms—a comparative case study[C]//International conference on parallel problem solving from nature. BerlinSpringer Berlin Heidelberg1998292-301. [百度学术] 

24

KNOWLES JCORNE D. Properties of an adaptive archiving algorithm for storing nondominated vectors[J]. IEEE Transactions on Evolutionary Computation200372): 100. [百度学术]