基于多步回溯Q(λ)的PSS最优控制方法的研究.pdf

  • 文档大小:548.35 KB
  • 文档格式:pdf
  • 约 7页
  • 2021-06-20 发布
  • 举报
基于多步回溯Q(λ)的PSS最优控制方法的研究1 基于多步回溯Q(λ)的PSS最优控制方法的研究2 基于多步回溯Q(λ)的PSS最优控制方法的研究3 基于多步回溯Q(λ)的PSS最优控制方法的研究4 基于多步回溯Q(λ)的PSS最优控制方法的研究5 基于多步回溯Q(λ)的PSS最优控制方法的研究6 基于多步回溯Q(λ)的PSS最优控制方法的研究7
已阅读完毕,您还可以下载文档进行保存
文档单价:6.00 会员免费
开通会员可免费下载任意文档
  1. 1、本文档共7页,内容下载后可编辑。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
第39卷第3期2011年2月1日电力系统保护与控制PowerSystemProtectionandControlV_01.39No.3Feb.1,2011基于多步回溯Q(九)的PSS最优控制方法的研究余涛,甄卫国(华南理工大学电力学院,广东广州510640)摘要:电力系统稳定器(PSS)是用来产生能抑制低频电力系统振荡的励磁系统辅助控制信号,具备自学习和参数在线整定能力是未来智能电网PSS控制器的一个发展趋势。提出一种基于多步回溯Q(九)学习的新颖电力系统稳定器设计方法。利用多步回溯Q("控制器代替整个传统PSS作为励磁附加控制,并与传统PSS和Q学习控制器进行比较。仿真研究显示,引入基于多步回溯Q(学习的PSS控制后显著增强了整个系统的鲁棒性,有效提高了系统抑制低频电力系统振荡的能力,较好地解决了O学习控制器收敛速度慢的问题。关键词:电力系统稳定器(PSS);马尔可夫策略(MDP);强化学习;Q学习;多步回溯O()学习OptimalcontrolmethodofPSSbasedonmulti・stepbacktrackQ(learning—YUTao,ZHENWeiguo(CollegeofElectricPower,SouthChinaUniversityofTechnology,Guangzhou510640,China)Abstract:Powersystemstabilizers(PSS)areusedtogeneratesupplementarycontrolsignalsfortheexcitationsysteminordertodampthelowfrequencypowersystemoscillations.Withthedevelopmentofsmartgrids,themultiplyPSScontrollerswiththeabilitiesofself-learningandself-tuningbecometheattractivetrend.Anovelcontrolmethodofpowersystemstabilizer(PSS)based—onmulti-stepbacktrackQ()learningisproposedinthispaper.ThemultistepbacktrackQ(九)controllerisusedtoreplacetheconventionalPSStogeneratesupplementarycontrolsignalsfortheexcitationsystem,andiscomparedwiththeconventionalPSSand—Qlearningcontroller.ResultsshowthattheQ(九)controllerstrengthenstherobustnessofthepowersystemandenhancestheabilityofdampingthelowfrequencypowersystemoscillations.Besides,itcansolvetheproblemoftheslowconvergencerateofQ-learningcontroller.ThisworkissupportedbyNationalNaturalScienceFoundationofChina(No.50807016)andNaturalScienceFound ̄ionofGuangdongProvince(No.9151064101000049).——Keywords:powersystemstabilizer(PSS):Markovdecisionprocess(MDP);reinforcementlearning;Qlearning;multistepbacktrackQ()learning中图分类号:TM712文献标识码:A———文章编号:16743415(2011)030018060引言强化学习L1J(ReinforcementLearning,RL),又称再励学习、评价学习,既可看作是人工智能领域中一种重要的机器学习方法,也被认为是属于马尔可夫决策过程J(MarkovDecisionProcess,MDP)和动态优化方法的一个独立分支。RL方法基本思想是一个学习系统与其环境的反复交互作用,仅从所在环境中自身经历产生反馈的信息来学会执行一个任务并不断地对系统性能进基金项目:国家自然科学基金项目(508O7016);广东省自然科学基金项目(9151064101000049);中央高校基本科研业务费专项资金资助行自我改进。RL具有强大的在线自学习能力,易于进行动态并行计算,且算法对研究对象的数学模型不敏感。电力系统是一个复杂的动态大系统,由于电力系统具有复杂的非线性和不确定性,传统方法是采用系统辨识或工程经验的途径,其应用效果往往受到实际环境的限制,而RL可以把控制系统的性能指标要求转化为一种评价指标,智能体(Agent)通过奖励和惩罚进行学习。笔者在文献[3]中综合介绍了RL理论在电力系统中的应用研究现状,并探讨了该课题在电力系统运行控制中的巨大潜力。目前广泛使用的传统电力系统稳定器(CPSS)的设计是建立在频域的相位补偿理论【4】,作为一种余涛,等基于多步回溯Q()的PSS最优控制方法的研究一19-转速或功率的相位滞后补偿。CPSS的参数是基于线性模型的电力系统。为了使到CPSS在很宽的范围内能提供良好的阻尼作用,它的参数需要被微调来适应两种类型的振荡。因为电力系统是高度非线性系统,它的结构和参数都是随着时间的变化而变化的。基于线性化模型的电力系统的CPSS是不能保证它在实际运行环境中的控制性能。因此,研究适应电力系统复杂运行状态变化的自适应PSS一直是此领域研究的重点。为了改善CPSS的性能,许多智能化优化技术已经提出,例如:智能优化方法【6{J(如:模拟退火算法、遗传算法),模糊逻辑们、神经网络【llJ和许多其他的非线性控制技术。智能优化算法是在离线的情况下通过优化一个特征值来优化CPSS的参数。因为这些方法是建立在线性模型上,而且它们的参数是不能在线改变的。因此,它们在实际运行中缺乏令人满意的性能。众所周知,基于规则的模糊逻辑控制是很难取得和调整它的参数的,特别是在线的情况下。Q学习算法是无需环境模型的一种目前国际上最为广泛应用的RL算法,它可以被认为是异步动态规划的一种方法。它提供Agent在马尔科夫环境中,利用经历的动作序列执行最优动作的一种学习能力。笔者在文献[121中详细分析了CPSS的局限性和现代控制算法的非在线性,并在文中提出了基于O学习算法的新型电力系统稳定器设计方法,提高了系统抑制低频振荡的能力。但基于单步Q学习算法的PSS需要较长的时间来搜索到最优动作。而本文引入具备多步回溯能力的Q(学习,该在线回溯算法显式地利用资格迹对将来多步决策的在线强化信息进行高效地回溯操作,能够有效地解决上述问题,提高算法收敛速度。1多步回溯0(学习算法多步Q(学习(Multi.stepQ( ̄,)leaming)L1刮是基于离散马尔可夫决策过程的经典O学习【lJ结合了TD(九)算法5J多步回报的思想。Q(值函数的回溯更新规则利用资格迹来获取算法行为的频度和渐新度两种启发信息,从而考虑了未来控制决策的影响。资格迹J用于解决延时强化学习的时间信度分配问题,第k步迭代时刻的矩阵形式即ek(s,口),是对过去所访问状态与动作信息的一种临时记录。对任何状态一动作对而言,资格迹都将以时效性按指数衰减,一旦执行非贪婪探索动作时,迹则可以复位设置为零。资格迹更新公式定义为:){0其I_】,)_1(,at)=n1ax一1(,口))‘+其f也(2)式中:是迹特征函数;0<1,为折扣因子;为迹衰退系数。Q(充分考虑了随机过程的时间回溯因素,一回报算法将值函数与资格迹相互融合,如图1,其“”后向估计将时间信度和值函数误差对所经历的“”状态流进行合理回溯分配,对于非马氏环境具有很好的适应性【】6J。现在“”图1o()方法后向估计回溯学习更新图Fig.1Q( ̄)backtracklearningofbackwardestimation来“”资格迹回报算法的后向估计机理提供了一个逼近最优值函数Q的渐进机制,而这类对所有状态一动作对Q值的高效持续更新是以提高算法复杂度和增加计算量为代价的。设代表Q估计值的第k次迭代值,Q(九)学习迭代更新公式为:=’R(sk,sk+laD+ymsx’,(sk+1,口)一(,)(3)a+1(,a)=(s,a)+Ot6kek(s,a)(4)式中:0<a<l,称为学习因子;R(,S,a)是第k步迭代时刻环境由状态S经动作转移到1后的奖励函数值;,口)代表s状态下执行动作a的Q值函数,其实现方式均采用lookup查表法。文中多步Q(九)学习中动作选择策略则通常采用由概率矢量法派生的追踪算法或boltzmann分布法【J。2基于Q(九)学习的PSS最优控制原理2.1励磁附加控制结构一旦系统出现低频振荡,可通过减少线路输送容量,改用常规励磁调节器等来处理,但是这两者都不利于经济性和大扰动下的暂态稳定。而在励磁系统中引入附加控制信号解决了以上的问题。传统△PSS以Aw、Pe或两者的组合作为输入信号,通过放大环节、复位环节、相位补偿环节、限幅环节后作为励磁附加信号。传统PSS各参数的整定是根据.20.电力系统保护与控制经典控制理论在某一特定的振荡模式下得出,无法保证在各种扰动下都能较好地抑制低频振荡。如图2所示,本文基于多步Q(九)学习算法,以Q(控制器代替整个的传统PSS,其输出作为励磁附加控制信号。在不同扰动下,Q(九)控制器通过试错学习在系统不同状态下,搜索出最佳的附加控制信号,而不需类似传统PSS那样设定各参数值。Q)控制器具有更强的适应性。图2基于多步回溯Q(柚学习的PSS传递函数框图Fig.2StructureofPSStransferfunctionbasedonmulti・stepQ()Oleaming2.2多步回溯Q(M学习的优化控制算法设计励磁系统的附加信号主要用来抑制低频振荡,为了防止它在某些特殊情况下,造成发电机电压过大的变化,需要限制该附加信号,使其对定子电压幅值的改变在某个限定范围内。本文取附加控制信号的范围为-0.15-0.15之间(归一化后的标么值),通过对该范围进行离散化,得出该优化控制算法的动作集为[-0.15:0.01:O.151,则动作集被量化为31个动作。为了能反映系统受低频振荡的影响程度,本文选取Aw作为状态值。对Aw状态空间进行分区,∞仿真比较显示,将Aw划分为(+,0.002),(0.002,0.001),【0.001,0】,(0,一0.002),(-0.002,~0.004),∞卜0.004,一)较为合适,则一维输入空间被量化为6个不同状态。电力系统稳定器的目的就是抑制系统中有功功率、频率等量的振荡,使其保持正常值。通常,对于电力系统稳定器的控制目标可描述为使系统输出误差最小,误差为有功功率、转子角频率以及发电机端电压与它们各自正常值的相对误差绝对值之和。基于多步Q(九)学习的控制系统通过试错与环境进行交互式学习,从长期的观点构造控制策略,以期从环境获得的长期积累奖励值最大,而将系统输出误差取负值作为多步QOQ学习的奖励值,则长期以来,系统输出误差越小,它的长期积累奖励值最大,这与电力系统稳定器的控制目标相符,因此,将系统输出误差取负值作为多步QO0学习的奖励函数很恰当合理。多步Q(九)学习的奖励函数Reward表示为:=一△f。(PIPf+KI,awl+KvIAv1)d,(5)式中:尼为每次迭代步所得到的奖励值;AP为机械功率和电磁功率的差值;Aw为发电机转速偏差;AV为发电机机端电压偏差;Kp、Kw、Kv为权值系数。多步回溯Q(九)学习算法中的、分别为折扣因子、迹衰退系数和学习因子。a指明了要给改善的更新部分多少信任度,较大的a值会加快学习算法的收敛速度,而较小的值能保证控制器的搜索空间,从而提高学习收敛的稳定性。它们的取值影响着算法的收敛性。通过仿真比较,本文取值为0.9、2=0.9、5=0.5。在确定了控制动作集、状态集和奖励函数后,即可进行多步Q(九)学习控制器在线自学习和动态优化,其步骤如下:对所有(,口),初始化各参数及当前状态S。,令k=O;Repeatforever1)由动作概率分布法选择并执行调度动作a;2)观察下一时刻的状态斛】,即CPS1/CPS2滚动指标;3)由式(5)得N-个奖励信号(;4)根据式(3)计算值函数误差;5)更新资格迹,令e(s,a)e(sk,+1;6)式(4)更新Q值函数表格:7)Ifak+1为贪婪动作Thene(s,a)+--e(,)Elsee(s,)0;8)1,返回步骤1);End3仿真算例研究为评价多步回溯Q(控制器的鲁棒性和收敛性,本文以典型的四机两区域互联系统电力系统稳定器控制模型作为研究对象(如图3所示),对基于多步回溯Q(九)学习的控制器、基于Q学习的控制器[他]、传统PSS的性能进行仿真比较。这些比较是III扰动1:置I)(lPss控制器l7l相短路故障1\、—。—6IIlIII9一—r_1IIh扰动2:改变:@线路阻抗・-----l一24-+-o:(兰)G}一一一一一一一一一一一一一一-’一一一一一一一_-一一一一一一.-..__一一一一一一一一一一..一一._●图3Kundur四机两区互联系统框图’—Fig.3Kundursfour-machinetwoareatestsystem余涛,等基于多步回溯Q()的PSS最优控制方法的研究-21一在各种不同类型的操作条件和干扰下进行的。这些扰动是:在区域联络线路上发生三相短路,改变输电线路的阻抗。故障位置和类型如图3所示。图4给出了传统PSS(CPSS)Ll,J的传递函数框图,该CPSS由低i高通滤波器、放大环节、超前一滞后环节和限幅环节构成,CPSS中各参数设置值见表1。图4传统PSS传递函数框图Fig.4TransferfunctiondiagramofconventionalPSS表1传统PSS参数值Tlab.1ParametersofconventionalPSS‰1乃乃550e.3s20e3s3S54S3.1Q)与Q学习算法在两种扰动下的收敛性比较Q(九)学习控制器与Q学习控制器在最优策略学习的初始阶段动作的选取会有很强的随机性,这样会造成系统的不稳定,甚至使系统中各发电机的功角差超过180。而造成失步。因此,算法在投入实际运行之前要经历离线的预学习过程。经过仿真测试,设置式(5)中各权值系数后,表2给出了Q(学习控制器和Q学习控制器的平均收敛时间。图5和图6给出了Q(九)学习控制器和Q学习控制器的附加控制信号输出值在三相短路扰动下的预学习收敛典型曲线图。由表2、图5和图6可见,在两种扰动下,Q()控制器的收敛时间都优于Q学习控制器。Q(控制器在鲁棒性和收敛性上都优于Q学习控制器。表2不同故障情况下算法收敛性比较Tab.2ConvergencetimeofQ(L)leaningalgorithmcompared—withQlearning图5Q(九)学习控制器输出值Fig.5OutputofQ(九)learningcontroller∥图6Q学习控制器输出值—Fig.6OutputofQlearningcontroller3.2权值系数、、的影响式(5)中奖励函数的选取引入了线性最优二次型调节器(LQR)的思想,奖励函数为对象状态和控制输入的二次型函数。权值系数、、Kv的选值对收敛结果影响较大,表3给出了Q(九)控制器学习过程中所选取的权值,并比较了各权值对收敛结果的影响。.表3权值系数、Kw、KvTab.3ValueofKp,andKw,andKv表3中Kv选取了不同的值,这表示了对电压偏差值进行了不同程度的考虑,值越大,表示越对电压偏差的关注程度越大,反之越小就是关注程度越小。图7和图8分别给出了在线路发生短路故障的情况下,不同的权值取值下Q(学习控制器的控制效果曲线图。由图中可知,取不同的权值会影响Q(九)学习控制器的控制效果。在预学习中,需对各权值进行优化,以得到最优的控制效果。比较图7和图8中各曲线,情况1所得到的控制效果优于另两种。本文选取情况1的权值系数所得的优化结一22-电力系统保护与控制果与Q学习控制器、传统PSS进行比较。性能最优。s图7发电机1与发电机4的功角差曲线Fig.7PowerangledifferenceofG1withG4t/s图8区域1到区域2的有功功率值Fig.8Activepowerfromarea1toarea23.3区域联络线路上发生三相短路如图3所示,在区域联络线路中点处发生瞬时三相短路故障,短路持续时间为0.1S,0.1S后短路故障消失。以}}4发电机作为参考发电机,图9给出的是发电机1与发电机4的功角差曲线。分析图中曲线可知,三种控制器均能有效抑制系统的低频振荡,其中Q()学习控制器具有最优的控制性能,其振荡调节时间和超调量均优于O学习控制器和传统PSS。媛嚣f,s图9发电机1与发电机4的功角差曲线Fig.9PowerangledifferenceofG1withG4图10给出的是区域1向区域2传输的有功功率曲线。比较图中曲线可知,Q(九)学习控制器控制下的区域交换有功功率值振荡幅度最小,传统PSS与Q学习控制器的性能相近,Q(九)学习控制器的控制图10区域1到区域2的有功功率值Fig.10Activepowerfromarea1toarea23.4改变线路阻抗值为了测试所提出的Q(控制器对电网参数变化的鲁棒性,为本文通过在一回区域联络线路上设置断路器来模拟输电线阻抗的突变,如图3所示。通过断路器的开断,输电线路阻抗在开断前后相差2倍。令系统处于稳态后0S时阻抗变为初始值的2倍,10S时阻抗恢复到初始值。图11和图12分别给出了功角差曲线和区域联络线路传输的有功功率曲线。由图11可知,Q学习控制器的控制效果要优于传统PSS。而Q学习控制器与Q(九)控制器的控制效果相近。由图12可知,O(控制器对于区域交换功率的抑制优于其他两个控制器。图11发电机1与发电机4的功角差曲线Fig.11PowerangledifferenceofG1withG4s图12区域1到区域2的有功功率值Fig.12Activepowerfromarea1toarea2余涛,等基于多步回溯Q()的PSS最优控制方法的研究-23-综合以上仿真结果,三种控制器均能有效抑制系统的低频振荡,而Q(学习控制器在各种故障下具有更好的鲁棒性。同时,该扰动也表明了在连续扰动中Q(和Q学习算法具有在线学习、更新动作策略的能力,而Q(九)学习可以利用资格迹进行多步回溯,更好地利用经验,因此表现出更突出的抑制效果。4结语尽管传统PSS在整定良好的情况下也具有优良的控制性能,但其最大的问题是缺乏在线自学习和白整定能力,在电网渐变的过程中,缺乏参数自整定的一类PSS是无法满足未来智能电网的高度智能化和适应性要求。本文介绍了一种基于多步回溯O(学习属于一类半马氏决策过程的新型方法,据作者知识范围,多步回溯Q(学习尚未在国内外电力控制领域有文献正式发表。通过对仿真结果进行分析,可以得出以下结论:(1)Q(九)算法是一种模型无关的算法,它不像监督学习方法,它不依赖于某一种特定的模型进行学习,不像传统PSS那样需要整定参数。仿真结果表明,Q(算法在系统受扰动后减少振荡的超调量和调节时间,具有更优的抑制效果。(2)Q(算法具有在线回溯算法显式地利用资格迹对将来多步决策的在线强化信息进行高效地回溯操作,仿真结果表明Q(九)学习算法收敛速度要优于Q学习算法。(3)Q(九)算法具有在线学习、更新动作策略的能力,能适用连续扰动后环境的变化。通过预学习后,然后在线继续进行交互式学习,以此在线适应工况的变化。在后续的工作中,对于多机复杂系统,分布式强化学习的引入可有助于多机PSS的优化,将各PSS视为学习的学习单元,每个单元独立地执行部分或者全部的任务,达到整个系统意义上的学习目标。另外,可以结合其他离线优化方法,利用经验回放、输入空间量化等方法提高学习速度。参考文献[1]Su ̄onRS,BartoAG.Reinforcementlearning:anintroduction[J1.Cambridge--MITPress,1998.[2]MineH,OsakiS.Markovdecisionprocesses[M1.NewYork:Eisevier,1970.[3]余涛,周斌,甄卫国.强化学习理论在电力系统中的应用及展望[J】.电力系统保护与控制,2009,37(14):122.128.YUTao,ZHOUBin,ZHENWei-guo.Applicationanddevelopmentofreinforcementlearningtheoryinpowersystems[J].PowerSystemProtectionandControl,2009,—37(14):122128.[4]刘取.电力系统稳定性及发电机励磁控¥1J[M1.北京:中国电力出版社,2007.[5]倪以信,陈寿孙,张宝霖.动态电力系统的理论和分析[M】.北京:清华大学出版社,2008:264.291.[6]AbidoMA.Robustdesignofmulti.machinepowersystemstabilizersusingsimulatedannealing[J】.IEEETransactiononEnergyConversion,2000:297-304.[7]文劲字,王国兴,程时杰,等.用遗传算法设计模糊式电力系统稳定器[J】.电力系统自动化,1999,23(4):22.24.—WENJinyu,WANGGuo-xing,CHENGShi-jie,eta1.Adesignoffuzzypowersystemstabilizerusinggeneticalgorithm[J】.AutomationofElectricPowerSystems,—1999,23(4):2224.[8]刘杨名,严正,胥国毅.免疫遗传算法在多机电力系统PSS系统优化中的运用[J].电力系统保护与控制,2007,35(7):19-23,45.—LIUYangming,YANZheng,XUGuoyi.Parameteroptimizationofpowersystemstabilizersusingimmune—geneticalgorithminmultimachinesystem[J].PowerSystemProtectionandControl,2007,35(7):19-23,45.[9]赵书强,丁峰,侯子利,等.自寻优模糊电力系统稳定器的设计[J】.电工技术学报,2004,19(3):94-98.ZHAOShu-qiang,DINGFeng,HOUZi-li,eta1.Designofself-optimizingfuzzypowersystemstabilizer[J].TransactionsofChinaElectrotechnicalSociety,2004,19(3):94-98.[1O]王明东,刘宪林,于继来.基于改进遗传算法的发电机调速器侧模糊PSS优化设计[J]J.继电器,2006,34(13):25-28.——WANGMingdong,LIUXianlin,YUJi-lai.OptimizationdesignoffuzzyPSSforgovernorofgeneratorbasedonanimprovedGA[J】.Relay,2006,34(13):25-28.[11]梁有伟,胡志坚,陈允平.基于神经网络逆系统的电力系统稳定器的研究[J】.电工技术学报,2004,19(5):61-65.14.LIANGYou-wei,HUZhi-jian,CHENYun-ping.Apowersystemstabilizerbasedonneuralnetworkinversesystem[J】.TransationsofChinaElectrotechnical—Society,2004,19(5):6165,14.[12]YUTao,ZHENWei-guo.Areinforcementlearningapproachtopowersystemstabilizer[C】.//Power&’EnergySocietyGeneralMeeting,PES09.IEEE.2009:—15.[13]JingPeng,WilliamsRJ.Incrementalmulti-stepQ-learning[J】.MachineLeaning,1996,22:283-290.(下转第28页continuedonpage28)一28一电力系统保护与控制障或出口处反方向故障时,该线路纵联零序方向保护不受零序互感的影响,能够正确动作;对于其相邻线路来说电气联系越紧密,零序方向元件误动的可能性越小;反之,误动可能性越大。因此,应综合考虑相邻互感线路纵联零序方向保护的配置们,增加必要的防范措施,确保电网稳定运行。参考文献[1]李一泉,焦邵麟,张弛,等.平行线路纵联零序方向保护安全性分析[J】.电力系统自动化,2008,32(6):104一l07.—LIYi-quan,JIAOShaolin,ZHANGChi,eta1.Safetyanalysisonpilotzerosequencedirectionrelayappliedinparallellines[J].AutomationofElectricPower—Systems,2008,32(6):104107.[2]郭润生,何彩红,郅建杰.相邻线路零序互感对线路零序纵联方向保护的影响『J].继电器,2004,32(9):71.73.——GUORunsheng,HECaihong,ZHIJian-jie.Inf—luenceofzerosequencemutualinductancetopilotprotectioninparallellines[J].Relay,2004,32(9):—7173.[3]康小宁,梁振锋,索南加乐.相邻线路零序互感对Ⅲ平行双回线电流平衡保护的影响及改进措施.继—电器,2005,33(20):69.—KANGXiao-ning,LIANGZhenfeng,SUONANJia・le.Influenceofzero-sequencemutualinductancetotransversedifferentialcurrentprotectionandapproachestotheimprovedmeasures[J].Relay,2005,33(20):6-9.[4]曾耿晖,黄明辉,刘之尧,等.同杆线路纵联零序保护误动分析及措施[J].电力系统自动化,2006,30(20):103.1O7.ZENGGeng-hui,HUANGMing・hui,LIUZhi・yao,eta1.Analysisandcountermeasuresofmisoperationofzerosequencepilotprotectiononcircuitlinesofsamepole[J1.AutomationofElectricPowerSystems,2006,30(20):103107.[5]胡宁,郑罡,胡志坚.基于积分方程的互感线路参数带电测量研究[J】.继电器,2005,33(16):22-25.HUNing,ZHENGGang,HUZhi-jian.Studyoflive[6][7][8][9][10]linemeasurementofparametersoftransmissionlineswithmutualinductancebasedonintegralequations[J].Relay,2005,33fl6):22.25.李钢,冯辰虎,孙集伟,等.平行运行线路互感对纵联零序方向保护的影响【J].华北电力技术,2007,12:1.4.LIGang.FENGChen.hu,SUNJi.wei。eta1.Effectsofmutualinductanceofparalleltransmissionlineson—longitudinalzerosequenceprotection[J].NorthChinaElectricPower,2007,l2:1.4.朱景富.零序互感对线路接地距离保护的影响分析lJ】.电力系统保护与控制,2009,37(9):l13.115.——ZHUJingfu.Zerosequencemutualinductanceonthegrounddistanceelementsimpactanalysis[J].PowerSystemProtectionandContro1.2009.37(9):113.115.高中德,舒治淮,王德林.国家电网公司继电保护Ⅲ培训『教材.北京:中国电力出版社,2009.樊占峰,叶东印,李瑞生,等.平行线弱电强磁模型下零序方向元件改进fJ1.电力系统自动化,2008,—32(17):100103.——FANZhanfeng,YEDongyin,LIRui・sheng,eta1.Improvementofzero.sequencedirectionalrelayfortheparallellinewithmagneticallystrongandelectricallyweakconnection[J].AutomationofElectricPowerSystems,2008,32(17):lO0.103.丁晓兵,赵曼勇,徐振宇.接地故障零序方向元件拒动保护改进方案[J].电力系统自动化,2006,30(9):88.90.——DINGXiaobing,ZHAOManyong,XUZhen-yu.—Improvementonzerosequencecurrentprotectionwhendirectionalelementfailstooperateduringearthfaults[J].AutomationofElectricPowerSystems,2006,30(9):88.90.收稿日期:2010-03-01;—修回日期:201O-0506作者简介:吴麟琳(1982一),女,博士研究生,研究方向为电力系—统继电保护;Email:aileenwu500@163.corn黄少锋(1958-),男,教授,博士生导师,研究方向为电力系统继电保护。(上接第23页continuedfrompage23)—[14]WatkinsJCH,DayanPeter.QlearningfJ】.Machine—Leaning,1992,8:279292.[15]张汝波.强化学习理论及应用[M】程大学出版社,2001:69.100.[16][17]哈尔滨:哈尔滨工SuttonRS,BartoAG.Reinforcementlearning:an—introduction[M】.Cambridge:MITPress,1998:87160.KundurP.Powersystemstabilityandcontrol[M].MeGraw-Hill,1994.收稿日期:2010-02-25;—修回日期:201O-0610作者简介:余涛(1974-),男,副教授,博士,主要研究方向为复杂电力系统的非线性控制理论和仿真研究;E.mail:taoyul@scut.edu.Crl甄卫国(1985-),男,硕士研究生,主要研究方向为电—力系统稳定运行与控制。Email:zwgll16@126.tom
一夕落阳
该用户很懒,什么也没介绍
文档单价:6.00 会员免费
开通会员可免费下载任意文档