风电场输出功率异常数据识别与重构方法研究.pdf

下载文档

文档大小：622.12 KB
文档格式：pdf
约 8页
2021-06-10 发布
举报

已阅读完毕，您还可以下载文档进行保存

下载文档

文档单价：￥6.00 会员免费

开通会员可免费下载任意文档

会员免费下载以6.00元购买此文档

1、本文档共8页，内容下载后可编辑。
2、本文档内容版权归属内容提供方，所产生的收益全部归内容提供方所有。如果您对本文有版权争议，可选择认领。
3、本文档由用户上传，本站不保证质量和数量令人满意，可能有诸多瑕疵，付费之前，请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形，可联系本站下载客服投诉处理。

第４３卷第３期２０１５年２月１日电力系统保护与控制ＰｏｗｅｒＳｙｓｔｅｍＰｒｏｔｅｃｔｉｏｎａｎｄＣｏｎｔｒｏｌ、ｂＩ．４３ＮＯ．３Ｆｅｂ．１，２０１５风电场输出功率异常数据识别与重构方法研究朱倩雯，叶林，赵永宁，郎燕生，宋旭日（１．中国农业大学信息与电气工程学院，北京１０００８３；２．中国电力科学研究院，北京１００１９２）摘要：电力大数据是电力发展的重要资源，数据来源于电力生产和电能使用的各个环节。风电运行数据是电力大数据的重要组成部分，随着风电穿透功率的增大，风电数据的采集、处理、分析对风电场运行、控制与并网研究有重要意义。然而，从风电场收集到的大量数据中通常包含异常数据点，这样的异常点给风电功率波动特性、风电功率预测等方面研究带来负面影响。分析了风电场历史运行数据中存在的异常数据的主要来源，并针对该实际问题，采用基于四分位算法的数学模型对异常数据进行识别。在数据缺失的情况下，以可用历史数据为基础，采用基于临近风电场出力模式性的方法和多点三次样条插值方法重构出完整的时间序列。算例分析给出了两种重构方法的重构效果以及各自的适应性，结果表明采用所提出的方法能够有效识别、剔除异常数据并重构缺失数据，对不同风电场有较强的通用性，具有一定的工程实用价值。关键词：风电场；风电运行数据；电力大数据；异常数据；重构ＭｅｔｈｏｄｓｆｏｒｅｌｉｍｉｎａｔｉｏｎａｎｄｒｅｃｏｎｓｔｒｕｃｔｉｏｎｏｆａｂｎｏｒｍａｌｐｏｗｅｒｄａｔａｉｎｗｉｎｄｆａｒｍｓＺＨＵＱｉａｎｗｅｎ，ＹＥＬｉｎ，ＺＨＡＯＹｏｎｇｎｉｎｇ。，ＬＡＮＧＹａｎｓｈｅｎｇ，ＳＯＮＧＸｕｒｉ（１．ＣｏｌｌｅｇｅｏｆｌｎｆｏｒｍａｆｉｏｎａｎｄＥｌｅｃｔｒｉｃａｌＥｎｇｉｎｅｅｒｉｎｇ，ＣｈｉｎａＡｇｒｉｃｕｌｔｕｒａｌＵｎｉｖｅｒｓｉｔｙ，Ｂｅｉｊｉｎｇ１０００８３，Ｃｈｉｎａ；２．ＣｈｉｎａＥｌｅｃｔｒｉｃＰｏｗｅｒＲｅｓｅａｒｃｈＩｎｓｔｉｔｕｔｅ，Ｂｅｉｊｉｎｇ１００１９２，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｅｌｅｃｔｒｉｃｐｏｗｅｒｂｉｇｄａｔａｉｓａｎｉｍｐｏｒｔａｎｔｒｅｓｏｕｒｃｅｆｏｒｅｌｅｃｔｒｉｃｐｏｗｅｒｄｅｖｅｌｏｐｍｅｎｔａｎｄｃｏｍｅｓｆｒｏｍｔｈｅｐｒｏｃｅｄｕｒｅｓｏｆｅｌｅｃｔｒｉｃｉｔｙｐｒｏｄｕｃｔｉｏｎａｎｄｅｎｅｒｇｙｕｔｉｌｉｚａｔｉｏｎ．Ｗｉｎｄｐｏｗｅｒｏｐｅｒａｔｉｎｇｄａｔａｉｓｔｈｅｍａｊｏｒｐａｒｔｏｆｅｌｅｃｔｒｉｃｐｏｗｅｒｂｉｇｄａｔａ．Ｗｉｔｈｔｈｅｄｒａｍａｔｉｃｉｎｃｒｅａｓｅｏｆｗｉｎｄｐｏｗｅｒｐｅｎｅｔｒａｔｉｏｎ，ｉｔｉｓｏｆｇｒｅａｔｓｉｇｎｉｆｉｃａｎｃｅｆｏｒｗｉｎｄｆａｒｍｏｐｅｒａｔｉｏｎ，ｃｏｎｔｒｏｌａｎｄｉｎｔｅｇｒａｔｉｏｎｒｅｓｅａｒｃｈｂｙｃｏｌｌｅｃｔｉｏｎ，ｐｒｏｃｅｓｓｉｎｇａｎｄａｎａｌｙｓｉｓｏｆｒｅａｌｈｉｓｔｏｒｉｃａｌｏｐｅｒａｔｉｎｇｄａｔａｆｒｏｍｗｉｎｄｆａｒｍｓ．Ｈｏｗｅｖｅｒ，ａｍｏｕｎｔｓｏｆｄａｔａｃｏｌｌｅｃｔｅｄｆｒｏｍｗｉｎｄｆａｒｍｓｕｓｕａｌｌｙｃｏｎｔａｉｎａｂｎｏｒｍａｌｄａｔａ，ｗｈｉｃｈｈａｖｅａｄｖｅｒｓｅｉｍｐａｃｔｏｎｔｈｅｓｔｕｄｙｏｆｆｌｕｃｔｕａｔｉｏｎｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｗｉｎｄｐｏｗｅｒ，ｗｉｎｄｐｏｗｅｒｐｒｅｄｉｃｔｉｏｎ．ｅｔｃ．Ｔｈｅｍａｉｎｓｏｕｒｃｅｏｆａｂｎｏｒｍａｌｄａｔａｅｘｉｓｔｅｄｉｎｗｉｎｄｆａｒｍｈｉｓｔｏｒｉｃａｌｏｐｅｒａｔｉｏｎｄａｔａｉｓａｎａｌｙｚｅｄａｎｄａｍｏｄｅｌｆｏｒｅｌｉｍｉｎａｔｉｎｇａｂｎｏｒｍａｌｄａｔａｂａｓｅｄｏｎｑｕａｒｔｉｌｅｍｅｔｈｏｄｉｓｐｒｅｓｅｎｔｅｄ．Ｉｎｔｈｅｃａｓｅｓｏｆｍｉｓｓｉｎｇｄａｔａ，ｍｅｔｈｏｄｓｂａｓｅｄｏｎｐａｔｔｅｒｎｓｏｆｓｉｍｉｌａｒｉｔｙｂｅｔｗｅｅｎｎｅｉｇｈｂｏｒｉｎｇｗｉｎｄｆａｒｍｓｏｕｔｐｕｔｓａｎｄｍｕｌｔｉ－ｐｏｉｎｔｃｕｂｉｃｓｐｌｉｎｅａｒｅｕｓｅｄｏｎｔｈｅｂａｓｉｓｏｆｈｉｓｔｏｒｉｃａｌｄａｔａｔｏｒｅｃｏｎｓｔｒｕｃｔｔｈｅｄｉｓｃｏｎｔｉｎｕｏｕｓｔｉｍｅｓｅｒｉｅｓｒｅｓｐｅｃｔｉｖｅｌｙ．Ｔｈｅｃａｓｅｓｔｕｄｙｉｎｄｉｃａｔｅｓｔｈａｔｔｈｅｐｒｅｓｅｎｔｅｄｍｏｄｅｌｓａｒｅｅｆｆｉｃｉｅｎｔｆｏｒｅｌｉｍｉｎａｔｉｎｇａｂｎｏｒｍａｌｄａｔａａｎｄｒｅｃｏｎｓｔｒｕｃｔｉｎｇｍｉｓｓｉｎｇｄａｔａ，ｗｈｉｃｈｃａｎｂｅａｐｐｌｉｅｄｉｎｐｒａｃｔｉｃａｌｅｎｇｉｎｅｅｒｉｎｇ．ＴｈｉｓｗｏｒｋｉｓｓｕｐｐｏｒｔｅｄｂｙＮａｔｉｏｎａｌＮａｔｕｒａｌＳｃｉｅｎｃｅＦｏｕｎｄａｔｉｏｎｏｆＣｈｉｎａ（Ｎｏ．５１４７７１７４ａｎｄＮｏ．５１０７７１２６）．Ｋｅｙｗｏｒｄｓ：ｗｉｎｄｆａｒｍ；ｗｉｎｄｐｏｗｅｒｏｐｅｒａｔｉｎｇｄａｔａ；ｂｉｇｄａｔａ；ａｂｎｏｒｍａｌｄａｔａ；ｒｅｃｏｎｓｔｒｕｃｔｉｏｎ中图分类号：ＴＭ６１９文献标识码：Ａ—文章编号：１６７４３４１５（２０１５）０３－００３８－０８０引言随着电力大数据时代的到来，电力大数据在应用过程中存在着对行业内外能源数据、天气数据等多类型数据的大量关联分析需求，而这些都直接导基金项目：国家自然科学基金项目（５１４７７１７４，５１０７７ｌ２６）致了电力数据类型的增加，从而极大地增加了电力大数据的复杂度。电力行业对大数据的需求，其迫切性将大大超越其他基础能源行业。电力大数据将贯穿未来电力工业生产及管理等各个环节，起到独特而巨大的作用。在电力生产环节，风光储等新能“”源的大量接入，打破了传统相对静态的电力生产，使得电力生产的计量和管理变得日趋复杂【ＪＪ。朱倩雯，等风电场输出功率异常数据识别与重构方法研究－３９－风电运行数据是电力大数据的重要组成部分。当前，风力发电是可再生能源开发利用中技术最成熟、最具开发规模和商业化发展前景的发电形式。随着风力发电技术的不断发展，由于风电功率所呈现的随机性、波动性和间歇性，风电大规模并网对电力系统的影响也越来越明显，研究风电对系统的影响并在此基础上提出相关技术解决措施已成为当前的研究热点和重要课题。风电历史运行数据是研究风电功率波动特性、风电功率预测Ｌ２Ｊ、风电功率对电网影响评估及控制策略Ｌ５】、风电功率曲线的计算、测试以及修正ｊ的基础，因此，对风电场历史运行数据的记录就尤为重要。对于风力发电运营管理方，通过实测风速和风电功率得到的功率曲线是衡量风电机组和风电场经济技术水平的最佳标尺Ｌ８ｊ，可以用于评估风机和风电场的性能和运行状况、预测风机和风电场的年发电量等；对于预测服务商，历史实测风速和风电功率数据作为预测系统的基础输入数据，对预测精度有显著影响。然而，从风电场收集到的大量数据中通常包含异常数据点，这样的异常点表现出数据缺失，越限，功率波动梯度过大等特征。通过对风电场的运行经验和统计结果的分析，异常数据点的主要来源有【９Ｊ：风机叶片受污垢和冰等环境因素的影响形成异常点体现在风电场功率曲线上；维修或弃风限电造成的风电场停机；传感器故障等控制系统问题；由表计测量误差导致的异常观测值等。因此，有必要对风电历史运行数据中的异常数据点进行识别剔除和还原重构。文献【９】建立了基于逻辑函数的风电功率曲线非线性模型，并通过进化策略算法对模型参数进行求解。这个模型通过残值法和控制图对异常值进行识别、剔除。但是模型的建立需要大量的正常数据样本，且进化策略算法对大样本数据的多参数寻优过程速度较慢，具有较大局限性。文献【１０】在数据预处理阶段通过简单的数据范围检查和一致性检验对异常数据进行剔除，在功率曲线建模过程中忽略缺失数据，然后根据互相关函数去除风速和功率时间序列之间的延时特征，从而得到一个静态的（无延时）功率曲线模型。文献［１１］采用基于小波模极大值的方法对风速数据中的奇异点进行辨识，该方法将阈值判断与李氏指数相结合，判断出风速信号中的奇异性及发生时刻，剔除其中的奇异数据，并采用ＡＲＭＡ模型对奇异点进行修正。但该方法仅针对时间序列的奇异点辨识，并没有考虑到风速．功率的对应关系，在奇异点修正过程中采用单一的ＡＲＭＡ模型修正效果并不理想。文献［１２】针对弃风情况下风电场历史运行数据存在的异常数据的实际问题，自定义了在有功功率时问序列中异常数据所应遵循的时序变化特性，并根据这些特性识别异常数据。但实际上由于风电所固有的较强波动性和随机性，很难从时序变化特性上完全区分正常数据和异常数据，尤其是在弃风现象不明显时，其识别过程具有很大的局限性。文献［１３］通过简单的数据范围检查和一致性检验对异常数据进行剔除，并不适用于处理大量分散型异常数据。本文分析了风电场历史运行数据中存在的异常数据的主要来源，并针对该实际问题，采用基于四分位算法的数学模型对异常数据进行识别；并在此基础上通过实际算例对比分析了采用基于临近风电场出力模式性和多点三次样条插值方法对风电场输出功率异常数据进行重构的效果，从而为研究风电功率波动特性、风电功率预测等风电相关问题提供有效的数据集。１异常数据的识别与剔除１．１异常数据分析文献［１４１对德国和丹麦风电场的研究表明，导致风机故障的主要原因是电气控制或系统部件（电网或电气系统，偏航系统以及机械或变浆控制系统１而不是机械组件，比如变速箱。风电功率的异常数据主要是由上述故障和风机特性的不稳定造成的。大量的异常数据并不容易识别，这些异常数据的存在严重影响了研究建模和风资源评估的结果。检验建模所用数据质量对于建模是十分重要的，风电功率数据集中存在大量异常数据，因此对该类问题的自动识别与剔除方法的研究是很有必要的。考虑到难以从单一的风电功率时序变化特性中自识别分散型异常数据，本文借助风速一功率散点图分析，体现在ｐ散点图上存在大量分散型异常数据点和堆积型异常数据簇。异常数据的检验识别首先是要剔除风速．功率数据组中的连续数据以及越限数据，这些异常数据通常是由表计读数错误引起的。但是仅对这部分数据进行剔除并不足以为功率曲线建模、风电功率预测提供真实可靠的数据组。风电出力数据存在很多异常值，这是因为风速的随机性和波动性导致了两个参量之间相关关系的时变性。图１是国内某风电场７０ｍ测风塔风速与实测功率散点箱线图，该风电场的切入风速ｖ。ｊ＝４ｍ／ｓ，切出风速。＝２０ｍ／ｓ，额定风速Ｖｒ＝１３ｍ／ｓ，额定功率４９．５Ｍｗ。由图中显而易见的是风电功率数据集中存在大量异常数据，表现在箱线图中，．．４０．．电力系统保护与控制数据整体分布不集中，离群值数量大且分布不规律，对风电功率预测、风电功率曲线的计算、测试以及修正等方面研究带来负面影响。就风电出力而言，如果功率值是每１５ｒａｉｎ风机出力的平均值，必须保证这台风机在这１５ｍｉｎ内正常工作，否则，这些数据并不能代表风机的正常运行状态。≥３０婪２０１０风速／（ｍ／ｓ）图１风电场风速．风电功率散点箱线图—Ｆｉｇ．１Ｗｉｎｄｓｐｅｅｄｐｏｗｅｒｓｃａｔｔｅｒｂｏｘ－ｐｌｏｔｏｆａｗｉｎｄｆａｒｍ１．２识别与剔除异常数据的原理与过程基于正态分布的３ｏ法则或Ｚ分数方法是以假定数据服从正态分布为前提的，但实际数据往往并不严格服从正态分布。它们判断异常值的标准是样本数据的均值和标准差，而均值和标准差的耐抗性极小，异常值本身会对它们产生较大影响，这样产生的异常值个数不会多于总数０．７％。显然，将这种方法应用于非正态分布数据的异常值识别，其有效性是有限的。箱线图的绘制依靠实际数据，不需要事先假定数据服从特定的分布形式，没有对数据作任何限制性要求，它真实直观地表现数据形状的本来面貌；另一方面，箱线图判断异常值的标准以四分位距为基础，四分位数具有一定的耐抗性，多达２５％的数据可以变得任意远而不会很大地扰动四分位数，因此箱线图识别异常值的结果比较客观，具有一定的优越性。通过对体现在ｖ散点图上的大量分散型异常数据点和堆积型异常数据簇的分析，根据异常数据在ｖ－ｐ散点图中的随机分布特性，本文采用基于四分位原理【１】的数学模型对风电场异常数据进行识别与剔除。其异常数据识别和剔除过程如下：（１）当风速小于切入风速时，风机的理论出力恒等于０。因此在［０，ｖｃＩ］区间内删除掉负功率值点，保留风电功率的非负值点，有利于后续对其他异常数据的处理工作。（２）当风速大于切入风速ｉ且小于切出风速１，。。时，该段数据体现在ｐ散点图中测风塔风速对应的风电功率波动幅度较大且分散，大多数异常数据点出现在这个风速区间内。在［ｉ，。】区间内，小于等于０的风电功率值应视为异常数据，即将散点图中最底部由于弃风限电造成的堆积型异常数据簇剔除。此外，还将大于额定值的功率数据及其对应的风速删除掉。（３）采用横向四分位法将横向分布的分散性异常数据点剔除。从散点图中可以看出，在理论功率曲线的包络线外存在许多分散性异常数据点以及堆积型异常数据簇，如果直接采用散点图中的原始数据进行功率曲线建模、风电功率预测等研究，这些异常数据的存在会严重影响研究分析的结果。因此可采用四分位法将这些异常数据剔除掉。首先，对每个功率区间内（例如以０．５Ｍｗ为间隔单位将［０，５０Ｍｗ］的风电功率划分为相等的１００个功率区间）对应的风速数据集合采用四分位法，剔除掉位于风速数据集合内限，】之外的数据点。风速数据集合内限，凡】可以通过式（１）进行计算。［，］＝【Ｑｌ一１．５１ＱＲ，０３＋１．５ＩＱＲ】（１）对于一个升序排列的样本…ｌ，ｘ２，），式中，Ｑ和分别是样本序列的第一四分位数和第三四分位数；ＩＱＲ为四分位距（ＩｎｔｅｒＱｕａｒｔｉｌｅＲａｎｇｅ）。（４）采用纵向四分位法将数据左上方的分散性异常数据点剔除。对每个风速区间内ｆ如以０．５ｍ／ｓ为间隔单位将［０，２０ｍ／ｓ］的风电功率划分为相等的４０个风速区间）对应的功率数据集合采用四分位法，剔除掉功率数据集合大于上限凡的数据点。最终保留的数据即为该风速区间内所期望的正常数据。２缺失数据点重构方法上述基于四分位算法的异常数据识别与剔除算法虽然对异常数据的剔除效果较好，但是被剔除的数据中难免存在被误删的正常数据，这在很大程度上对数据的充裕度以及功率时间序列的完整性造成了破坏，不利于对数据的再利用。因此，有必要对剔除异常数据后的风电功率时间序列进行合理有效的重构，以保证在异常数据被有效剔除的前提下，能够较好地保持原始数据集的完整性以及对序列再利用的有效性。将ｖ散点图中通过四分位算法识别与剔除后得到的所期望的正常风电出力数据绘制在风电出力时间序列图中，找到时序图中的缺失数据，通过以下方法对缺失数据点进行重构。一．挪¨¨朱倩雯，等风电场输出功率异常数据识别与重构方法研究．４１．２．１基于风电场出力相关性重构方法２．１．１风电出力模式性电力系统除了在负荷侧表现出运行的模式性外，在电源侧也是有模式可循的。即使是随机性较强的风光等间歇性电源，模式性往往也是比较明显Ⅳ的【ｌ７Ｊ。计个地理位置临近的风电场同一时刻的输…出功率分别为Ｐｆ（（ｆ＝＝１，２，，，ＭＷ，各个风电场…的输出功率占总功率的比值分别为Ｘ／（ｔ）（ｉ＝ｌ，２，，Ⅳ１，其关系为≠Ｘｉ（ｔ）：（２）∑（ｆ）以我国距离约１０ｋｍ的某两个临近风电场Ａ、Ｂ为例，图２给出了风电场Ａ、Ｂ一天内的输出功率以及输出功率与总功率比值的时间序列曲线，时间间隔为１５ｍｉｎ。对比分析可以看出，Ａ、Ｂ两个风电场的运行呈现出很明显的模式性：虽然在一天之内两个风电场的输出功率波动较大，呈现出较强的随机性和时变性，但是由于地理位置临近，气象条件相似，风速、风向变化特性相近，因此两个风电场的输出功率变化趋势以及所占总功率的比值相对稳定。虽然由于两个风电场昼、夜风电功率分布特性、风电场中机组维护和检修计划安排以及弃风率的差异等导致在不同时段其模式性受到一定程度的破坏，但风电场Ａ、Ｂ输出功率占总功率的比值分别基本维持在０．６和０．４左右，相较于风电场出力波动幅度小，比值较稳定。“≮０一＿＿＿＿：ｌＥ毒：女＝＝＝一：：０………≮…………０．．；Ｌ＇Ｃ～～０一翠一一．ｉｌ【里／：．，、＾＾，、＾｛：：０：：：蔓．＂ＫＳ＇－￣，＂－５／一：：＾｛ｔ’～，。。’…－１．，｛：．：；时ｆ／ｉＪ图２两个临近风电场输出功率与比值时间序列图Ｆｉｇ．２Ｔｉｍｅｓｅｒｉｅｓｐｌｏｔｓｏｆｗｉｎｄｐｏｗｅｒａｎｄｉｔｓｒａｔｉｏｓｏｆ２ａｄｊａｃｅｎｔｗｉｎｄｆａｒｍｓ表１给出了Ａ、Ｂ两个风电场的输出功率以及输出功率与总功率比值在一天内的波动率，波动率计算表达式为ｐ—ｐＦ＝—ｆ３１ｊｎ式中：Ｆ表示波动率；尸ｍ表示一天内时间序列的最大值，ＭＷ；Ｐｍｉ表示一天内时间序列的最小值，ＭＷ。由表１可知，由于地理位置邻近的风电场的运行存在一定程度的模式性，模式性的存在使得新定义的功率比值时间序列比原功率时间序列更具平稳性，因此也更具预测性。故可以通过对单个风电场所占总功率的比值进行预测，由已知风电场的输出功率求得待重构风电场的输出功率。表１两个风电场输出功率及其比值的日内波动率Ｔａｂｌｅ１Ｉｎｔｒａ－ｄａｙｖｏｌａｔｉｌｉｔｉｅｓｏｆｗｉｎｄｐｏｗｅｒａｎｄｉｔｓｒａｔｉｏｓｏｆ２ａｄｉａｃｅｎｔｗｉｎｄｆａｒｍｓ风电场Ａ风电场Ｂ２．８７０．５６４．５５１．１０２．１．２基于风电场出力模式性的重构方法Ⅳ假设缺失数据所在时段为【ｆ＋１，ｆ＋］，待重构风电场Ａ以及与其地理位置临近的风电场Ｂ在ｔ时刻的出力分别为Ｐａ（力、尸ｂ（。取两风电场在［ｆ＿ｆ］时段内的风电功率历史运行数据，通过式（２）计算待重构风电场Ａ在已知风电历史出力时段ｆｆ．Ｍ，ｉ】内的风电功率占总功率的比值，得到历史比值序列—…—Ｘａ（ｔ）（ｔ＝ｉ，ｆ）。采用ＢｏｘＪｅｎｋｉｎｓ建模方法，利用ＡＩＣ准￣ＪＪ（ＡｋａｉｋｅＩｎｆｏｒｍａｔｉｏｎＣｒｉｔｅｒｉｏｎ）Ｉ】对比值序列（定阶，关于ＡＲＭＡ￣ｏ，ｇ）模型，其ＡＩＣ评价指标定义为ｃ（Ｐ，９）＝ｎｌｎ（ｐ，ｑ）＋２（ｐ＋）（４）式中：Ｉｎ（，ｇ）是拟合ＡＲＭＡ（ｐ，ｇ）模型时的残差的方差；ｎ为样本数据长度。并在此基础上建立白回归滑动平均模型ⅣＭＡ，ｇ）对风电场Ａ在缺失数据段［ｆ＋１，ｆ＋］的风电功率占总功率的比值咒（Ｄ进行预测，即【ｌ９ＪＰｑ一∑∑一．．，，ｉ＝ｌｊ＝ｌＪ，～Ｎ（０，）式中：为时间序列，这里是比值序列五（；Ｐ和ｇ是模型的自回归阶数和滑动平均阶数；谚和为上白回归系数和滑动平均系数；０，ｘ为自回归项ｑ∑ＡＲ，即为过去观测值的线性组合；一＋为ｊ＝ｏ白噪声序列的滑动平均项ＭＡ；Ｎ代表正态分布。则风电场Ａ在缺失数据段［ｆ＋１，州Ｖ】的出力可以表示为．４２一电力系统保护与控嘲））（６）风电场Ａ缺失数据段【ｌ，ｆ＋ＪＶ］的功率Ｐａ（进而可通过临近风电场Ｂ的功率由式（６１进行重构。为证明该方法能有效对缺值数据进行重构，更好地适应风电功率的时变特性，在功率时问序列中挑选一段在短时间内大范围波动的采样数据点模拟缺值数据段，分别采用普通ＡＲＭＡ模型和基于风电场之间出力模式性模型对缺值数据进行重构。功率时间序列分辨率为１５ｍｉｎ，所得结果的逐点绝对误差值如图３所示。Ｉ＋风电场出力模式性霞构方法ｌｌ＋普通ＡＲＭＡ力法Ｉ／／／／／／／—＼Ｉ＼。————一图３两种形式的ＡＲＭＡ重构误差Ｆｉｇ．３ＲｅｃｏｎｓｔｒｕｃｔｉｏｎｅｒｒｏｒｓｏｆＡＲＭＡｂａｓｅｄｏｎｔｗｏｄｉｆｉｅｒｅｎｔｍｅｔｈｏｄｓ由图３可知，采用基于风电场之问出力模式性模型对缺值进行重构，通过充分利用临近风电场实测数据以及风电场之间的模式性，能更好地适应风电功率的时变特性。２．２基于多点三次样条插值重构方法三次样条（ＣｕｂｉｃＳｐｌｉｎｅ）插值方法是数值分析理论中的经典内插方法，是一种能克服高次多项式插值的缺陷的分段插值方法［２０－２１】。∈设函数（）Ｃ［日，ｂ】，在，６］上有一个划分…Ａ：ａ＝Ｘｏ＜＜＜Ｘｎ＝ｂ（７）…且在每个子区间＝ｉｘ／．１］（，＝＝１，２，，）上都是三△次多项式，则称）是关于划分的一个三次样条函数。若三次样条函数）在节点ｘ上给定函数值…）Ｕ＝０，１，，），并成立…Ｓ（ｘ）＝Ｙｊ，Ｊ＝０，ｌ，，（８）则称．）为三次样条插值函数。本文通过三弯矩插值法构造样条插值函数…—），令＝（）（＝０，ｌ，，），由于）在＋】上是二阶光滑的分段三次多项式，（ｘ）是分段线性连续函数。＋（９）—…式中：为待定参数，１１刁（，＝＝０，１，，，ｚ一１）。对式（９）两端在＋１１上积分两次，因此ｓ（ｘ）在＋】上有表达式∽ｓ＝＋＋Ｘ－－Ｘｊ【＋广一（Ｍｊ）１＋（１０）一一（）＋（０）一譬［Ｘｊ￣Ｘｊ＋１】式中，）。在自然边界条件下，得线性方程组２／２２２一２２一２一ｌ２．：●一２一：●一２ｄ—ｌ＝＝；ｄｊ＝６ｍ，＋１…】ｑ＝ｌ，２，，一１）。对缺失数据点插值的效果并不仅仅取决于缺值区间的端点数据，还取决于间隔与其缺值间隔等距的若干数据点。采用该方法不会使时间序列中的周期信号受损，计算出的插值点不会造成较大的失真。采用的插值区间满足各个选定点之间间隔和插值点之间间隔相等，同时就保证了取样间隔与奈奎斯特频率之间的关系【２引。而采用其他插值方法，该条件很难满足。通过试验选取对待插值点影响较大的前后各个点，远离待插值点前后各个点以外的数据对插值计算的影响微乎其微。假设缺失数Ⅳ据所在区间为［ｆ＋１，．］，待重构风电场在第，点的∽出力为Ｐ。多点三次样条插值【２ｚＪ重构方法是在三Ⅳ次样条插值的基础上每次在连续缺失个数据点的数据段每次进行一个数据点的插值，每次插值计算都采用三次样条插值方法。比如在总数为１０００个点的风电功率时间序列中连续缺失７个数据点（即Ⅳ＝７），其缺值区间为［５０１，５０７】，则多点三次样条插值重构方法首先对Ｐ（５０４）点进行插值计算。第一步…计算时采用数据间隔为３点的Ｐ（５００），Ｐ（４９６），，—Ｐ（５０４４×…；Ｐ（５０８），Ｐ（５１１），，Ｐ（５０４＋４×以上２×Ｍ个点进行插值计算。每次通过多点三次样条插值重构计算参数所用到的数据间隔为连续缺失数据区问的一半，继续进行以上过程直到完成朱倩雯，等风电场输出功率异常数据识别与重构方法研究．．４３．．缺失数据段的插值重构。４０３算例分析～为验证所采用的异常数据数据识别、缺失数据重构方法的有效性，对比不同方法的适应性，以国内某风电场的历史运行数据为研究对象，数据采样间隔为１５ｍｉｎ。３．１异常数据识别与剔除策略检验本文以国内某风电场２０１３年整年的风电历史运行数据为研究对象，通过采用上文提出的模型对异常数据进行识别、剔除，整年包含约３００００个风速一风电功率数据对，图１为该风电场的原始ｖ散点箱线图，风电场异常数据经过基于四分位原理算法剔除的结果如图４所示。可见，通过该模型对原始风速．功率数据的自识别，分散型异常数据点等离群值都已被有效剔除。该模型从风速一功率数据集中识别并剔除了２２．６７％的数据。￣／（ｍ／ｓ）图４模型识别后风电场风速．功率散点图Ｆｉｇ．４Ｗｉｎｄｆａｒｍｓｃａｔｔｅｒｄｉａｇｒａｍａｆｔｅｒｍｏｄｅｌｅｌｉｍｉｎａｔｉｏｎ该模型对此类风电场数据集中的异常数据提供了合理有效的识别方法，对不同风电场有较强通用性，并且能够为异常数据分布特性未知的其他数据集中的异常数据识别提供有效参考。３．２缺失数据重构方法检验图５为装机容量为４９．５ＭＷ的风电场Ａ在２０１３年１１月２８日的实际功率时序曲线，为了验证本文提出的重构方法对风电场缺失数据的重构能力，在算例分析中分别删除短时间内大范围波动的采样点数据（２０１３年１１月２８日７个采样点数据），模拟数据缺失情况以检验重构方法有效性。分别采用基于风电场之间出力模式性和基于多点三次样条插值重构方法，与常规的数学方法ｆ多项式拟合、递推式非邻均值补全法和普通三次样条插值方法）进行比较。３．２．１基于风电场出力模式性的重构方法通过与待重构风电场Ａ地理位置临近的风电ｌ一模拟数据缺失段（７个点）ｌ１一风由场宓际Ｌ｝｛１ｌｅｆＶｌ构区】ｉ：．．卜－一风电场ｎ｛模式性蘑｛匈Ｌ‘一ｌ：：盖蛊餮萧赞ｌ１／＼．一／■、，，、．．．＿。，：—■嚣？：ｉｌｉ图６缺值７点重构结果对比Ｆｉｇ．６Ｒｅｃｏｎｓｔｒｕｃｔｉｏｎｅｆｆｅｃｔｃｏｍｐａｒｉｓｏｎｏｆｍｉｓｓｉｎｇ７ｄａｔａ３．２．２基于多点三次样条插值重构方法由于远离待插值点前后各个点以外的数据对插值计算的影响较小，因此通过试验选取对待插值点影响较大的前后各个点对缺失数据进行重构。当达到一定值时，通过增加影响插值的数据个数（值）对待插值数据段进行重构计算对插值结果的误差影响很小（１×１０。。）。因此，对缺值的数据样本选择前后各５点进行多点三次样条重构计算。得到对风电场输出功率时间序列缺失的数据段重构结果以及逐点的绝对误差值如图６所示。本文在重构结果对比分析中，选择多项式拟合法、递推式非邻均值补全法和普通的三次样条插值方法对缺失数据进行重构，与上述两种方法的误差对比结果如表２所示，其中ＭＡＥ（ＭｅａｎＡｂｓｏｌｕｔｅ≥苫＼姆暖匿电力系统保护与控制Ｅｒｒｏｒ）是平均绝对误差。算例表明，对风电功率时间序列缺失数据进行重构，基于临近风电场出力模式性对缺失数据的重构效果最好，但是当临近风电场数据缺失、异常、不可用时，可采用多点三次样条插值重构方法对缺失数据进行重构，亦可得到较理想的重构效果。采用以上两种重构方法对缺失数据段进行重构的结果均优于采用多项式拟合、递推式非邻均值补全法和普通三次样条插值方法重构得到的结果。值得注意的是，由于出力模式性模型对相邻风电场可用数据的依赖性较高，因此基于临近风电场出力模式性的重构方法对时间尺度更长的数据缺失以及在待重构风电场功率与总功率比值突变情况下的重构有一定限制。此外，基于多点三次样条插值重构方法对缺失数据中的突变点的拟合效果不如基于临近风电场出力模式性对缺失数据的重构。表２重构结果对比Ｔａｂｌｅ２Ｅｆｆｅｃｔｃｏｍｐａｒｉｓｏｎｏｆｄｉｆｆｅｒｅｎｔｒｅｃｏｎｓｔｒｕｃｔｉｏｎｍｅｔｈｏｄｓ４结论从风电场收集到的大量数据中通常包含异常运行数据点，这样的异常点对风电功率波动特性、风电功率预测、风电功率对电网影响评估及控制策略、风电功率曲线的计算、测试以及修正等方面研究带来负面影响。本文从ｖ散点图的角度对异常数据进行识别剔除，并在此基础上利用风电场出力模式性和改进的多点三次样条方法对缺失数据进行重构。主要结论如下。（１）由于风电所固有的较强波动性和随机性，很难从时序变化特征上完全区分正常数据和异常数据。这些异常数据主要来源于数据采集、测量、传输的各个环节中发生的故障和干扰以及维修或弃风限电造成的风电场停机。（２）本文从散点图的角度出发采用的基于四分位算法的数学模型对于不同类型、不同数量异常数据的剔除效果显著，且有较强的通用性和较高的工程实用价值。（３）针对少量数据缺失和连续缺失较多数据的情况，分别采用基于临近风电场出力模式性和多点三次样条插值方法对异常缺失数据进行重构，并通过算例分析证明两种方法对缺失数据进行重构可信度较高，改善了数据的完整性，有利于数据的再利用。参考文献［１］中国电机工程学会信息化专委会．中国电力大数据发展白皮书［ＲＩ．２０１３．［２］杨茂，熊昊，严干贵，等．基于数据挖掘和模糊聚类的风电功率实时预测研究［Ｊ］．电力系统保护与控制，２０１３，４１（１）：１－６．ＹＡＮＧＭａｏ，ＸＩＯＮＧＨａｏ，ＹＡＮＧａｎｇｕｉ，ｅｔａ１．Ｒｅａｌ－ｔｉｍｅｐｒｅｄｉｃｔｉｏｎｏｆｗｉｎｄｐｏｗｅｒｂａｓｅｄｏｎｄａｔａｍｉｎｉｎｇａｎｄｆｕｚｚｙｃｌｕｓｔｅｒｉｎｇ［Ｊ］．ＰｏｗｅｒＳｙｓ￣ｍＰｒｏｔｅｃｔｉｏｎａｎｄＣｏｎｔｒｏｌ，２０１３，４１（１）：１－６．［３］夏冬，吴俊勇，贺电，等．一种新型的风电功率预测综—合模型【Ｊ】．电工技术学报，２０１１，２６（增刊１）：２６２２６６．ＸＩＡＤｏｎｇ，ＷＵＪｕｎｙｏｎｇ，ＨＥＤｉａｎ，ｅｔａ１．Ａｎｏｖｅｌｃｏｍｂｉｎｅｄｍｏｄｅｌｆｏｒｗｉｎｄｐｏｗｅｒｆｏｒｅｃａｓｔｉｎｇｂａｓｅｄｏｎｍａｘｉｍｕｍｅｎｔｒｏｐｙｐｒｉｎｃｉｐｌｅ［Ｊ］．ＴｒａｎｓａｃｔｉｏｎｓｏｆＣｈｉｎａ—ＥｌｅｃｔｒｏｔｅｃｈｎｉｃａｌＳｏｃｉｅｔｙ，２０１１，２６（Ｓ１）：２６２２６６．［４］王贺，胡志坚，陈珍，等．基于集合经验模态分解和小波神经网络的短期风功率组合预测［Ｊ］．电工技术学报，２０１３，２８（９）：１３７－１４４．ＷＡＮＧＨｅ，ＨＵＺｈｉｊｉａｎ，ＣＨＥＮＺｈｅｎ，ｅｔａ１．Ａｈｙｂｒｉｄｍｏｄｅｌｆｏｒｗｉｎｄｐｏｗｅｒｆｏｒｅｃａｓｔｉｎｇｂａｓｅｄｏｎｅｎｓｅｍｂｌｅｅｍｐｉｒｉｃａｌｍｏｄｅｄｅｃｏｍｐｏｓｉｔｉｏｎａｎｄｗａｖｅｌｅｔｎｅｕｒａｌｎｅｔｗｏｒｋｓ［Ｊ］．ＴｒａｎｓａｃｔｉｏｎｓｏｆＣｈｉｎａＥｌｅｃｔｒｏｔｅｃｈｎｉｃａｌ—Ｓｏｃｉｅｔｙ，２０１３，２８（９）：１３７１４４．［５］于艽，赵瑜，周玮，等．基于混合储能系统的平抑风电波动功率方法的研究［Ｊ］．电力系统保护与控制，２０１２，３９（２４）：３５４０．ＹＵＰｅｎｇ，ＺＨＡＯＹｕ，ＺＨＯＵＷｅｉ，ｅｔａ１．Ｒｅｓｅａｒｃｈｏｎｔｈｅｍｅｔｈｏｄｂａｓｅｄｏｎｈｙｂｒｉｄｅｎｅｒｇｙ￣ｏｒａｇｅｓｙｓｔｅｍｆｏｒｂａｌａｎｃｉｎｇｆｌｕｃｔｕａｎｔｗｉｎｄｐｏｗｅｒ［Ｊ］．ＰｏｗｅｒＳｙｓｔｅｍＰｒｏｔｅｃｔｉｏｎａｎｄＣｏｎｔｒｏｌ，２０１１，３９（２４）：３５－４０．［６］胡国伟，别朝红，王锡凡．考虑运行可靠性的含风电电力系统优化调度［Ｊ】．电工技术学报，２０１３，２８（５）：５８．６５．ＨＵＧｕｏｗｅｉ，ＢＩＥＺｈａｏｈｏｎｇ，ＷＡＮＧＸｉｆａｎ．Ｏｐｔｉｍａｌｄｉｓｐａｔｃｈｉｎｗｉｎｄｉｎｔｅｇｒａｔｅｄｓｙｓｔｅｍｃｏｎｓｉｄｅｒｉｎｇｏｐｅｒａｔｉｏｎｒｅｌｉａｂｉｌｉｔｙ【Ｊ］．ＴｒａｎｓａｃｔｉｏｎｓｏｆＣｈｉｎａＥｌｅｃｔｒｏｔｅｃｈｎｉｃａｌ—Ｓｏｃｉｅｔｙ，２０１３，２８（５）：５８６５．［７］申新贺，潘东浩，唐继光．大型风电机组功率曲线的分析与修正［Ｊ］．应用能源技术，２００９（８）：２８－３２．ＳＨＥＮＸｉｎｈｅ，ＰＡＮＤｏｎｇｈａｏ，ＴＡＮＧＪｉｇｕａｎｇ．Ａｎａｌｙｓｉｓａｎｄｍｏｄｉｆｉｃａｔｉｏｎｍｅｔｈｏｄｆｏｒｗｉｎｄｔｕｒｂｉｎｅｐｏｗｅｒｃｕｒｖｅ［Ｊ】朱倩雯，等风电场输出功率异常数据识别与重构方法研究．．４５．．ＡｐｐｌｉｅｄＥｎｅｒｇｙＴｅｃｈｎｏｌｏｇｙ，２００９（８）：２８－３２．［８］马平，刘昌华．风力发电机组功率曲线的验证［Ｊ］．可—再生能源，２００８，２６（６）：８２８４．ＭＡＰｉｎｇ．ＬＩＵＣｈａｎｇｈｕａ．Ｖａｌｉｄａｔｉｏｎｏｎｔｈｅｐｏｗｅｒｃｕｒｖｅｏｆｗｉｎｄｐｏｗｅｒｕｎｉｔ［Ｊ］．ＲｅｎｅｗａｂｌｅＥｎｅｒｇｙＲｅｓｏｕｒｃｅｓ，２００８，２６（６）：８２－８４．［９］ＫＵＳＩＡＫＡ，ＺＨＥＮＧＨ，ＳＯＮＧｚ．Ｍｏｄｅｌｓｆｏｒｍｏｎｉｔｏｒｉｎｇｗｉｎｄｆａｒｍｐｏｗｅｒ［Ｊ］．ＲｅｎｅｗａｂｌｅＥｎｅｒｇｙ，２００９，３４（３）：５８３．５９０．［１０］ＳＣＨＬＥＣＨＴＩＮＧＥＮＭ，ＦＥＲＲＥＩＲＡＳＩ．Ｃｏｍｐａｒａｔｉｖｅａｎａｌｙｓｉｓｏｆｎｅｕｒａｌｎｅｔｗｏｒｋａｎｄｒｅｇｒｅｓｓｉｏｎｂａｓｅｄｃｏｎｄｉｔｉｏｎｍｏｎｉｔｏｒｉｎｇａｐｐｒｏａｃｈｅｓｆｏｒｗｉｎｄｔｕｒｂｉｎｅｆａｕｌｔｄｅｔｅｃｔｉｏｎ［Ｊ］．ＭｅｃｈａｎｉｃａｌＳｙｓｔｅｍｓａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，—２０１１，２５（５）：１８４９１８７５．［１１］李丽，叶林．风速数据奇异点辨识研究［Ｊ】．电力系统保护与控制，２０１１，３９（２１）：９２．９７．ＬＩＬｉ．ＹＥＬｉｎ．Ｉｄｅｎｔｉｆｉｃｍｉｏｎｏｆｓｉｎｇｕｌａｒｐｏｉｎｔｓｉｎｗｉｎｄｓｐｅｅｄｄａｔａ［Ｊ］．ＰｏｗｅｒＳｙｓｔｅｍＰｒｏｔｅｃｔｉｏｎａｎｄＣｏｎｔｒｏｌ，—２０１１，３９（２１）：９２９７．［１２］张东英，李伟花，刘燕华，等．风电场有功功率异常运行数据重构方法［Ｊ】．电力系统自动化２０１３，３７（４）：１－６．ＺＨＡＮＧＤｏｎｇｙｉｎｇ，ＬＩＷｅｉｈｕａ，ＬＩＵＹａｎｈｕａ，ｅｔａ１．Ｒｅｃｏｎｓｔｒｕｃｔｉｏｎｍｅｔｈｏｄｏｆａｃｔｉｖｅｐｏｗｅｒｈｉｓｔｏｒｉｃａｌｏｐｅｒａｔｉｎｇｄａｔａｆｏｒｗｉｎｄｆａｒｍ［Ｊ］．ＡｕｔｏｍａｔｉｏｎｏｆＥｌｅｃｔｒｉｃＰｏｗｅｒＳｙｓｔｅｍｓ，２０１３，３７（４）：１－６．［１３］ＳＣＨＬＥＣＨＴＩＮＧＥＮＭ，ＳＡＮＴＯＳＩＦ＇ＡＣＨＩＣＨＥＳ．Ｕｓｉｎｇｄａｔａ－ｍｉｎｉｎｇａｐｐｒｏａｃｈｅｓｆｏｒｗｉｎｄｔｕｒｂｉｎｅｐｏｗｅｒｃｕｒｖｅｍｏｎｉｔｏｒｉｎｇ：ａｃｏｍｐａｒａｔｉｖｅｓｔｕｄｙ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｕｓｔａｉｎａｂｌｅＥｎｅｒｇｙ，２０１３，４（３）：６７１－６７９．［１４］ＴＡＶＮＥＲＰＪ，ＸＩＡＮＧＪ，ＳＰＩＮＡＴＯＦ．Ｒｅｌｉａｂｉｌｉｔｙａｎａｌｙｓｉｓｆｏｒｗｉｎｄｔｕｒｂｉｎｅｓ［Ｊ］．ＷｉｎｄＥｎｅｒｇｙ，２００７，１０（１）：１－１８．［１５］ＨＹＮＤＭＡＮＲＪ．ＦＡＮＹＳａｍｐｌｅｑｕａｎｔｉｌｅｓｉｎｓｔａｔｉｓｔｉｃａｌｐａｃｋａｇｅｓ［Ｊ］．ＴｈｅＡｍｅｒｉｃａｎＳｔａｔｉｓｔｉｃｉａｎ，１９９６，５０（４）：３６】．３６５．［１６］李国柱．统计学［Ｍ】．北京：科学出版社，２００４．［１７］段炼，于继来，徐泰山，等．基于运行模式的注入功率联合概率分布研究［ＥＢ／ＯＬ］．【２０１３－０５－３１］．ｈｔｔｐ：ｌｌｗｗｗ．ｐａｐｅｒ．ｅｄｕ．ｃｎ／ｒｅｌｅａｓｅｐａｐｅｒ／ｃｏｎｔｅｎｔ／２０１３０５－４９１．［１８］徐国祥．统计预测和决策［Ｍ】．上海：上海财经大学出版社，２００８．［１９］陈刚，段晓，张继红，等．基于ＡＲＭＡ模型的低频振荡模式在线辨识技术研究［Ｊ］．电网技术，２０１０，３４（１１）：４８．５４．ＣＨＥＮＧａｎｇ，ＤＵＡＮＸｉａｏ，ＺＨＡＮＧＪｉｈｏｎｇ，ｅｔａ１．Ａｎｅｗａｐｐｒｏａｃｈｆｏｒｏｎｌｉｎｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｌｏｗｆｒｅｑｕｅｎｃｙｏｓｃｉｌｌａｔｉｏｎｍｏｄｅｓｂａｓｅｄｏｎａｕｔｏ－－ｒｅｇｒｅｓｓｉｖｅｍｏｖｉｎｇ・－ａｖｅｒａｇｅｍｏｄｅｌ［Ｊ］．ＰｏｗｅｒＳｙｓｔｅｍＴｅｃｈｎｏｌｏｇｙ，２０１０，３４（１１、：４８－５４．［２０］李庆扬，王能超，易大义．数值分析［Ｍ】．北京：清华大学出版社，２００１．［２１］吴勃英．数值分析原理【Ｍ】．北京：科学出版社，２００３：ｌ３５．１４４．［２２］武艳强，黄立人．时间序列处理的新插值方法［Ｊ］．大地测量与地球动力学，２００５，２４（４）：４３．４７．ＷＵＹａｎｑｉａｎｇ．ＨＵＡＮＧＬｉｒｅｎ．Ａｎｅｗｉｎｔｅｒｐｏｌａｔｉｏｎｍｅｔｈｏｄｉｎｔｉｍｅｓｅｒｉｅｓａｎａｌｙｚｉｎｇ［Ｊ］．ＪｏｕｒｎａｌｏｆＧｅｏｄｅｓｙａｎｄＧｅｏｄｙｎａｍｉｃｓ，２００５，２４（４）：４３－４７．收稿日期：２０１４－０５－０４作者简介：朱倩雯（１９９１一），女，硕士研究生，从事电力系统运行与控制、新能源发电技术方面的研究；叶林（１９６８一），男，教授，博士生导师，主要研究方向为电力系统自动化、新能源发电与超导电力应用；Ｅ．ｍａｉｌ：ｙｌ＠ｃａｕ．ｅｄｕ．ｃａ赵永宁（１９９０－），男，博士研究生，从事电力系统运行与控制、新能源并网技术方面的研究。

您可能关注的文档

一夕落阳: 该用户很懒，什么也没介绍

联系作者