基于电量曲线特征参数模型的线损异常诊断

/ 2

基于电量曲线特征参数模型的线损异常诊断

张思为高建为范淑霞张斌路成郑旺王倩

(国网沧州供电公司061000)

摘要:一、背景及意义

电网电能损耗率简称为线损,是电力企业一项重要综合性技术经济指标。它反映了一个电力网的规划设计、生产技术和运行管理水平,长期以来受到各级电力企业的重视。随着经济的发展及电力市场化的深入,为减少电网的运行成本,对电力网节能降损工作提出了更高的要求。当发生采集装置故障、采集数据传输失败、线变关系错误、系统档案错误、集中器计量误差、电能表计量误差、偷电漏电等情况都会引发线损异常。如何根据各计量装置采集的电量数据,进一步分析造成高损异常的原因、定位电量异常用户,是各供电公司面临的实际问题。

本文提出了一种基于电量曲线特征参数模型的线损异常分析方法。建立了基于皮尔逊相关系数算法、k-means聚类分群算法、ID3决策分析算法的电量曲线特征参数模型。通过算例验证,可以有效发现导致线路或台区高损的异常用电行为,锁定问题表计,分析异常原因,进一步辅助工作人员制定降损方案。经实践验证,该模型具有计算速度快、数据获取便捷、分析结果可靠性高等优点。

二、电量曲线特征参数模型

用电量曲线是将一段时间内的每日负荷电量数据连接而成的二维曲线图形,它代表了负荷的用电量变化情况。曲线的平均值、频率、陡度等均可称为电量曲线特征参数。其中,皮尔逊相关系数就是曲线的特征参数之一,它可以描述负荷用电量曲线和关口损耗电量曲线的相似程度,进而反应了负荷用电量对关口损耗电量的影响程度。

1.皮尔逊相关系数算法

皮尔逊相关系数又称皮尔逊积矩相关系数、简单相关系数,它可以分析2个定距变量间联系的紧密程度,用于度量2个变量X和Y之间的线性相关度,其计算结果介于-1与1之间,一般用r表示,计算公式为:

其中n为样本量,X、Y分别为2个变量的观测值。

若r>0,表明2个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明2个变量是负相关,即一个变量的值越大,另一个变量的值反而会越小。r的绝对值越大表明相关性越强。

2.k-means聚类分群算法

k-means聚类算法是一种基于迭代的重划分策略,相当于在d维空间中寻找k个中心点,以中心点为核心将给定点集P={x1,x2,…,xN}划分为k个子集,优化目标为给定点集中各点到期所属子集中心点的距离平方和最小。

由于中心点个数k值的选取直接影响到聚类的效果,所以需要针对不同的问题模型,确定相应的k值。一般设定:2≤k≤kmax,且kmax<<N。通过动态地调整参数k,从而自动地确定聚类个数k。计算公式如下所示:

其中,Xj为划分的第j个子集;xi为子集Xj中的第i个点;Cj为子集Xj的中心点。

通过分析负荷曲线特征,选择曲线皮尔逊相似度、日均用电量占比、用电量变异系数、用电量变化趋势度四个变量进行聚类分群。

其中,日均用电量占比反映了变台负荷对线路线损率的影响程度,其计算公式为:

用电量变异系数反映了负荷曲线的波动程度,如果曲线有大幅值的波动会提升变异系数,其计算公式为:

用电量变化趋势度反映了负荷曲线的波动频率,如果曲线频繁产生波动会提升变化趋势度,其计算公式为:

k-means聚类步骤如下图所示:

图1k-means聚类算法流程

3.ID3决策分析

ID3算法是一种针对分类信息进行量化预测的方法,可用来构造决策树(本模型不构造决策树,仅进行信息增益计算)。通过计算每种属性的信息增益,认为信息增益越高的属性对于最后结果影响越大。

信息熵公式:

信息增益公式:

其中,Ent(D)表示整个信息集的熵,Gain(D,a)表示a变量在整个信息集D中的信息增益,即影响程度。

在若干属性组成的信息集,且该信息集已知每条信息的最后结果,可以通过ID3决策算法确定每个属性对于信息集最后结果的影响程度。

由此,抽取若干已知高损原因的线路作为样本,结合ID3决策分析算法,可以得出皮尔逊相关系数、日均负荷占比、用电量变异系数、用电量变化趋势度对于最终高损异常原因的决定程度。

三、算例分析

抽取沧州供电公司2018年5月份10条高损线路(高损原因未知),所带可正常采集专公变529个,用作计算样本;10条高损线路(高损原因已知),所带可正常采集专公变410个,用来生成ID3决策模型。采集数据周期为15天,筛选样本在周期内的线损率、损耗电量、用电量数据。其中,10条线路(高损原因未知)的线损率曲线如下图所示:

图210条线路(高损原因未知)线损率曲线

结合皮尔逊法进行台区用户相关度分析,将每日线路损耗电量作为X,各专公变用电量作为y,分别计算每个用户用电量与台区线损统计的皮尔逊相关系数。结果如下表所示。

表2皮尔逊相关系数计算结果

其中,有31个负荷的皮尔逊相关系数大于0.6,即极强正相关;有5个负荷小于-0.4,即极强反相关。极强正相关电量曲线例如下图所示:

图3皮尔逊系数极强正相关示例

然后,结合表1皮尔逊相关系数反应的高损原因,可以定位用电异常表计,初步分析造成高损的原因,进而辅助线损工作人员更具针对性的开展现场用电检查工作。

下面对皮尔逊相关系数在-0.4至0.6之间的负荷进一步分析,通过k-means聚类分群算法,计算皮尔逊相关系数、日均用电量占比、用电量变异系数、用电量变化趋势度分群情况,得出聚类结果如表格所示:

表3聚类结果及定义

结合10条高损线路(已知高损原因)所带的410个负荷样本,通过以上皮尔逊相关系数筛选、k-means聚类分群后,进行ID3决策分析,可以得出决策分析模型。以便于10条高损线路(未知高损原因)所带的493个负荷样本进行ID3决策分析。分析模型如表格所示:

表4ID3决策分析模型

ID3决策分析模型雷达图如下图所示:

图4ID3决策分析模型雷达图

最后,结合ID3决策分析模型,对10条高损线路(未知高损原因)所带的493个负荷样本进行用电异常原因分析,得出结果如表格所示:

表5曲线特征参数模型分析结果

曲线特征参数模型分析结果雷达图示例如下图所示。

图5曲线特征参数模型分析结果雷达图示例

根据曲线特征参数模型的分析结果,可以得出各个负荷的异常用电概率,结合线路供带关系,可初步分析出造成线路高损的原因。筛选异常用电概率较高的用户,线损治理人员优先对这些用户进行用电检查,根据不同种类异常用电行为可以更具针对性的查找原因。

四、结论

根据系统导出的关口损耗电量信息和负荷用电量信息,结合电量曲线特征参数模型,可以运算得出各负荷存在异常用电情况的概率,进一步分析导致关口损耗电量增高(线损率增高)的负荷对象和异常原因。这可以有效辅助线损管理人员发现高损异常原因,锁定问题表计,制定合理降损方案。进而提升现场用电检查人员的工作效率和治理效果。