基于大数据的台区同期线损辅助分析技术管理创新研究

(整期优先)网络出版时间:2018-12-22
/ 2

基于大数据的台区同期线损辅助分析技术管理创新研究

焦东翔杨磊

(国网冀北电力有限公司秦皇岛供电公司河北省秦皇岛市066000)

摘要:随着电力体制改革不断深入,供电经营管理和电力营销正面临新的形势,对外是树立形象、开拓市场,对内是强化素质、加强管理,线损是一个供电企业经营管理过程中一项综合性经济技术指标,是供电企业经营管理工作重要组成部分。从实际业务开展情况及数据采集情况分析,引起台区线损异常的因素非常多,在线损治理和异常原因排查过程中,各类因素逐一排查必然费时费力。基于大数据的台区同期线损辅助分析技术管理创新是针对台区同期线损不可算、高损、负损基于海量数据,采用随机森林和决策树算法进行建模分析,归纳影响线损关键因素指标,针对性开展治理工作,实现企业线损有效治理并达到长治久安提供有力支持。

关键词:线损;台区;同期;建模;

0引言

线损是供电企业经营管理过程中一项综合性经济技术指标,是供电企业经营管理工作的重要组成部分。从实际业务开展情况及数据采集情况分析,引起台区线损异常的因素非常多,在线损治理和异常原因排查的过程中,将各种因素对应逐一检查必然费时费力,如何有针对性的,有优先级的进行异常原因的排查,快速定位异常因素显得尤为重要且迫切。因此,可以通过收集和分析历史台区日/月线损数据,以及从业务角度梳理的各类会影响线损的指标数据,采用大数据的分析方法和技术,构建有监督的机器学习模型,挖掘引起线损异常的关键因素,为实现企业线损有效治理并达到长治久安提供有力支持。

1业务分析

大数据技术与业务相融合,数据挖掘与专家经验取长补短,相得益彰,是做好线损异常关键因素分析的核心。业务专家基于业务经验为台区线损异常溯源指明了方向,为大数据技术应用打造了充分发挥其技术优势的土壤与环境;大数据技术针对具体问题具体分析,从中精确定位出具体原因,并量化异常嫌疑度,弥补人工经验在诊断过程中不精确、不确定、无依据等短板。业务与技术有机结合,人工与机器相互补充,为台区线损治理打造智慧大脑。

台区线损异常问题分析总体思路:

3数据分析

线损治理是一个长期持续的过程,导致线损出现异常的原因非常多,不同的原因都隐藏在用电服务的各环节,而且离散度非常大,想要通过传统的指标统计和监测手段,定位线损异常的关键原因,难度很大。因此需要大数据建模的手段,将碎片化、隐性化的问题显性化。

构建线损异常大数据模型总体思路:

首先构建多层级线损异常业务指标体系,为线损异常分析提供业务支撑;

第二基于业务体系,以台区为单位开展业务指标数据收集以及线损异常样本收集,为开展数据挖掘分析提供数据基础;

第三对收集的原始数据进行观测,根据数据质量及特征分布,对原始数据进行数据插补和数据清洗,为构建大数据分析模型做准备;

第四以抄表异常、电能表异常、用电规律异常等业务大类为单位,分别构建大数据分析的机器学习模型,分析各业务大类下的异常因子对线损异常的影响程度;

第五逐层递归的将各业务大类进行组合,开展模型训练,直到模型准确率和覆盖率达到最优为止。对比各组合下模型准确率和覆盖率,确定对线损异常影响程度最主要的业务大类;

第六应用数据挖掘手段,分析业务大类下不同的异常因子挖掘线损异常的贡献度,从而提取线损异常的关键影响因子;

第七由于不同因子对线损异常的影响都是隐性化、碎片化的,为了将因子影响显性化,需要利用相应的数据挖掘算法将不同因子对线损异常的影响规则化,为线损异常的分析及治理提供参考。

4建模分析

4.1建模流程

图1建模流程

注:由于不可算台区数据结构和内容都比较简单,不适合做复杂建模分析,因此根据统计学原理进行分析,统计分析不可算原因分布,估算不可算原因概率大小。

4.2建模过程

4.2.1逐层递归效果

1.单一分类分析各类因子对线损异常的影响

通过业务分析对影响线损的各类因素进行分类,并细化指标,以下为高损和负损指标分类。

按照异常分类,运用机器学习的有关方法,判断线损类别、异常原因,逐层探索异常原因与线损之间的关联性。

2.分析各类因子多分类组合对线损异常的影响

运用随机森林的算法,以是否线损为因变量Y,以不同分类组合下的两类因子指标为自变量X,分别得到不同分类组合下的查全率及查准率,以此分析不同分类组合下的两类因子对线损异常的影响。

4.2.2提取线损异常关键影响因子指标

图2高损随机森林算法

图3负损随机森林算法

确定影响线损主要因子后,基于随机森林算法,通过算法中的MeanDecreaseAccuracy和MeanDecreaseGini2个指标评判模型中各指标重要程度,以此提取线损异常的关键影响因子指标。

4.2.3挖掘关键因子指标影响线损异常的判断逻辑

图4高损关键因子挖掘

图5负损关键因子挖掘

挖掘出影响线损关键因子指标后,运用决策树算法,将异常影响线损的判断逻辑用树状图及判断规则,以此挖掘关键因子指标影响线损异常的判断逻辑。

4.2.3分析问题

对比线损分析结果,归纳总结关键因子产生的主要原因,辅助于台区线损治理。

参考文献:

[1]《国家电网公司关于印发加快推进“互联网+”营销服务应用工作实施方案的通知》(国家电网营销〔2016〕652号)

[2]晋中电网线损分析及线损管理研究[D].王程.华北电力大学(北京)2017

[3]随机森林方法研究综述[J].方匡南,吴见彬,朱建平,谢邦昌.统计与信息论坛.2011(03)