基于自适应随机森林算法区域能源互联网的研究与分析

(整期优先)网络出版时间:2019-02-12
/ 2

基于自适应随机森林算法区域能源互联网的研究与分析

徐伟燕

(云南电网红河供电局云南红河661100)

摘要:现代社会各种能源的使用密切相关息息相关,对区域能源互联网进行相关的分析和研究显得尤为关键,可以引领能源模式走入一种全新的模式,开拓能源互联网新时代。本文借助计量自动化系统提供的大量电力负荷数据,基于用户群体分析与识别,分类随机森林算法、自适应分类随机森等大数据技术对负荷进行预测,并对不同行业和部门,不同能源结构进行深入的分析与研究与探讨。本研究帮助我们对区域能源互联网进行深入的解读,自适应随机森林算法对负荷预测的精准性有了很大的提高;为云南电网在区域能源互联网的应用贡献出宝贵的理论经验和技术支撑。

关键词:大数据技术;负荷预测;能源互联网;多能源系统;

0引言

伴随着互联网技术、新能源技术的高速发展与能源结构的转型升级,传统的能源结构已经不能满足现代社会的发展需要,化石燃料的枯竭,新能源应用的整合面临着改革。所以在电力领域开展区域能源互联网关键技术的研究和应用已经迫在眉睫。对其进行相关的分析和研究对节省能源,新能源接入电力系统以及提升电力系统智能化管理起着催化和推进的作用。进一步促进发用电的供需平衡.

1区域能源互联网的研究与分析

1.1区域能源互联网的分析

户内热源、房屋均价以及面积等可以帮助我们对电力用户的能源需求及潜在能力做详细的分析研究,并对能源需求结构进行分类;互联网购买能源行为、历史负荷曲线、用户信用等级等则反映了用户的能源需求能力以及实际的能源消费量,可以帮助我们对用户的消费习惯、能源结构进行分析研究。采用计量自动化系统海量的用电负荷、用电量等数据,结合外部经济、气象数据,用能数据。采用大数据技术开展居民用电消费习惯分析。并对红河当地居民的用电负荷进行预测,具体分析逻辑图如图1,不仅为区域能源互联网辅助决策提供数据支撑,客户需求侧响应,削峰填谷也得到了改善。

图1能源互联网三层构架图

2数据的挖掘与分析的意义

以云南红河州地区部门用户的用电数据为基础,以新计量自动化系统为支撑,采用大数据分析和预测算法,对居民用电消费习惯进行分析。研究居民日户均用电量、用电负荷与最气温的相关性分析,并对居民的用电习惯差异进行属性分析;在此基础上,综合考虑节假日因素、自然增长因素、突发因素等,构建居民用电负荷预测模型,为电力用户需求侧响应、负荷预测、引导削峰填谷提供技术支撑。通过搜集能源生产、消费、传输、存储等信息数据,凭借数据分析、能源协调与优化调度机制满足域内用户的负荷需求,通过能源需求预测、需求侧响应等信息挖掘技术指导能源生产和调度。

3算例分析

本课题选择云南红河州一地区居民用电消费数据为样本,主要包括用电量、用户编号、时间、负荷值等相关数据。电能计量自动化系统采集的电能量数据每15min采集一次,本实验选取一天内采集的电力负荷的最大值进行研究分析。外部数据主要为气象数据以及用户用电行为数据。

3.1基于自适应随机森林算法的用电负荷预测

电网负荷由众多用户负荷构成,在负荷预测中,时样本数据量的大小直接影响着预测精准度。对红河地区用户构建大数据的负荷预测模型,系统将数据分析全过程完全固化,并自动采集全量数据,实现对未来7天负荷的自动预测和动态更新。Adaboost[13]算法、随机森林算法[16]的分类性能差不多,拟自适应分类随机森林算法如下:

第1步,对Adaboost算法进行S次运算,记录S次的抽样权重向量,S=1,…,S。

第2步从中等概率选择抽样权重向量,以为在抽样权重向量,有放回从L中抽取和L大小相等的自助抽样训练集,以为训练集,随机变量划分分类树为基学习器模型,得到基学习模型,i=(1,...,m)。

计算

,,,i=1,...,m(3)

负荷预测在基于大数据背景下,发现这些数据呈现一种相关性、周期性、延续性等特点,查阅大量文献并在研究的基础上发现这些特点确定为样本属性,分别是以下信息:气温、星期、是否周六日、上月同时期负荷、降雨量、上周同时期负荷、昨天负荷、预测负荷。本研究结果采用以下算法评价指标,定义为MAPE,表达式如下:

(5)

其中为真实值,为预测值,n为预测点的个数,MAPE值越小,表明预测值越精确。

本研究将自适应随机森林算法与传统随机森林算法进行比较,以云南红河地区18年5月10号至6月10号的部分历史数据为训练样本数据集,训练自适应随机森林算法与传统随机森林算法来对6月11号的负荷进行预测,多次实验后以平均值来作为最终的结果,利用MAPE来对其进行评价,结果表明。自适应随机森林算法的MAPE为1.43%而传统随机森林算法的MAPE为2.12%,自适应随机森林算法的预测精度明显较高,这是因为自适应随机森林算法具备传统随机森林算法的优点的同时又克服了传统随机森林算法的一些缺陷。

表2拟自适应分类随机森林算法比较

Table2ComparisonofQuasi-adaptiveRandomForestClassificationAlgorithms

4结语

基于互联网和云南红河计量自动化系统开展区域能源互联网的实验分析,对实现多能互补,多种能源优化配置,优化资源利用,节约能源,提升资源配置,建立能源网络,给消费者提供更优质的能源服务;满足客户多种能源需求,其次利用了大数据技术进一步提高了负荷预测的精准性,为区域能源互联网的建立、客户侧需求响应提供了更科学规范、更有预见性的建议和措施。对于电网以用户为中心实施基于互联网的精准营销、制定需求响应策略、制定了更加详细的实时电价,充分引导用户优化用能策略。

参考文献:

[1]BreimanL.Someinfinitytheoryforpredictorensembles[R].TechnicalReport579,UniversityofCalifornia.DepartmentofStatistics,2000.

[2]张良均,陈俊德,刘名军,等.数据挖掘应用案例分析[M].北京:机械工业出版社,2013.

[3]李克强.政府工作报告—2015年3月5日在第十二届全国人民代表大会第三次会议上[Z/OL].http://www.gov.cn/guowuyuan/2015-03/16/content_2835101.htm.

[4]QuinlanJR.Bagging,boosting,andC4.5[A].In:ProceedingsoftheThirteenthNationalConferenceonArtificialIntelligence,725-730[C].Cambridge,MA:AAAIPress/MITPress,Portland.

作者简介:

徐伟燕(1987-),女,工程师,硕士研究生,云南曲靖人,从事电能量数据管理、电力负荷控制的相关研究与应用工作。