• 首页
  • 科学成果
  • 机器学习技术在智能电网数据分析中的应用-袁志辉博士

机器学习技术在智能电网数据分析中的应用-袁志辉博士

2021-10-13

智能电网以物理电网为基础,是一种面向未来的下一代可持续环保型电网,它建立在高速双向信息通信网络的基础上,融合了传感测量技术、通信技术、信息技术、计算机技术和智能决策控制技术等先进技术,能够保证电网的安全稳定高效运行。如图1所示,智能电网涵盖了发电、输电、变电、配电、用电和调度等各个环节,对电力市场中各利益方的需求和功能进行协调,在保证系统各部分高效运行、降低运营成本和环境影响的同时,尽可能提高系统的可靠性、自愈性和稳定性。它的主要特征包括满足客户用能需要、允许各种分布式的新能源发电设备入网、抵御攻击并进行故障自愈以及实现电力市场资源的按需配置等。数据分析是智能电网大数据处理的核心,由于大数据的海量、复杂多样、变化快等特性,大数据环境下的传统小数据分析算法很多已不再适用,需要采用新的数据分析方法或对现有数据分析方法进行改进。近年来,随着人工智能(Artificial Intelligence, AI)和大数据技术的快速发展,研究如何运用这些新技术和新理论来提升智能电网运营和管理的智能化水平也日益受到国内外学术界和工业界的广泛关注。其中,基于机器学习理论的智能电网数据分析技术便是该领域的研究热点之一,它涉及学科范围广,技术复杂度高,目前尚缺少系统方法论和行业标准。

 

图片1.png 

图1 智能电网示意图

 

机器学习理论是AI的一个重要子领域,它涉及到概率论、凸分析、矩阵论等多门学科,主要研究如何从数据中获取知识并用于决策推断,是实现AI的主要手段之一。按照训练样本提供的信息以及反馈方式的不同,机器学习大体上可分为监督学习、半监督学习、无监督学习和强化学习几类,如图2所示。这些技术目前广泛应用于各行各业。在智能电网环境下,需要依据具体的应用场景和智能电表数据的信息物理耦合特性并考虑机器学习算法的计算性能,交叉融合地运用各种分析方法,结合领域知识给予合理解释,以便提升服务分析的质量和效率。

 

图片2.png 

图2 机器学习的分类

 

智能电网的数据应用研究是一项系统性工程,具体的业务实现过程就是若干技术协同融合的结果。随着电力系统业务应用的进一步深化,智能电网数据分析对技术的性能和整合要求越来越高。近年来,为从智能电网数据中获取更准确、更深刻的理解,深度学习、深度强化学习、数据可视化等分析方法也成为智能电网数据分析的重要技术。深度学习是机器学习的重要组成部分,主要基于深度神经网络从原始数据中自动提取和选择高层次特征表达,学习模式包括监督学习、半监督学习和无监督学习。深度学习架构如循环神经网络、卷积神经网络和深度置信网络等目前广泛应用于计算机视觉、自然语言处理、语音识别、医学诊断等领域,并取得了与人类专家相当甚至超越人类专家的性能。深度学习的兴起主要得益于软件架构、硬件平台和大数据的支持。人工智能、机器学习和深度学习之间的关系如图3所示,实际上机器学习只是一种实现人工智能的方法,而深度学习则是一种实现机器学习的重要手段。

图片3.png 

图3 人工智能、机器学习和深度学习之间的关系示意图

随着未来电网的不断演化和升级,智能电网从投资规划到资产管理,从安全运行到经济运营的复杂性和不确定性日益加剧。利用机器学习算法抽象电网生产和决策过程并构建智能化学习模型,建立输入输出之间的逻辑映射关系,能不断减少人力和物力成本,而且能提升决策的准确度和效率。基于智能电网数据的机器学习算法可以带来全新的方法论和创新思想,不断提升我们对电网技术与商业运营的认知水平,并透视问题的本质。下面我们从以下三个方面介绍机器学习技术在智能电网数据分析中的应用。

一、机器学习技术在概率负荷预测中的应用

随着可再生能源和电动汽车的不断渗透,智能电网的不确定性和复杂性显著增加,使得维护系统的稳定性更具挑战性。因此,准确地量化未来负荷的不确定性对于电力系统的安全稳定运行十分必要。特别地,概率负荷预测对于电力公司在很多决策过程中如实时电价预测、需求响应和随机单元启停等都起到很重要的作用。不同于传统的点预测方法只输出一个期望值,概率负荷预测能提供分位数、预测区间或概率密度函数等来量化未来电力需求的不确定性。

目前,关于负荷预测技术的研究大概可分为两类:一是统计学习方法,二是机器学习方法。基于统计的方法主要学习目标变量和多个解释变量之间的关系,并采用拟合优度来描述统计模型与解释变量的拟合程度。统计方法需要专家知识来指导模型的学习过程,结果也具有可解释性,典型的统计模型如多重线性回归、自回归移动平均方法及其变体和指数平滑法,基于统计的方法需要较多时间来调整模型中大量的超参数,并且有过拟合的风险。另一方面,基于机器学习的方法可以看成是更高级的统计方法,适合处理非线性关系,仅需调整少量的超参数,因而对数据更加鲁棒,参数重配置更简便,对用户更友好,对处理非线性关系更有效,但它是一种黑盒学习方法,结果也缺乏可解释性,典型的模型如支持向量机、梯度提升、神经网络、分类回归树和K-近邻模型。

随着智能电表的广泛部署,越来越多的电表数据被收集起来,用于实施需求响应项目,使得用户级的负荷预测也越来越重要。相比于聚合后的系统级负荷时间序列数据,电表级数据的规律性不太明显,且呈现出较强的多样性和时变性,因此更加难以预测。最近,深度学习作为一种强大的机器学习技术而被应用于负荷预测中,目前这方面有很多学者和团队在进行研究,包括使用长短时记忆递归神经网络用于居民用户的短时负荷预测、采用池化的长短时记忆深度神经网络用于居民负荷预测、采用基于粗糙神经元的神经网络来处理数据中的不确定性、利用基于损失函数的长短时记忆神经网络用于客户的概率负荷预测、利用改进的深度残差神经网络用于概率负荷预测以及利用改进的分位数回归神经网络用于概率预测。以上这些研究都表明深度学习在概率负荷预测中具有广泛的应用。

二、机器学习技术在非侵入式负荷监测中的应用

非侵入式负荷监测是一项依据用户馈线功率信号来推断用户电器使用模式和运行状态的技术。目前有很多研究表明,基于细粒度的客户用电信息资料,可以使用非侵入式负荷监测技术来实现智能电网中需求侧的能量管理。

非侵入式负荷监测最初定义为一个从混合含噪观测信号中提取源信号的单通道盲源分离问题。由于多个家用电器的同时启停操作以及关于电器特有电气知识的欠缺,非侵入式负荷监测本质上是一个无法辨识的难题,目前有很多技术尝试来解决这个问题,如因子隐马尔可夫模型、图信号处理、K-近邻方法、深度稀疏编码和深度神经网络。总的来说,非侵入式负荷监测算法可以归纳为基于学习的方法(包括无监督、半监督和监督方法)和基于优化的方法。

最近,由于深度学习强大的特征表示学习能力而被应用于非侵入式负荷监测。有研究者验证了双向长短时记忆神经网络和卷积神经网络能够比组合优化方法或者因子隐马尔可夫模型取得更高的F1分数值。还有研究者提出一种基于卷积神经网络的序列到点的模型,该模型的输入是一个馈线输入信号序列,输出是一个电器的功率值。但是这些方法在同一时刻只能监测单个电器,不能同时监测多个电器的运行状态。由于标准的深度学习方法不能处理多标签学习问题,有研究者提出深度字典学习和深度变换学习用于非侵入式负荷监测。这些监督式深度学习方法都表现出了优异的性能,但是需要收集足够准确的训练样本,有时这种做法代价昂贵且不切实际。此外,尽管深度学习中的卷积神经网络和长短时记忆神经网络非常灵活和有效,但是这些深度神经网络的训练难度也随着隐藏层的增加而显著提高。因此,这些深度神经网络的层数都较少,从而限制了深度神经网络的特征表示学习能力。

当收集大量标注的训练样本后,实践表明深度学习能取得优异的性能。但是收集和标注大量的训练样本需要耗费大量人力和物力成本,代价也很昂贵,而且还可能涉及到隐私保护的问题,如收集负荷监测训练样本需要在每个电器上单独安装传感器,这是不现实的。标注大量医学图像的病灶样本需要耗费医学专家大量时间,互联网推荐系统中请求用户标注感兴趣的网页,但往往很少有用户愿意花时间提供标记。因此,“有标签样本少,无标签样本多”是一种学习常态。此时,半监督学习是一种能较好地利用无标签样本进行学习的解决方案。

(1)半监督学习

半监督学习能够同时利用标注样本和未标注样本。通常情况下,只有少量的标注样本,大量的未标注样本使得半监督学习方法能发现并学习数据中的潜在知识结构。因此,相比于监督学习,半监督学习模型能够在少量标注样本下取得较好的性能。最近,半监督学习也被应用于非侵入式负荷监测,有些研究者提出了一种半监督的自训练-近邻方法,另外的研究者提出了基于小波分析和协同训练的半监督学习方法,还有些研究者则提出了三种基于图的半监督学习方法。

(2)基于深度学习的特征提取

在非侵入式负荷监测的场景下,特征学习也受到了广泛的关注,这是因为特征是影响最终学习效果的重要因素,甚至在很多任务上比算法更重要。在实际的机器学习系统中,往往需要花费很多人力去尝试和设计不同的特征以及特征组合来提升系统的性能。由于小波具有多分辨率和时频定位特性,小波变换经常用于功率信号特征提取,但小波系数所提取的高频暂态特征的泛化性能有限。由于短时傅里叶变换能够保持信号的时域局部性质,有研究文献用短时傅里叶变换提取信号特征用于非侵入式负荷监测。还有文献利用延迟编码将功率信号转换为非侵入式负荷监测的多维时间滞后特征向量。最近,深度学习也由于其在模式识别、语音识别和计算机视觉这些领域取得了成功而应用于非侵入式负荷监测领域。深度学习能够自动融合特征表示学习和预测模型学习,而不需要人工干预。有研究者将深度字典学习和深度变换学习用于非侵入式负荷监测的监督式特征提取。还有些研究者将基于双向长短时记忆神经网络的自动编码器和卷积神经网络用于提取功率信号的高层次特征。但这些技术无法利用无标签的数据,这是因为它们只是监督式的学习方法。

(3)半监督深度学习

将深度学习同半监督学习结合起来既可以利用深度学习强大的特征表示学习能力又可以利用大量的无标签数据来降低标注成本。有研究者设计了一种无监督变换和稳定性函数用于学习无标签数据,并整合到损失函数中用于网络训练。还有研究者通过整合梯形网络和损失函数提出一种基于卷积神经网络的时域集成方法用于半监督图像分类。受到时域集成法网和Polyak平均的启发,有研究者提出一种基于卷积神经网络的均值教师方法用于半监督的图像分类。这些半监督的深度学习方法依赖于随机变换和正则化技术来利用无标签数据。以上这些方法都是使用二维卷积来提取图像的显著特征如尺度不变性来进行图像分类,因此不是很适合于时间序列信号的处理。

三、机器学习技术在微网能源管理中的应用

近年来,随着分布式能源如光伏发电、储能系统和电动汽车的普及,作为智能电网的有机组成部分—微网,可以利用先进的双向信息通信和能量控制技术来消纳分布式能源,为广大用户更加活跃的参与负荷管理提供了有效途径。用户可依据动态电价或者实时激励来调整可控负荷的消费模式以节能降耗和优化能效,该技术又称为基于需求响应的能源管理,目前受到了国内外的广泛关注。其中强化学习便是一种可行的能够进行微网能源管理的技术方案。

强化学习是机器学习的一个重要研究领域,主要研究智能体在与环境不断的交互过程中学习如何采取行动来获取最大累计收益的问题。在训练完毕后,智能体能够依据学习到的策略在未知的新环境中采取最优的行动。目前,强化学习在机器人、自动化,游戏等领域都取得了巨大的成功。与此同时,如何应用强化学习来设计智能电网中的需求响应项目也受到了广泛的关注。有研究者首先使用并讨论了强化学习方法在客户需求响应中的调度优化问题,还有研究者将此方法分解到电器设备级来取得更高的计算效能。有些研究者进一步将智能能量枢纽集成到客户需求响应管理中并启用实时能量监控来加速学习过程。有研究者将深度神经网络和强化学习结合起来形成深度强化学习用于经济高效的居民负荷调度控制,其中深度神经网络用于估计客户做出决策时得到的奖励,强化学习用于决定客户下一步的最佳行动。还有些研究者考虑了未来电价的影响,并将强化学习用于电动汽车的实时决策来最小化充电花费。有些研究者探索了新能源发电设备不断渗透的场景下深度强化学习应用于负载频率控制的可行性。有些研究者将深度强化学习应用于需求响应中的可中断负荷控制。有些研究者将深度强化学习用于配电网中的无功控制。有些研究者将多智能体强化学习用于协调调度多个电动汽车的充电决策问题以避免过载并降低充电花费。有些研究者将多智能体强化学习用于家用电器的可控负荷调度以节能降耗。还有些研究者将深度强化学习应用于存在负荷、电价和发电量这些不确定性情况下的多微网的需求响应。由于强化学习是一种数据驱动的技术,能够避免低效的学习,特别适用于各种不确定性情况下的复杂电网模型,因而对于解决智能电网的需求响应问题具有很大的帮助。

 

以上便是机器学习技术在智能电网数据分析中的三种典型应用,由前面的介绍和分析可知深度学习具有强大的数据分析、预测和分类能力,完全契合智能电网中大数据应用的需求,必将是未来机器学习应用于智能电网数据分析的一个热点研究方向。