城市发展研究杂志论文格式要求
2.1 篇幅与格式
论著、综述等文稿,包括图、表在内,字符数一般不超过10000字,字数以6000-8000为宜。论著一般应包括:题目、作者姓名、作者单位(包括单位名称、单位所在省份和城市、邮编)、中英文摘要、关键词、正文、图表、参考文献、第一作者简介(包括姓名、出生年份、性别、学历、职称和从事的专业和负责与编辑部联系的通讯作者简介(包括的姓名、学历、职称、从事专业及E-mail地址),以及产生论文的研究基金项目名称和项目编号。
2.2 题目
应简明、确切、有特异性,便于编制题录、索引和检索。一般不超过20个字。 中文题目中不得出现英文。
2.3 署名
应只限于选定研究方案,直接参与全部或部分研究工作和撰写论文,并对该论文有答辩能力的人员,按贡献大小排列。最多署5位作者姓名.英文摘要中,作者姓名的中文拼音,姓在前,名在后,姓的字母全部大写,名的第1个字母大写,双名者中间无连字号。
2.4 摘要
论著应有中英文摘要,中文字数控制在300-400字之间,位于作者单位与正文之间。
2.5 关键词
一般3~6个,应按《汉语主题词表》转换成规范语言,必要时可用自由词作补充。关键词之间用分号隔开,写在摘要的下方。
2.6 中图分类号
为便于文章的分类与检索,按照《中国图书馆分类法》,标明文章的中图分类号。
2.7 正文层次序号
不宜过多,一般为3级,最多不超过5级。各层次一般应用阿拉伯数字连续编号,如“1”、“2.1”、“3.1.1”等。
2.8 数字的用法
以GB/T 15835 1995《关于出版物上数字用法规定》为准。凡是可以使用阿拉伯数字而且又很得体的地方,均应使用阿拉伯数字。
2.9 计量单位
应严格执行国务院于1984年2月27日发布的《关于在我国统一实行法定计量单位的命令》。
2.10 缩略词
凡已被公认的缩略词可不加说明而直接引用。例如:CBD、GIS等。不常用的、新兴学科的缩略词,在文中首次出现时应附原词。
2.11 表格与插图
均应少而精,设计正确,使人容易看懂,并按顺序附在正文内。表格应按统计学制表原则,采用三线表,标明序号和表题,表中同一项目保留小数的位数应一致,上下行位数要对齐。线条图要求图面清洁、线条清晰、粗细均匀、比例得当;尺寸一般应略大于实际制版大小。照片图应提供原始照片,对比度要好,在其背面写上图号,标明方向。插图的序号和图题列于图的下方。表格与插图的题目需用中文表达。
2.12 参考文献
论著、综述列出的文献仅限于作者直接阅读过的文章,且以引用近期发表的论著为主,未公开发表的不宜引用(必要时可在文中加注说明),已肯定将被公开刊物采用者可注明“待发表”。参考文献按文中引用先后编号,附于文末,并在文中引用处右上角用阿拉伯数字加方括号注明。中文参考文献应以中英文表述。文献书写格式举例:
文献类型,根据GB3469-83《文献类型与文献载体代码》规定,以单字母标识:
M——专著(含古籍中的史、志论著)
C——论文集
N——报纸文章
J——期刊文章
D——学位论文
R——研究报告
S——标准
P——专利
A——专著、论文集中的析出文献
Z——其他未说明的文献类型
电子文献类型以双字母作为标识:
DB——数据库
CP——计算机程序
EB——电子公告
非纸张型载体电子文献,在参考文献标识中同时标明其载体类型:
DB/OL——联机网上的数据库
DB/MT——磁带数据库
M/CD——光盘图书
CP/DK——磁盘软件
J/OL——网上期刊
EB/OL——网上电子公告
参考文献著录格式
1 、期刊作者.题名〔J〕.刊名,出版年,卷(期)∶起止页码
2、 专著作者.书名〔M〕.版本(第一版不著录).出版地∶出版者,出版年∶起止页码
3、 论文集作者.题名〔C〕.编者.论文集名,出版地∶出版者,出版年∶起止页码
4 、学位论文作者.题名〔D〕.保存地点.保存单位.年份
5 、专利文献题名〔P〕.国别.专利文献种类.专利号.出版日期
6、 标准编号.标准名称〔S〕
7、 报纸作者.题名〔N〕.报纸名.出版日期(版次)
8 、报告作者.题名〔R〕.保存地点.年份
9 、电子文献作者.题名〔电子文献及载体类型标识〕.文献出处,日期
实例:
1、对于科技期刊文献:
焦怡雪,刘涌涛. 寻求历史保护与社区发展的融合—历史文化街区保护与改善的社区发展途径探讨[J]. 重庆建筑大学学报,2008,30(4):33-37.
2、对于报纸:
胡锦涛. 高举中国特色社会主义伟大旗帜,为夺取全面建设小康社会新胜利而奋斗——在中国共产党第十七次全国代表大会上的报告[N]. 人民日报,2007-10-15(1).
3、对于书籍:
纪晓岚.论城市本质[M]. 北京:中国社会科学出版社,2002:3.
4、英文科技期刊文献:
Harry Markowitz. Portfolio Selection [J].The Journal of Finance,1952,7(1):77-91.
2.13 其他: 来稿不得一稿多投。本刊对稿件有权删改。稿件一经刊用,即酌付稿酬并赠当期刊物2册。
进入期刊首页作者:余光正, 信德政, 吕辉清,常云佳,杨晓健
作者单位:上海电力大学
关键词:风电功率预测;相似性度量;多源迁移学习;自适应;新建风电场站;小样本
摘 要:【目的】随着能源消耗的持续增长,以风能为代表的清洁能源装机容量正在稳步提升。然而,新建风电场站数 据匮乏导致无法对其进行精确建模,同时还存在伴随场站场景数据发生动态更新,难以捕捉时变特征等问题,给风电 功率精准预测带来了极大的挑战。【方法】提出一种针对新建风电场站数据匮乏场景下的风电功率预测方法。首先,采 用基于堪培拉距离和动态时间规整算法相结合的相似性度量方法,以高效挖掘多个与目标新建场站相似的源域场站; 其次,通过筛选后的源域场站风电数据建立基于多源迁移学习扩张卷积神经网络与双向长短期记忆神经网络(dilated convolutional neural network- bidirectional long short term memory,DCNN-BiLSTM )的预训练模型,以利用多个相似源域 场站数据经验知识对目标新建风电场站进行迁移学习,避免目标新建风电场站过于依附单源域数据;在此基础上,为 了深度挖掘时变场景数据对预测结果的影响,提出一种结合在线自适应模块的预测方法,建立考虑数据匹配更新自适 应与考虑权重更新自适应的两种模型自进化方式,对在线自适应模块中的基本预测模型与在线模型的输出结果进行 加权,实现新建风电场站的短期风电功率预测。【结果】以中国西北某风电场站集群数据为实例验证了所提方法能够优 越地对源域风电场站数据进行筛选,同时进行更为精准的功率预测。【结论】文章所提方法为解决有限信息背景下电力 数据匮乏问题提供了可行的解决方案,并有望进一步扩展该方法的应用范围。
0 引 言
在发展以新能源为主体的新型电力系统背景 下,扩大以风电为代表的清洁能源消纳比例,构建低 碳安全高效能源体系是实现我国“双碳”目标的重要 举措之一[1] 。目前,我国风力发电行业进入快速发展 的阶段,风电前景持续繁荣[2] 。截至2024年10月底, 我国风电累计装机 4. 8 亿 kW,同比增长 19. 8%。由 于新建风电场站运行数据有限,难以直接采用目前 流行的经典人工智能方法对其发电功率进行预测[3] , 同时场景数据[4] 由于动态扩充[5] 而无法及时参与建 模,使得新建风电场无法进行精准的功率预测。因 此,在大规模新建风电场站运行数据匮乏的背景下[6] 对其发电功率进行准确的预测具有重要意义和工程 应用价值[7] 。
目前,国内外对样本数据匮乏问题已进行较多 研究[8] ,主要分为:一是从数据扩充[9] 的角度对样本 进行增强以实现预测建模;二是利用相似度较高的 历史数据[10] ,结合迁移学习[11] 的方法进行预测。在 数据增强方面,文献[12]为解决信贷数据集中小样 本问题,提出一种基于极限学习机的方法,该方法将 隐空间特征进行线性插值再生成虚拟样本。文献 [13]提出使用变分自编码器作为数据生成模型,帮 助解决回归预测中的小样本问题。文献[14]使用生 成对抗网络生成时间序列数据,实现了扩充寒潮场 景下时间序列数据量的目的。文献[15]提出的时间 序列生成对抗网络通过训练一个额外的神经网络, 将时间序列映射为向量嵌入,生成器输出嵌入的序 列。在迁移学习方面,文献[16]采用动态时间规整 算法对源域数据进行了相似性判别,将相似度较高 的数据利用迁移学习引入贫资料地区的小水电出力 建模,通过提取公共知识,微调网络参数将训练模型 外推到数据稀缺的目标小水电中。文献[17]提出一 种 基 于 卷 积 -长 短 期 记 忆 神 经 网 络(convolutional neural network- long short term memory,CNN-LSTM) 的 迁 移 学 习 模 型 ,多 个 并 行 卷 积 神 经 网 络 (convolutional neural network, CNN)分别与长短期记 忆网络(long short term memory,LSTM)连接,提取相 邻风电场的气象和时间特征信息,从而建立准确的 风电场风功率预测模型。文献[18]提出了一种新的 LSTM 和多核最大均值差域自适应的多源迁移学习 能量预测模型。以上方法解决了样本量稀缺所带来 的难题,但目前在风电功率预测领域采用小样本技 术时,仅仅采用样本扩充的方法难以考虑到数据的 时序变化,面对新建风电场站数据的不断丰富,难以 发挥真实样本数据优势。因此,若对时变数据不断 更新并充分发挥不同时序段优势[19] ,建立迁移学习 模型,将极大提高模型的泛化性能[20] 与预测精度。
在线学习是一种适应数据分布变化的机器学习 方法,其核心思想在于将在线学习框架与神经网络 相结合,使模型能够适应传入的实时数据并更快地 收敛以提高模型的自适应能力[21] 。文献[22]提出了 一种基于在线学习框架和非线性映射函数的二进制 分类方法,引入了非线性嵌入的思想,提高了模型的 适应性和泛化能力。文献[23]提出了一种用于视觉 跟踪的多专家在线学习方法。它充分利用了当前和 先前跟踪器的专家知识,提高了模型的跟踪性能。 文献[24]提出了一种新的在线迁移学习方法,为了 避免传统在线迁移学习方法的负面影响,去掉权值 单元,增加了两个数据缓冲区,以分离预测和更新过 程 。 文 献[25]采 用 表 达 能 力 更 强 、效 率 更 高 的 Transformer 模型替代 LSTM 模型,以提高准确性并节 省训练时间,通过自适应学习方法解决负荷分布变 化和历史负荷数据不足的问题。文献[26]与文献 [27]使用参数迁移学习与多任务学习的信息共享机 制,均实现了多位置风电场的风速预测。但以上方 法采用的迁移学习方式是传统的“端对端”的迁移学 习模式并未充分利用其他源域的优势知识[28] ,难以 客观准确地体现多源域对于迁移目标的影响。对于 临近的多个风电场站,不同时段的数据均有益于目 标新建风电场站模型的学习。本文探究多源迁移学 习在新建风电场站中的应用,通过赋予多源域不同 权重,伴随数据更替进行动态自适应,以实现目标新 建风电场站功率的精准预测。
本文针对在有限信息背景下新建风电场站数据 稀缺的问题,提出了一种基于多源自适应策略的风 电功率预测方法。首先,对于源域风电场站与目标 域新建风电场站数据,利用堪培拉距离和动态时间规整算法建立相似度判别标准,对数据进行子段划 分,提高时间序列利用率。其次,构建基于多源迁移 学习扩张卷积神经网络与双向长短期记忆神经网络 (dilated convolutional neural network- bidirectional long short term memory,DCNN-BiLSTM)模型,对相似 度较高的数据场站分别建模,实现“多端对一”的迁 移学习策略,充分汲取多源域知识经验。最后,面向 不断更新的时变风电场站数据,引入在线学习模块, 建立考虑数据匹配更新自适应与考虑权重更新自适 应两种模型自进化方式,提高模型的泛化能力。
1 问题描述及整体框架
1. 1 问题描述
作为同一风电集群的各风电场站之间发电特征 呈现出时空相似性,如图1所示。由于不同地理位置 的差异性,作为强相关因素的风速气象因素在不同 风电集群对风电出力的影响也极为不同。而身处同 一集群的不同风电场站,虽建厂规模不同,但因占据 相同的地理位置,其发电特征会呈现相似的时空规 律和相通的公共知识。

即使同为某一风电集群的风电场站,各自风电 场站数据的完备程度却有所不同。作为已经投运多 年的场站,其重要的风能资源监测数据、运行状态监 测数据、运行记录数据、风电场基础信息数据较为完 整,足以支撑风电出力的预测建模,可作为优质的数 据知识库[29] 。而对于建场初期的新建风电场站,由 于数据信息匮乏,即使采用临时的人工检测数据也 难以对其出力进行精准预测。
新 建 风 电 场 站 的 短 期 数 据 隐 含 了 其 发 电 特 征[30] ,而优质的风电场站数据所构成的知识库中隐 含了二者中共有的相似发电特征[31] ,将其应用在迁 移学习方法当中,可弥补新建风电场站难以建模的 缺憾。对于多源域场站,每个场站数据均有可借鉴 的经验知识,同时伴随数据的采集更新,短期数据在 动态变更,二者中潜在联系也在发生变化,依此采用 多源域视角动态挖掘不同场站对新建场站的预测影 响将极大提高新建场站建模的自适应性。
1. 2 整体框架
为解决新建风电场站因为数据驱动的建模困难 问题,提出一种基于多源 DCNN-BiLSTM 在线迁移学 习的集成算法,其总体流程如图2所示。其主要分为 3个阶段。
阶段1实现对源域数据的预处理,建立基于堪培 拉距离与动态时间规整算法的度量方法,将数据进 行多维时序分割,不同时序段赋予不同权重,提高知 识迁移率,通过计算相似度值对原有风电集群进行 源域风电场站的摘选,以减少数据的“负贡献”。
阶段2完成对发电数据特征的提取,通过DCNNBiLSTM对摘选出的多个源域场站数据并行在空间与 时间维度上的特征进行提取,形成多源预训练模型, 提高多源知识利用率。
阶段 3 提高动态数据下预测模型的泛化和自适 应性,引入在线自适应模块。该模块由多个基础模 型与一个在线模型组成,基础模型在经过源域数据 的预训练之后获取特定的经验知识,在线模型(与基 础模型具有相同的结构和随机初始化的权重)获得 当前的功率预测结果,分别对新建风电场站数据进 行参数微调。通过以加权方式集成多个基础模型来 持续更新在线模型,以避免预测误差的积累。
2 源域风电场站数据选择
源域和目标域越相似,源域的知识就越能传 递到目标域,从而不会产生负迁移。新建风电场 站建模问题亦然,作为建厂多年的风电场站,其历 史气象数据与功率数据资源丰富,可作为迁移对 象,但源域风电场站与目标新建风电场站必须存 在足够的相似性,当源域风电场站选取不恰当,往 往会存在“负迁移”。作为数据的前置处理,进行 域相似度判别从而挑取合适源是迁移学习不可或 缺的一部分。作为传统手段的欧氏距离方法虽然 具有计算简单的优点,但对奇异点非常敏感,这对 时间序列的相似性度量产生了负面影响。为了克 服欧氏距离的缺点,本文提出堪培拉距离方法[32] 以减弱奇异点的影响,显著提高相似度搜索的效 率和准确性,但一旦发生时移和翘曲,测量效果就 会变得很差,并且堪培拉距离方法并未考虑到样 本变量间的相关性。基于动态时间规整算法[33]计算复杂度较高,但它可以将两条不同时间长度的 时间序列数据段进行非线性映射,使波形形状相 似处的点对应起来,从而有效计算非等长数据段 之间的相似度,弥补堪培拉距离所带来的弊端,同 时结果具有很好的鲁棒性。因此为了提高源域与 目标域的相似程度,提出基于堪培拉距离和动态 时间规整算法相结合的数据选择方法以优化新建 风电场站建模数据的前置处理。

2. 1 相似性度量原理
计算两个时间序列的堪培拉距离可以表达它们 的相似度。堪培拉距离定义表达式如下:

式中:DC (⋅)为堪培拉距离;A,B 为互不相同的时间序 列;n为时间序列分辨度总数;i为第 i个时间分辨度; ai与bi为时间序列子元素。 动态时间规整算法对时间轴进行局部缩放,使 两个序列的形态尽可能一致,获得最大可能的相似 性,即规整距离,其解决了两个枚举所有组合找出失 真距离最小组合的耗时问题。
动态时间规整算法可 以得到最小规整距离和相应的规整路径。对于两个 序列 A 和 B,从一个 n×m 矩阵开始,其中 W 表示动态 规整路径 (W = (W1,W2,⋅ ⋅ ⋅,WN ),WN = (i,j) ),WN 表示 矩阵中时间序列子元素的规整路径,D(i,j) 表示对齐 端点(a0,b0 )和(ai ,bj )之间规整路径的最小扭转距离, Ddistance (i,j) 表示ai和bj的欧氏距离。时间动态规整非 线性映射如附录A图A1所示,这里有3个约束距离:
1)端点对齐:规整路径必须以 wi = (0,0) 开始, 以wN = (n - l,m - l) 结束,l为矩阵边界点。
2)连续性:若式中当前规整路径位置为 wN - i = (i',j'),那 么 下 一 个 位 置 wN = (i,j) 必 须 满 足 (i - i') ≤ 1,( j - j') ≤ 1。这就保证了两个序列中的每 个坐标都被标记在一个规整路径上。
3)单调性:如果当前规整路径位置为 wN - i = (i',j'),那么下一个位置wN = (i,j) 必须满足0 ≤ (i - i') 和0 ≤ ( j - j')。这样两个序列就不会交叉匹配。
综合以上三个约束,可以得到计算规整距离的 公式,如式(2)所示:

2. 2 基于堪培拉距离和动态时间规整算法相 似性度量方法
本文提出一种基于堪培拉距离和动态时间规整 算法(dynamic time warping,DTW)相结合的相似度度 量方法,流程如图3所示。

首先将多风电场站源域的功率数据以及气象数 据进行分割,对分割后的时间序列子段分别赋予不 同的时间特性权重,时间序列子段越接近临近时间, 权值越大。对于时间序列X = ( x1,x2,⋅⋅⋅,xn ),每个因素 在ω1到ωN的尺度上被赋予权重,其中ω1 < ω2 < ⋅⋅⋅ < ωn 且ω1 + ω2 + ⋅ ⋅ ⋅ +ωn = 1,即:

假设样本时间序列 X = ( x1,x2,⋅ ⋅ ⋅,xn )的时间序 列分辨度总数为 n,i 为第 i 某个时间分辨度,权重数 为k,对于权重序列:

k 值越大,后面部分的权重就越大,可以反映时 间特性。
其次,将堪培拉距离嵌入动态时间规整中,不仅 可以消除奇异点的影响,而且可以处理时间偏移和 扭曲。具体地,利用堪培拉距离来构造加权序列X' = ( x′ 1,x′ 2,⋅ ⋅ ⋅,x′ n )和Y' = ( y′ 1,y′ 2,⋅ ⋅ ⋅,ym′ )之间的动态时间 规整矩阵,即:

式中:pk 代表嵌入堪培拉距离的动态时间规整算法; x,y为用于计算相似度的两条时间序列。
定义基于堪培拉距离和动态时间规整算法的相 似度dCD为:

计算每个源域风电场站时间序列数据子序列与 目标新建风电场站数据之间的相似度值,将相似度 较高的子序列作为可迁移的数据片段,从而减少低 价值率的时间序列对迁移过程造成的“负贡献”,优 化迁移数据的前置处理。
3 多源自适应迁移学习预测模型搭建
3. 1 多源DCNN-BiLSTM预训练模型设计
3. 1. 1 扩张卷积神经网络
在CNN中,卷积核的数量充当“过滤器”,将它们 的权重与给定内核窗口中的输入进行卷积。然而, CNN 的感受野随着层数线性增长,限制了捕捉长期 特征的能力[34]。因此,本文将扩张卷积神经网络 (dilated convolutional neural network,DCNN)架构引入 特征提取,以捕获长期关系。与传统的CNN相比,扩 张卷积被应用于内核中具有明确间隙的输入序列, 其可以被公式化为:

式中:K 和 M 分别表示核大小和输入通道数,分别对 应输入变量的维数;x ∧ n,t表示第n个通道在第t个时间 步长的输出;kn,i是第i个核系数;xm,t表示第m个通道 在第 t个时间步长的输入;扩展值 d 控制扩展卷积覆 盖比核大小更长的卷积接受野,如果膨胀值等于 1, 它将恢复为标准卷积操作。DCNN 的工作原理如附 录 A 图 A2 所示。随着卷积层数的增加,DCNN 的感 受野呈指数级增长。此外,膨胀尺寸d的本质增长导 致了更广泛的接受野。与具有相同层数的传统 CNN 结构相比,DCNN 具有相当大的接受场。DCNN 结构 有效降低了特征提取的复杂性,同时保证了长期信 息的学习。
3. 1. 2 双向长短期记忆神经网络
双 向 长 短 期 记 忆 神 经 网 络(bidirectional long short term memory,BiLSTM)[35]的意义在于更准确地 提取时间特征。单向 LSTM 仅利用先前的信息来预 测后续信息,而 BiLSTM 使用两个单独的隐藏层同时 在向前和向后两个方向上学习。可以认为,关于前 向和后向的信息在风电功率预测中都起着突出的作 用。从两个方向的提取提高了信息量和稳定性,特 别是对于高度波动的序列。BiLSTM的工作原理如附 录A图A3所示。

式中:hf t表示前向 LSTM 在时间步 t的隐藏状态;hb t 表 示后向 LSTM 在时间步 t 的隐藏状态;GLSTM 表示传统 的LSTM函数;Whf、Whb分别是前向隐藏序列和后向隐 藏序列的权重;f表示遗忘门的激活值;b表示BiLSTM 输出层的偏置。
BiLSTM 可 以 有 效 处 理 时 间 序 列 数 据 ,但 是 BiLSTM 缺乏对交叉特征的学习能力,无法较好地处 理风电功率预测时的多维影响因素,而DCNN无法处 理风电功率的时序特性。为充分发挥两种模型的优 势,将两者结合起来形成 DCNN-BiLSTM 混合神经网 络模型,使预测模型可以从历史电力数据和气象因 素中提取显著特征,并挖掘出隐藏在历史趋势中的 时空特征。
3. 1. 3 多源预训练模型构建
针对新建风电场站的场景,基于迁移学习方法 的性能改进很大程度上取决于源域和目标域之间的 数据分布。当源域和目标域之间存在较大的域漂移 时,单一的基于神经网络的建模可能会导致欠拟合 或过拟合,同时容易忽略各因素之间的耦合关系,从 而影响预测模型的准确性。实际应用中,可以利用 从多源领域中学习到的知识和内部关系来提高目标 任务的预测性能。鉴于此,本文提出一种多源迁移 学习引导的集成 DCNN-BiLSTM 方法来提高多源数 据的优势性,结构如图4所示。
首先,计算风电集群中新建风电场站与各候选 源风电场站的气象数据、功率数据之间的相似度。 对于新建风电场站,其与候选源风电场站的相似度 值越小,其发电行为越相似。利用基于堪培拉距离 和动态时间规整算法对集群中的所有风电场站进行 核对后,确定最终源风电场站集合 Sbasic。然后利用 Sbasic 的 历 史 气 象 数 据 与 功 率 数 据 分 别 对 DCNNBiLSTM训练得到初始预测模型。对于Sbasic的源风电场站及其对应的初始预测模型 DCNN-BiLSTM-S-V, 其 中 V 表 示 Sbasic 中 源 风 电 场 站 的 数 量 , DCNNBiLSTM-V 的输入分别为 Sbasic 的气象数据与功率数 据,最终得到多个DCNN-BiLSTM预训练模型。

3. 2 在线自适应迁移学习
3. 2. 1 数据匹配更新自适应
传统的在线迁移学习方法只更新目标域网络和 权重单位,源域网络没有更新[36] ,增加了累积误差。 本文提出一种全新的在线自适应迁移学习方法来克 服这些缺点。采用 V 个基础模型{ Fi |i = 1,2,. . .,V } 在对应的V个源域中进行预训练。在线模型Ft使用与 基础模型相同的结构,具有随机初始化的可训练 参数。
新建风电场站数据 Xt 按时间顺序 t 到达。对于 在线扩充的数据 Xt 匹配的阈值设定规则,本文从源 域和目标域数据是否高度相似进行判别。采用所提 出基于堪培拉距离和动态时间规整算法相似性度量 方法对数据Xt与多源域数据计算相似度值dCD t 。每个 源域风电场站DCNN-BiLSTM-S-V的时间序列数据子 序列与目标新建风电场站原始未进行更新的数据 X 之间的相似度值为 dCD ,如式(13)所示。若式(13)成 立,表征在线扩充的数据序列满足与源域数据之间 的相似程度较高,则依据数据 Xt 对多源模型进行参 数微调;若不成立则保留预训练模型中原始参数。

3. 2. 2 权重更新自适应
源风电场站与新建风电场站的发电行为越相似,两者之间的 dCD值越小。每个基本预测模型都是 从其对应的源风电场站数据中训练出来的,因此使 用dCD值来评估每个基本预测模型初始权值以避免冷 启动的问题:

式中:ωi为每个基本预测模型初始权值。
在 t时刻,在线模型 Ft首先根据新建风电场站输 入的历史数据预测未来的功率 Yt ∧ 。为监测多源 DCNN-BiLSTM 模型预测性能,定义一个多样性损失 L以调整模型中参数:

式中:|·| ||2为L2范数;Yt为新建风电场站真实功率值; Y j t ∧ 为DCNN-BiLSTM-S-V模型中的第j条预测值。
L2 正则项范数使得模型参数不会过大,从而控 制模型复杂度,以减少由于新建风电场站数据过少 所导致的模型过拟合。同时监控模型在最新数据上 的性能,如果性能显著下降,则可能发生概念漂移, 若出现此问题则根据模型的性能动态调整集成权 重,使模型能够适应数据分布的变化。
依据计算 t时刻的多样性预测损失 Lt ,将在线模 型 Ft 的 参 数 进 行 微 调 ,得 到 损 失 为 Lt 的 新 在 线 模型F OL t :

式中:η为学习率;ϖFt 为功率损失差值。
同 时 对 每 个 基 础 模 型 Fi 计 算 损 失 Li(i ∈ (1,2,. . .,V )),根据损失Li调整相应的权值αi t 。 将微调后的F OL t 用于功率预测,并利用由此产生的损 失LV + 1来调整F OL t 的组合权值αV + 1 t 。
伴随新建风电场站的数据更新,利用权重衰减 因子 β ∈ (0,1)对每个基础模型的组合权重 αi t进行更 新并同时微调基础模型,经过权值松弛和微调的过 程,每个模型在t+1时刻乘以相应的权值αi t + 1,生成在 线模型在t+1时刻Ft + 1。对于每个模型的权重衰减因 子β的选择:初始未进行数据更新的多源域模型依据 dCD i 各个占比在(0,1)进行选择,在进行数据更新之后 依据多样性损失 L 所计算出各基础模型与在线模型 的预测值与实际值之间的偏差在(0,1)进行选择;如 果多源域模型中某模型发生概念漂移则可将该模型 的β选择为0,待新数据序列更新之后,若该模型性能 有所提高则恢复其权重。
每个基础模型和在线模型进行功率的预测,随 后,使用这些生成的预测值来计算每个基础模型中 的分集损失。然后,将所有基础模型的这些损失用 于计算集成学习中使用的权重。使用所有基础模型 和相应的权重以加权的方式更新用于预测未来功率 的在线模型。所提出的技术路线中在线自适应结构 如图5所示。

3. 3 模型的预测流程
本文提出基于多源自适应迁移学习的新建风电 场站功率预测模型,具体步骤如下:
步骤 1:利用堪培拉距离和动态时间规整算法对 集群风电场站进行筛选,将时间序列划分子序列片 段并分别赋予不同权重;
步骤 2:将与新建风电场站相似度较高的风电场 站作为源风电场站;
步骤 3:建立多源 DCNN-BiLSTM 模型,充分利用 各源场站数据知识优势,将各源场站数据输入多源 DCNN-BiLSTM模型,得到预训练模型;
步骤 4:构建在线自适应模块,分为基础模型与 在线模型,初始时刻由 dCD分配基础模型相应权重并 输入到在线模型中,集成得到预测结果;
步骤 5:计算多样性损失 L,伴随 t 时刻场景数据 的丰富,对基础模型进行微调,依据 L 对基础模型组 合权重和t+1时刻在线模型的参数进行更新;
步骤 6:通过在线自适应模块的滚动更新实现对 新建风电场站的功率预测。
4 算例验证
4. 1 算例数据
本算例选取中国西北地区某风电场站集群作 为研究对象,其中具有 10 个建场多年历史数据完备的风电场站。将某一风电场站数据进行片段截 取,作为建场初期数据稀缺的新建风电场站数据, 本算例数据和信息包括 2020 年的历史气象数据和 风 电 功 率 实 测 值 ,数 据 集 具 体 特 征 指 标 如 表 1 所示。

对于本文所提的相似性度量方法所采用的原 始数据范围为西北地区某风电集群的 2020 年 3 月 1 日至 2020 年 9 月 1 日(9 个待筛选源域风电场站及 1 个目标新建风电场站)的数据,分辨率为 15 min。 为验证所提出的相似性度量方法的优越性,将由不 同相似性度量方法所筛选的不同最相似场站数据 采用相同模型进行功率预测,其中 2020 年 3 月 1 日 至 2020 年 6 月 31 日 的 数 据 作 为 模 型 迁 移 数 据 。 2020 年 7 月 1 日至 2020 年 8 月 22 日的数据作为新 建风电场站运行数据训练集,用于迁移学习的数据 微调。2023 年 8 月 23 日至 2023 年 9 月 1 日共 10 d 的数据作为风电场运行数据测试集。
对于本文所提的多源自适应迁移学习预测方 法所采用的原始数据范围为风电集群的 2020 年 3 月 1 日至 2020 年 9 月 1 日(包含经筛选后的 5 个源 域风电场站)的数据,除发电功率外其他变量均使 用一般归一化公式处理,以保持发电功率与各变量 之间的相关性。其中 2020 年 3 月 1 日至 2020 年 6 月 31 日的数据作为模型迁移数据。2020 年 7 月 1 日至 2020 年 8 月 7 日的数据作为新建风电场站运 行数据训练集,用于迁移学习的数据微调。为证明 所提出的自适应模块的收敛性,将 2020 年 8 月 8 日 至 8 月 22 日划分为每 5 d 一次作为数据更新尺度, 2023 年 8 月 23 日至 2023 年 9 月 1 日共 10 d 的数据 为风电场运行数据测试集,从每次数据更新对模型 自适应调整之后所提高的预测精度来判断其预测 结果的收敛性。
4. 2 评价指标
确定性预测误差表现为横向误差和纵向误差, 本文选取纵向误差评价指标平均绝对误差(mean absolute error,MAE)、平 均 绝 对 误 差 百 分 比(mean absolute percentage error,MAPE)、均 方 根 误 差(root mean square error,RMSE)作为预测性能评价指标[37] 。
平均绝对误差 KMAE可以用来评价预测系统的长 期运行状态,其计算表达式如下:

式中:yi ∧ 为 i 时刻实际功率;yi 为 i 时刻预测功率。 MAE 取值范围为[0,+∞),当预测值与真实值完全吻 合时其值等于0,即完美模型;误差越大,该值越大。 平均绝对误差百分比KMAPE计算表达式如下:

MAPE为0表示为完美模型,MAPE大于100 %则 表示为劣质模型。
均方根误差KRMSE可用来评价预测误差的分散程 度,从整体上评价预测系统的性能和预测效果,其计 算表达式如下:

4. 3 相似性度量结果分析
为验证 dCD 的性能,将集群中现存数据完备的 1—9号源域风电场站数据与目标新建风电场站数据 进行相似性度量,相似度越小数据表征相似性越高。 对于源域数据进行时序分割,并选取 12 作为分段序 列的份数,并依据分割后的数据序列应用 dCD计算不 同数据序列与目标域数据之间的相似度值,以相似 度为 0. 01 的间隔划分,其中相关性范围分别为: 0. 70~0. 71、…、0. 79~0. 80、>0. 80。对1—9号风电场 分别统计,结果如图 6 所示。

由图 6可知,3、5、6、7号源风电场站中分割后的 时间序列与目标风电场站数据之间的相似度值占比 大多位于 0. 75~0. 80 之间,表征数据相似性并不高,易导致数据的负迁移,故从源域中剔除。对于多源 迁移来说并非数量越多预测性能越好,故择优采取 整体相似度排名靠前的 5 所风电场站进行迁移学习 的预训练。同时为比较与常规欧氏距离、堪培拉距 离和动态时间规整算法测试序列与其他分割序列之 间相似度的优势,依据不同方法对数据进行筛选后 迁移并利用迁移学习(transfer learning,TL)-LSTM、 TL-CNN 和 TL-CNN-LSTM 进行预测实验对比,预测 精度对比结果如表 2所示。从表 2中可知,所提方法 筛选出的源域数据能够很好地提高正向迁移率,从 而提高预测的整体精度。

4. 4 预测结果分析
本文采用i7 11800H/16 GB/RTX3060硬件配置并 利用Python平台中的Pytorch框架构建和训练基于多 源 DCNN-BiLSTM 模型的短期风电功率预测模型,详 细模型参数如表3所示。

为评估自适应模块对整体性能的贡献,确认 其设计的合理性,本文进行了如下消融实验:对比 模型为多源在线迁移(online transfer,OT)-DCNNBiLSTM 神经网络模型(固定权重:仅利用更新数 据进行微调)与本文所提出的包含多源自适应模 块的 OT-DCNN-BiLSTM 神经网络模型(自适应权 重:利用更新数据进行微调同时依据多样性目标 损失函数 L 动态调节各个源域模型的权重)。分 别对新建风电场站进行功率预测,预测精度对比 如表 4 所示。预测结果误差泰勒图如图 7 所示,其 中散点代表模型,辐射线代表相关系数,虚线代表 误差,横纵轴代表标准差,图 7 中红色圆点是根据 实际风电数据所绘制的标准差以及中心化均方根 误差参考点。各模型与蓝色辐射线距离越接近, 表明模型预测值和真实值之间的相关性越高;各 模型与实际风功率数据的标准差(红色弧线)越接 近,表明模型预测值数学计算分布更接近于真实 数据的分布;以红点为圆心,距离红点越远 RMSE 越大。

由表 4 和图 7 可知,通过移除多源自适应模块, 训练并对比评估模型性能,量化了自适应模块的贡 献。对于多次数据更新,由于动态数据特征发生了 变化而对比模型并不能对多源域的权重进行调整, 导致某一模型由于数据相似度不能满足在线迁移学 习的要求而使预测模型的精度发生了上下浮动;而本文所提出的自适应模块能够避免这一壁垒的发 生,进而不断提高预测模型的精度。
为进一步充分验证本文算法的有效性与性能优 越性,选择了三种模型类型进行性能比较。1)无迁 移学习:采用 LSTM 与 Transformer 模型,依靠目标新 建风电场站的数据进行功率预测。2)迁移学习:采 用 TL-BiLSTM 与 TL-BiLSTM-DANN(对抗域适应)模 型,依靠本文基于堪培拉距离和动态时间规整算法 相似性度量方法所筛选出的相似度最高的风电场 站,依据迁移学习方法进行功率预测。3)采用 OTDCNN-BiLSTM模型与本文所提的多源自适应迁移学 习方法,依靠源域风电场站数据进行迁移学习,并根 据目标新建风电场站数据动态更新,进行功率预测。 各方法预测精度对比如表5所示,包含迁移学习的不 同预测方法在各阶段的具体计算时间如表6所示。

图 8 为不同模型的预测结果曲线对比。由图中 曲线对比与预测误差对比可得,基于多源自适应策 略的预测方法无论在原始目标新建风电场站数据时 段,还是在新数据涌入时段,均表现出良好的预测性 能,第一次更新后 MAE、RMSE、MAPE 分别下降了 3. 452%、3. 145%、1. 755%;第二次更新后分别下降 了 0. 331%、0. 122%、0. 145%;第三次更新后分别下 降了 0. 300%、0. 322%、0. 124%。各项预测性能评价 指标均优于其他预测方法,预测结果与实际功率数 据拟合程度最高,结果最为理想。同时包含迁移学 习的不同预测方法中本文所提方法无论训练时间还 是测试时间其计算效率最高。对于在线更新数据过 程所需时间,第一次更新为 0. 078 s,第二次更新为 0. 075 s,第三次更新为0. 072 s,伴随目标新建风电场 站数据的不断完备,模型进而自适应优化,其更新效 率不断提高。由此可以得到以下结论:
1)在所有的预测方法下,无迁移学习策略的模 型由于目标新建风电场站的数据缺失,模型不能得 到良好的训练,导致预测精度整体低于 TL 模型。得 益于基于堪培拉距离和动态时间规整算法的相似性 度量方法,源域风电场站中更为优异的数据片段应 用于迁移学习当中,避免了数据端的壁垒。
2)常规TL预测方法下仅依靠相似度最高的单源 域风电场站与目标新建风电场站之间的数据知识迁 移,但并不意味其余风电场站并无可用之处,对于特 定时段的某些特征维度同样能够发挥优秀的知识利 用率。本文所提的多源迁移学习策略集成多个源域 风电场站,首轮预测依据相似度值对结果进行加权, 充分发挥了各场站的优势,避免了过于依赖单一源 域风电场站造成的预测不确定性。
3)通过比较 TL 模型和 OT 模型可以发现,虽然 TL 模型最初表现出较好的预测精度,但当目标新建 风电场站数据的动态扩充,TL模型无法及时更新,而 本文所提的在线自适应模块有效地提高了OT模型的 预测精度,克服 TL 模型的性能瓶颈。本文采用的多 源自适应更新策略在更新数据段的同时将多个源领 域的知识传递给目标领域的在线模型,还可以在其 初始参数的基础上对在线模型进行微调,以更好地 适应新的数据段,提高目标领域的整体预测精度。 理论上伴随数据的不断充备,预测能够达到更为精 准的效果。
5 结 论
针对新建风电场站有限信息场景下数据样本 少、预测精度低的问题,本文提出一种多源自适应策 略下的风电功率预测方法,通过实例分析并与常规 预测模型相比,本文所提预测模型的精度得到了显 著提升,主要结论如下:
1)对功率、气象数据时间序列分割成若干小块时间序列并赋予不同权重,采用堪培拉距离和动态 时间规整算法对源域风电场站与目标新建风电场站 之间的数据进行相似性度量,择优选取出多个备选 场站。所提出的相似性度量方法较其他常规方法具 有更为精确的判别准度,为后续预测奠定了良好的 数据基础。

2)用 DCNN-BiLSTM 模型对筛选后的源域风电 场站数据进行时空特征提取,建立多源预训练模型, 打破传统“端到端”的构筑,实现“多端对一”的建模 方式。该方法能够充分汲取多源域的数据经验知 识,避免了目标新建风电场站过于依赖单源域经验 知识。
3)通过在多源模型引入在线自适应模块,对于 不断补充的新建风电场站数据,分别对基础模型与 在线模型进行数据微调并不断迭代集成学习的预测 权重。该方法能充分动态捕捉不同时段下影响因素 的复杂动态特征,从功率预测精度验证本文方法的 有效性,提高对以数据驱动的建模方式下的场景自 适应性。
本文所提方法有效弥补了新建风电场站情况下 数据缺憾的问题,并且捕捉动态更新的数据特征与 功率时序之间的映射关系,提高了模型伴随迁移数 据的不断扩充,预测结果不断迭代,从而实现较为精 准的风电功率预测。此外,亦提高了预测模型的自 适应性与泛化性,对于未来实现多地区、多场景跨越 性模型的自适应能力提供了参考价值。