图像自动标注是目前计算机视觉和自然语言处理交叉研究领域的一个研究热点。对图像自动标注领域中的深度学习方法进行综述;针对图像自动标注领域的国内外研究现状,按照基于多模态空间、基于多区域、基于编码-解码、基于强化学习和基于生成式对抗网络等五个分类标准进行详细综述;介绍图像自动标注领域相关的数据集和评价标准,对比不同图像自动标注方法的优缺点;通过分析图像自动标注领域的当前研究现状,提出该领域亟待解决的3个关键问题,进一步指出未来的研究方向,并对本研究进行总结。
为准确把握海洋波浪能利用技术的发展情况, 以海洋波浪能发电装置为出发点, 综述当前的重要研究进展。波浪能装置形式尚未收敛, 以不同的能量捕获方式为分类原则, 介绍振荡水柱式、越浪式和振荡体式3类主流装置的工作原理及其能量转换系统。分析每类装置的优缺点,选取典型工程装置展开详细的介绍。对我国已经完成海试的工程装置情况进行整理, 发现振荡体式是我国当前最主流的装置形式。总结波浪能发电装置性能评价的研究进展, 目前尚未形成统一的评价标准。分别从高效性与稳定性、可靠性与成本和多元化综合平台建设3个方面探讨波浪能发电装置发展所面临的困难及主要的突破方向。
高氯酸盐具有高稳定性、高水溶性、强氧化性和低挥发性,广泛应用于军工制造、航空航天与工业生产等领域。伴随着空气流动和水体迁移,越来越严重的高氯酸盐水体污染现象已在全球范围内引起广泛关注。有关高氯酸盐的来源、水体污染现状和治理工艺,国外已开展了较为全面的研究与调查,我国仍处于起步阶段,严重忽视高氯酸盐的环境污染问题,缺乏对其系统深入的处理工艺研究,更缺少相关环境质量标准与安全浓度限值。综述了高氯酸盐的来源、危害和水污染现状,分析了世界已有的高氯酸盐浓度限值标准,并重点总结了高氯酸盐处理工艺的研究进展,以期为我国高氯酸盐污染问题的深入研究和相关法律法规的制定提供借鉴与参考。
赋予公路工程以智慧,建立智慧公路等新一代“互联网+”设计、建造、管理、监测和运营五位一体系统,是当下土木工程、控制工程、机械工程、交通运输工程和计算机等交叉学科的研究热点问题。围绕智慧公路,针对交通“设、建、管、监、运”环节的关键技术,面向智慧公路全寿命周期,从多功能路面材料、智慧建造与智能监测、无人驾驶、车路协同、物联网技术等5个方面入手,系统阐述国内外相关的研究成果、关键共性技术及未来发展趋势。
主要介绍换热器200余年的发展历程,对不同结构换热器的产生及典型应用进行综述。重点阐述管壳式换热器、板式换热器、微结构换热器和印刷电路板换热器四种不同结构的换热器,及其为了实现强化传热所开展的相关几何参数优化和结构改进的发展工作。分析现有换热器结构设计中存在的问题与限制,总结换热器结构更新的具体建议和发展趋势。
针对受字数限定影响的文本特征表达能力弱成为短文本分类中制约效果的主要问题,提出基于word2vec维基百科词模型的中文短文本分类方法(chinese short text classification method based on embedding trained by word2vec from wikipedia, CSTC-EWW),并针对新浪爱问4个主题的短文本集进行相关试验。首先训练维基百科语料库并获取word2vec词模型,然后建立基于此模型的短文本特征,通过SVM、贝叶斯等经典分类器对短文本进行分类。试验结果表明:本研究提出的方法可以有效进行短文本分类,最好情况下的F-度量值可达到81.8%;和词袋(bag-of-words, BOW)模型结合词频-逆文件频率(term frequency-inverse document frequency, TF-IDF)加权表达特征的短文本分类方法以及同样引入外来维基百科语料扩充特征的短文本分类方法相比,本研究分类效果更好,最好情况下的F-度量提高45.2%。
针对目前3D点云目标检测模型检测精度不高的问题,研究使用直接处理点云数据的F-PointNet模型检测汽车、行人和骑车人,并对模型进行微调,进一步提升模型的目标检测精度。试验中使用不同的参数初始化、$\ell $2正则化和修改卷积核数的方法对模型进行测试。试验结果表明, Xavier参数初始化方法收敛速度比截断正态分布方法快0.09 s,同时汽车和骑车人检测精度分别高出大约3%和2%;增加$\ell $2正则化,行人检测精度和骑车人检测精度可提高大约2%和1%;对T-Net(Transfrmer Networks)第一层卷积层的卷积核数减少为128后,汽车和骑车人检测精度分别提高了大约1%和2%,表明本模型能有效地提升目标检测精度。
基于动态路由规则的胶囊网络模型是近年来新提出的神经网络模型,被认为可能成为下一代重要的神经网络模型。近年来,众多研究表明胶囊网络具备更好地拟合特征的能力,但是由于计算开销巨大,网络模型始终无法适应大数据集的要求。减少计算开销成为了胶囊网络的研究热点。减少胶囊网络的计算开销通常有两种方式,即优化胶囊法和优化路由法。优化胶囊法通常以应用目的为驱动,设计专门针对某种分类任务的网络模型;优化路由法则更具一般性,从算法角度提升胶囊网络的性能。
为了解决四点全等集合(4-points congruent sets, 4PCS)在两片点云重叠率较低的情况下算法耗时长且配准容易失败的问题,提出快速四点一致性集合(fast 4-points congruent sets, F-4PCS)解决点云配准问题。给出一种新的选择四点基的方法,给定源点云和目标点云,分别提取出它们的边界,将边界扩展为边界特征带,在边界特征带中选取具有一致性的四点基集合,从而避免一些不必要的迭代。通过对四点基的特征限制,去除无效的四点基,减少算法的验证时间,提高计算效率。在相关数据集上的试验表明,在点云重叠率较低等情况下F-4PCS方法比4PCS方法更加高效且配准成功率较高。
针对目前不同物联网设备之间多机通讯模块繁多、设备结构复杂、成本高的问题,提出一种基于通用异步收发传输器(universal asynchronous receiver/transmitter,UART)串口的多机通讯方法。基于微控制器自带的UART串口通讯方式,利用控制线控制通讯设备对通信线路的占用,采用主从控制策略,设定通讯协议和通讯主机、从机,主机作为信息转发和识别的单元,从机组成信息处理的单元,并通过通讯协议实现多从机扩展的功能。通过移植μC/OS-Ⅱ操作系统到STM32微控制器上,借助μC/OS-Ⅱ的实时多任务特性,将信息的接收、发送和识别设计成不同优先级的任务。试验结果表明,多机分时通讯方法能够实现主机、从机的信息接收、发送、识别的功能和多机可靠稳定的通讯,解决传统UART方式无法实现多机互相通讯的问题,为物联网设备的多机通讯提供一种可行方案。
从爬坡的定义方式、预测方法、控制策略三个层面出发, 对以风电、光伏为代表的新能源爬坡事件进行概述。列举爬坡事件常用的定义并分析其优劣性; 总结爬坡事件目前主流的预测方法,根据是否利用功率预测结果分为直接法和间接法, 并对常用的评价指标进行介绍; 阐述目前爬坡控制策略常用的方法, 按照有无储能参与分为无储能参与的有限度控制策略和有储能参与的联合控制; 对目前研究仍存在的问题和未来重点研究方向进行总结。
针对传统字符图像分割方法对笔画重叠黏连字符分割存在的不足,提出基于改进滴水算法来解决共用笔画黏连字符的分割。算法过程包括:利用Zhang-Sueng并行细化算法与自组织映射神经网络(self-organizing maps, SOM)聚类确定滴水算法初始点;定义新的水滴滴落路径。水滴从初始滴落点出发沿着字符重叠笔画的骨架滴落,水滴到达骨架末端时将继续沿着骨架倾斜方向滴落,直到遇到字符黏连部分的边界,水滴滚动的轨迹即为黏连字符切分路径。用改进滴水算法分割黏连字符避免了传统滴水算法初始滴落点定位不准确,导致字符分割断裂问题。对所提算法进行试验,与传统滴水算法和竖直分割算法进行比较,证明改进算法对笔画重叠黏连字符分割效果理想。
针对传统的块匹配去噪方法只能处理二维图像的缺点,提出一种基于三维剪切波变换和改进的三维块匹配过滤(block-matching and 4D filtering, BM4D)算法的图像去噪方法。利用三维剪切波变换得到变换域系数,通过硬阈值和维纳滤波,在变换域中实现联合过滤。经过多尺度分解和方向剖分两个滤波阶段,确保三维剪切波变换是局部的;进行硬阈值和维纳滤波,分别包括分组、协同过滤和聚合3个步骤,利用堆积成四维组的体素立方体,在该组的四维变换同时利用每个立方体中体素之间存在的局部相关性和不同立方体中相应体素之间的非局部相关性。通过三维剪切波逆变换,得到每个分组立方体的估计值,在它们的原始位置进行自适应聚合。以峰值信噪比和结构相似度作为评价标准,试验结果表明:该方法不仅能够有效去除高噪声环境下的图像噪声,而且还能够有效地改善图像的视觉效果,具有较高的准确性。
提出基于卷积-门控循环单元(convolution-gated recurrent unit, C-GRU)的微博谣言事件检测模型。结合卷积神经网络(convolutional neural networks, CNN)和门控循环单元(gated recurrent unit, GRU)的优点,将微博事件博文句向量化,通过CNN中的卷积层学习微博窗口的特征表示,将微博窗口特征按时间顺序拼接成窗口特征序列,将窗口特征序列输入GRU中学习序列特征表示进行谣言事件检测。在真实数据集上的试验结果表明,相比基于传统机器学习方法、CNN和GRU的谣言检测模型,该模型有更好的谣言识别能力。
针对能源规划、发展对能源需求预测依赖度的增加和能源需求预测难度上升的问题,对各种能源预测方法与能源发展方向进行了探讨。从近年来全球能源需求发展的方向入手分析当前能源发展格局对能源预测方法的需求现状;对现有的主要能源预测方法进行归纳、对比,总结现有研究方法的利弊和适用场合;结合能源发展的新方向,对未来的能源预测发展方向进行探讨与展望,并应用LEAP模型对非洲地区进行能源需求预测分析,分析区域互补效应以及“电能替代”对能源需求发展的作用。
同步定位与建图(simultaneous localization and mapping, SLAM)技术作为智慧交通领域研究的热点, 是无人驾驶车辆自主规划路径的关键。围绕SLAM技术相关传感器类型、定位、制图、多传感器融合四方面, 从优缺点、适用范围、概率算法、地图类型及融合方式出发, 介绍SLAM技术实现过程中的各个环节, 系统阐述了国内外相关的研究成果。基于多传感器融合SLAM, 分析了目前常见的融合SLAM技术难题, 对SLAM技术的未来发展趋势及实际工程应用做出展望。
提出一种新的基于局部差异二值(local difference binary, LDB)描述子和局部空间结构匹配方法实现快速场景辨识,运用多重网格密集采样得到图像区域的灰度和梯度信息,比较网格间的灰度和梯度进行二值描述,继承了二值特征提取的快速和低存储的优点。通过构建特征点的局部空间分布约束,将局域内的多点匹配取代单点匹配,排除了大量错配点,提升了匹配的准确率。试验表明,本研究方法计算效率约是尺度不变特征变换(scale-invariant feature transform, SIFT)的2.7倍,加速稳健特征(speeded up robust features, SURF)的1.9倍,充分验证了本研究方法的有效性和识别性能。
采用LightGBM预测模型对空气质量预测问题进行研究,提出并设计一种基于预测性特征的空气质量预测方法,有效地预测北京市区内未来24 h核心表征空气质量的PM2.5质量浓度。在构建预测方案过程中,分析训练数据集特性开展数据清洗,利用随机森林与线性插值相结合的方法,解决数据大量缺失以及噪声干扰问题;提出使用预测性数据特征方法,同时设计相关统计特征,提高预测结果的准确性;采用滑窗机制挖掘高维时间特征,增加数据特征数量级;对预测模型的工作性能和结果进行详细分析,并结合基线模型进行对比评价。试验结果表明,基于预测性特征结合采用LightGBM预测模型的方案具有更高的预测精度。
针对目前图像编码的研究工作更加重视信息无损性,而没有体现出社交网络图像区分度的问题,本研究提出一种新颖的基于深度卷积神经网络的社交网络图像自编码算法,将深度卷积神经网络提取特征的能力与社交网络中图像的特点相结合,得到性能良好的图像自编码。结合社交网络图片的特性与聚类算法,先将图片进行聚类得到距离信息,再利用深度卷积神经网络学习图片的距离信息,提取深度卷积神经网络中的全连接层作为编码,重复以上步骤,并得到最终的图像编码。试验结果表明,本研究提出的算法在图像搜索中的效果好于其他算法,更利于在社交网络图像搜索中使用。
使用价格低廉的网络摄像头作为视频源, 研究基于眼动识别和视线跟踪在计算机上精确交互的方法。提出一种基于外观人眼视线方向估计的人机交互方法: 使用一个简单快速的卷积神经网络模型粗略估计人眼在屏幕上的注视点, 进而将眼动识别和不精确视线跟踪结果用于实现在计算机上的精确人机交互。在此基础上开发了眼动鼠标与眼动打字的功能以替代鼠标和键盘硬件。试验结果表明: 本研究让使用者仅用一个普通的单目摄像头, 就可以实现眼动跟踪, 并利用眼动控制完成计算机上大部分精确的交互。
在碳达峰和碳中和目标的推动下, 高比例可再生能源接入导致新型电力系统的低惯量特征突出。为保障电网安全稳定运行、支撑可再生能源消纳, 对电力系统惯量相关领域的研究进行综述与展望。阐述电力系统惯量的内涵, 探讨传统惯量、虚拟惯量和等效惯量间的关系, 剖析虚拟惯量控制的物理意义。从惯量来源的角度总结风机、光伏和储能等虚拟惯量控制技术的研究动态及成果, 并对电力系统惯量评估方法进行归纳梳理。总结电力系统惯量相关领域中亟待研究的重点内容并给出建议。
以济南市槐荫区某基坑工程进行双排桩支护设计为例,分别采用有限差分数值软件中弹塑性实体单元和线性桩单元模拟开挖-支护-施工全过程,且考虑桩土相互作用并进行三维动态分析。对基坑坡面水平位移、桩身弯矩、桩身剪力等变化规律进行研究,分析双排桩支护体系的受力机理。通过土体力学参数、桩径、桩长、桩距、连梁等设计参数对基坑变形影响的敏感性进行对比,并就“实体”和“结构”单元桩的计算结果进行比较。研究表明,模拟过程能较好展示双排支护桩施工过程的受力机理,且计算精度较高;不可控参数中土体的黏聚力、摩擦角以及可控因素中的桩身长度、排桩距离等对支护效果影响较大,计算结果可为双排支护桩设计参数选取提供参考。