首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 100 毫秒
1.
细粒度图像分类是计算机视觉中一项基础且重要的工作,其目的在于区分难以辨别的对象类别(例如不同子类的鸟类、花或动物).不同于传统的图像分类任务可以雇佣大量普通人标注,细粒度数据集通常需要专家级知识进行标注.除了视觉分类中常见的姿态、光照和视角变化因素之外,细粒度数据集具有更大的类间相似性和类内差异性,因此要求模型能够捕捉到细微的类间差异信息和类内公有信息.除此之外,不同类别的样本存在不同程度的获取难度,因此细粒度数据集通常在数据分布中表现出长尾的特性.综上所述,细粒度数据分布具有小型、非均匀和不易察觉的类间差异等特点,对强大的深度学习算法也提出了巨大的挑战.本文首先介绍了细粒度图像分类任务的特点与挑战,随后以局部特征与全局特征两个主要视角整理了目前的主流工作,并讨论了它们的优缺点.最后在常用数据集上比较了相关工作的性能表现,并进行了总结与展望.  相似文献   

2.
提出了一种基于开源计算机视觉库OpenCV的圆形检测方法协助订正自动雪深仪的疑误数据。对测雪板上的图像识别区域依序进行平滑滤波处理、边缘检测、Hough变换圆检测,识别出积雪情况。利用该方法,提高了疑误数据的订正效率。  相似文献   

3.
面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能.  相似文献   

4.
视觉里程计(Visual Odometry)作为视觉同步定位与地图构建技术(Visual Simultaneous Localization and Mapping)的一部分,主要通过相机传感器获取一系列拥有时间序列图像的信息,从而预估机器人的姿态信息,建立局部地图,也被称为前端,已经被广泛应用在了多个领域,并取得了丰硕的实际成果,它对于无人驾驶、全自主无人机、虚拟现实和增强现实等方面有着重要意义.本文在介绍经典视觉里程计技术框架模块中的各类算法的基础上,对近年来新颖的视觉里程计技术(VO)的研究和论文进行了总结,按照技术手段不同分为两大类——多传感器融合的视觉里程计(以惯性视觉融合为例)和基于深度学习的视觉里程计.前者通过各传感器之间的优势互补提高VO的精度,后者则是通过和深度学习网络结合改善VO的性能.最后通过比较视觉里程计现有算法,并结合VO面临的挑战展望了视觉里程计的未来发展趋势.  相似文献   

5.
随着深度学习技术的不断发展,扫描图像识别技术在提高准确率方面取得了显著进展。本文着重介绍了卷积神经网络和循环神经网络,并比较了它们在图像识别和文字识别任务中的表现。基于卷积神经网络的方法通过构建多层神经网络模型,可以自动学习图像的特征和规律,从而提高识别的准确率,显示出卓越的性能。而循环神经网络在文字识别领域展现了其独特的优势,实验结果表明,循环神经网络能够处理序列数据,并自动学习序列之间的关系。本文的研究结果表明,深度学习算法在扫描图像识别技术中具有广阔的应用前景,卷积神经网络在图像识别任务中表现出色,而循环神经网络在文字识别任务中具有良好的性能。  相似文献   

6.
近年来,互联网上视觉数据呈现出爆炸式的增长,越来越多的研究工作围绕图像搜索或图像检索技术而展开.早期的搜索技术仅采用文本信息,忽视了视觉内容作为排序的线索,导致搜索文本和视觉内容不一致.基于内容的图像检索(CBIR)技术充分利用视觉内容识别相关图像,在近几年来获得了广泛关注.在图像检索中,最根本的问题是意图鸿沟和语义鸿沟,围绕该问题,近年涌现出大量的基于内容的图像检索的技术.本文主要对2003-2016年间提出的相关图像检索方法进行总结、分类和评估,并对未来的潜在研究方向进行讨论.  相似文献   

7.
视觉驱动机械臂自主作业技术在工业生产、航空航天以及深海探测等诸多领域都具有重要的意义.在回顾多年视觉驱动机械臂自主作业技术的基础上,从基于几何驱动的控制和基于数据驱动的控制两个方向进行归纳总结.对不同的控制方法,介绍了控制的原理,总结了每一类自主作业控制的研究成果,并对每种控制方法的特点以及存在的问题进行分析.针对视觉驱动机械臂自主作业在关键领域中的研究,本文重点分析讨论了海洋开发与探测领域中存在的关键问题与挑战.  相似文献   

8.
现如今,深度学习已然成为机器学习领域最热门的研究方向之一,其在图像识别、目标检测、语音处理、问答系统等诸多领域都取得了巨大成功.然而通过附加经过特殊设计的细微扰动而构造出的对抗样本,能够破坏深度模型的原有性能,其存在使许多对安全性能指标具有极高要求的技术领域,特别是以视觉感知为主要技术优先的智能驾驶系统,面临新的威胁和挑战.因此,对对抗样本的生成攻击和主动防御研究,成为深度学习和计算机视觉领域极为重要的交叉性研究课题.本文首先简述了对抗样本的相关概念,在此基础上详细介绍了一系列典型的对抗样本攻击和防御算法.随后,列举了针对视觉感知系统的多个物理世界攻击实例,探讨了其对智能驾驶领域的潜在影响.最后,对对抗样本的攻击与防御研究进行了技术展望.  相似文献   

9.
随着图像大数据的爆发,特别是用户贡献数据的飞速增长,图像样本的语义内容越来越丰富,标签信息也随之越来越复杂.因此图像多标签学习的研究是近年来学术圈和产业界的研究热点之一,涌现了大量表现优异的方法和技术.基于此,本文将对近年来图像多标签学习上的研究成果进行总结.首先,对多标签学习进行简单介绍,并详述其主流方法的分类;随后,针对目前大数据时代的数据特性,总结了多标签学习面临的新的技术难点及其对应的解决方案;最后,在应用层面上介绍了多标签学习在医学、计算机科学等领域的应用实例.  相似文献   

10.
该项目是国家科技部科研院所技术开发研究专项资金项目,其研究目标是:基于高性能的数字摄隐系统对天气现象的实时监测,结合先进的计算机图像识别、处理和分析技术,实现对雨、雪和冰雹等降水现象以及雾、烟幕和沙尘等视程障碍现象的自动识别,开发基于数字摄像技术的主要天气现象自动观测系统,为气象站目测要素的自动化观测提供先进有效的技术手段,促进我国在气象站自动化观测技术方面的研究进程.本项目执行以来,主要开展了下述工作:  相似文献   

11.
基于重庆市境内长江航道雷达站拍摄的雾天气过程影像资料,利用K最近邻、支持向量机、BP神经网络、随机森林等机器学习算法,对无雾和5类有雾天气个例进行图像识别训练,构建雾图像识别模型,并检验了识别准确率。结果表明:机器学习能够有效识别雾图像,随机森林算法的识别效果优于其余3种算法。对于能见度超过1500 m的无雾天气,模型的识别准确率为100%,对于能见度在1000—1500 m范围内的轻雾、能见度低于50 m的强浓雾,模型的识别准确率在90%以上,对于能见度在50—1000 m范围内的雾、大雾和浓雾,识别准确率超过70%。  相似文献   

12.
为了克服非约束性(光照、表情变化)条件下会大大降低人脸识别率的缺陷,提出一种基于Fisher判别准则的正则化稀疏表示人脸识别算法.首先将人脸图像经过Gabor滤波器滤波得到Gabor幅值图像,提取其统一化的局部二进制直方图,然后利用Fisher判别准则学习得到新的字典,最后通过正则化的稀疏表示判断测试图像所属类.利用AR数据库的数据进行实验的结果表明,与SRC、FDDL、RSC识别算法相比,本文算法在非约束性条件下具有最佳的识别率.  相似文献   

13.
在传统的基于角色访问权限管理 (RBAC) 模型基础上结合气象数据自身特点及共享服务中的权限控制需求,提出了一种符合气象资料管理特点的多维度权限管理模型。该模型充分考虑了气象数据进行资源共享时资料分类众多、层次化结构复杂、检索粒度不同等特点,有针对性引入了客体维度概念和更灵活的权限管理机制,较好地满足了气象部门数据共享服务系统建设的需求。该方案作为全国综合气象信息共享平台 (CIMISS) 数据服务权限控制模型的前期试验研究,构建一个多维数据权限管理原型系统用于数据访问控制。作为通用性模型,该模型可以延伸用于气象数据服务类系统应用,对确保数据库的信息安全、防止用户越权访问数据、保障管理信息系统的正常运行具有重要意义。  相似文献   

14.
邵楠  裴翀  刘传才  周薇  张乐坚  李巍 《气象科技》2013,41(6):993-997
对雷达产品的实时监控是中国气象局气象探测中心运行监控实时业务工作的重要内容之一,因此实现自动化识别雷达异常产品具有重要的现实意义和研究价值。论述基于图像处理技术实现自动识别雷达异常产品,详细介绍系统实现模型及雷达数据异常自动识别算法,其中主要阐述了特征提取、迭代学习器等相关内容。通过对检测出的雷达产品异常产品分析表明,基于图像处理技术的雷达产品异常自动识别系统可以高效的、实时的检测出异常雷达产品,便于技术人员快速发现雷达异常并及时修复,也可作为雷达维修或雷达升级改造的依据,提高雷达的使用效率。  相似文献   

15.
蝗虫是常见的害虫之一,对农作物和生态系统具有很大的危害,采用常规的方法对蝗虫进行监测存在一定局限性,为了有效应用海量野外影像数据实现对蝗虫实时监测,本文建立了一种基于深度学习网络的蝗虫自动识别模型。利用手机模拟摄像头获取的内蒙古锡林浩特附近草原的280张蝗虫的RGB图像,采用深度学习算法中的Faster R-CNN(Faster Region-based Convolutional Neural Network)网络结构建立了蝗虫识别模型。经验证该模型的精确度为0.756,可以较准确地将蝗虫从野外复杂环境中识别出来,与以往同类研究相比,在识别结果和实用性方面均有较大的进步。该模型是建立蝗虫实时监测系统的基础,可以为蝗虫的防治提供辅助信息,同时该网络结构还可以应用于其他害虫的识别,具有较强的推广性,拓宽了深度学习算法的应用领域。  相似文献   

16.
该文实现了3种常见的阈值算法在闪电通道识别中的应用。针对某些闪电通道图像对比度较低的特点,首先对原始图像去除背景光照不均的影响并进行图像增强,再根据所处理的闪电通道图像的具体情况,选择全局自适应阈值法、局部自适应阈值法或基于Otsu自适应阈值的Canny算子对增强后的图像进行边缘检测,进而对闪电通道进行识别。对所提取到的闪电通道进行形态学和细化处理,最终提取到由连续的像素点序列表示的闪电通道。针对数字图像中闪电通道背景的不同特点,文中提到的3种阈值方法能够有针对性地对不同图像进行通道检测,在保证准确获得清晰边缘信息的同时,较好地兼顾了对弱边缘信息的提取,有效保证了对闪电通道的识别效果。  相似文献   

17.
当前,食品图像的营养成分识别主要还是集中在食品类别的识别以及作为多标签任务的识别.但是这两种方法并不具备很好的判别性,因为它们忽略了原材料之间的潜在关系.因此,本文在前期工作的基础上引入了原材料之间的关系.具体地说,我们的工作主要分为图像特征提取和原材料关系学习两部分.图像特征提取通过卷积神经网络提取到图像的低维特征向量.图卷积网络通过使用图数据(图的每个节点表示原材料的词嵌入,边表示节点之间的相关性),将图数据直接映射到一组相互依赖的分类器中,并与图像的低维特征向量融合,最后进行分类.通过在Food-101和VireoFood-172两个食品数据集上进行实验,并与当前最好的实验模型进行对比,发现基于图卷积的食品多标签分类方法可以有效地提高食品图像的分类性能.  相似文献   

18.
纸质记录曲线的识别和数字化是图像处理和模式识别领域的一项重要内容, 是对气象档案馆保存的气象纸质曲线资料数字化的有效方法。该文研究并构建了电接风向风速自记纸数字化处理系统, 该系统主要包括4个处理阶段:自记纸图像的输入、图像预处理、自记曲线的分割、曲线的跟踪和识别。其中, 自记纸图像的输入应用TWAIN (Toolkit Without An Interesting Name, 无注名工具包协议) 标准来设计, 对记录曲线的跟踪识别, 该文提出的基于灰度积分投影的分段线性插值算法, 取得了很好的识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号