1.求一篇:图像识别的主要方法及其特点的比较的开题报告
利用计算机进行遥感信息的自动提取则必须使用数字图像,由于地物在同一波段、同一地物在不同波段都具有不同的波谱特征,通过对某种地物在各波段的波谱曲线进行分析,根据其特点进行相应的增强处理后,可以在遥感影像上识别并提取同类目标物。
早期的自动分类和图像分割主要是基于光谱特征,后来发展为结合光谱特征、纹理特征、形状特征、空间关系特征等综合因素的计算机信息提取。 常用的信息提取方法是遥感影像计算机自动分类。
首先,对遥感影像室内预判读,然后进行野外调查,旨在建立各种类型的地物与影像特征之间的对应关系并对室内预判结果进行验证。工作转入室内后,选择训练样本并对其进行统计分析,用适当的分类器对遥感数据分类,对分类结果进行后处理,最后进行精度评价。
遥感影像的分类一般是基于地物光谱特征、地物形状特征、空间关系特征等方面特征,目前大多数研究还是基于地物光谱特征。 在计算机分类之前,往往要做些预处理,如校正、增强、滤波等,以突出目标物特征或消除同一类型目标的不同部位因照射条件不同、地形变化、扫描观测角的不同而造成的亮度差异等。
利用遥感图像进行分类,就是对单个像元或比较匀质的像元组给出对应其特征的名称,其原理是利用图像识别技术实现对遥感图像的自动分类。计算机用以识别和分类的主要标志是物体的光谱特性,图像上的其它信息如大小、形状、纹理等标志尚未充分利用。
计算机图像分类方法,常见的有两种,即监督分类和非监督分类。监督分类,首先要从欲分类的图像区域中选定一些训练样区,在这样训练区中地物的类别是已知的,用它建立分类标准,然后计算机将按同样的标准对整个图像进行识别和分类。
它是一种由已知样本,外推未知区域类别的方法;非监督分类是一种无先验(已知)类别标准的分类方法。对于待研究的对象和区域,没有已知类别或训练样本作标准,而是利用图像数据本身能在特征测量空间中聚集成群的特点,先形成各个数据集,然后再核对这些数据集所代表的物体类别。
与监督分类相比,非监督分类具有下列优点:不需要对被研究的地区有事先的了解,对分类的结果与精度要求相同的条件下,在时间和成本上较为节省,但实际上,非监督分类不如监督分类的精度高,所以监督分类使用的更为广泛。 细小地物在影像上有规律地重复出现,它反映了色调变化的频率,纹理形式很多,包括点、斑、格、垅、栅。
在这些形式的基础上根据粗细、疏密、宽窄、长短、直斜和隐显等条件还可再细分为更多的类型。每种类型的地物在影像上都有本身的纹理图案,因此,可以从影像的这一特征识别地物。
纹理反映的是亮度(灰度)的空间变化情况,有三个主要标志:某种局部的序列性在比该序列更大的区域内不断重复;序列由基本部分非随机排列组成;各部分大致都是均匀的统一体,在纹理区域内的任何地方都有大致相同的结构尺寸。这个序列的基本部分通常称为纹理基元。
因此可以认为纹理是由基元按某种确定性的规律或统计性的规律排列组成的,前者称为确定性纹理(如人工纹理),后者呈随机性纹理(或自然纹理)。对纹理的描述可通过纹理的粗细度、平滑性、颗粒性、随机性、方向性、直线性、周期性、重复性等这些定性或定量的概念特征来表征。
相应的众多纹理特征提取算法也可归纳为两大类,即结构法和统计法。结构法把纹理视为由基本纹理元按特定的排列规则构成的周期性重复模式,因此常采用基于传统的Fourier频谱分析方法以确定纹理元及其排列规律。
此外结构元统计法和文法纹理分析也是常用的提取方法。结构法在提取自然景观中不规则纹理时就遇到困难,这些纹理很难通过纹理元的重复出现来表示,而且纹理元的抽取和排列规则的表达本身就是一个极其困难的问题。
在遥感影像中纹理绝大部分属随机性,服从统计分布,一般采用统计法纹理分析。目前用得比较多的方法包括:共生矩阵法、分形维方法、马尔可夫随机场方法等。
共生矩阵是一比较传统的纹理描述方法,它可从多个侧面描述影像纹理特征。 图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程,此处特性可以是像素的灰度、颜色、纹理等预先定义的目标可以对应单个区域,也可以对应多个区域。
图像分割是由图像处理到图像分析的关键步骤,在图像工程中占据重要的位置。一方面,它是目标表达的基础,对特征测量有重要的影响;另一方面,因为图像分割及其基于分割的目标表达、特征抽取和参数测量的将原始图像转化为更抽象更紧凑的形式,使得更高层的图像分析和理解成为可能。
图像分割是图像理解的基础,而在理论上图像分割又依赖图像理解,彼此是紧密关联的。图像分割在一般意义下是十分困难的问题,目前的图像分割一般作为图像的前期处理阶段,是针对分割对象的技术,是与问题相关的,如最常用到的利用阈值化处理进行的图像分割。
图像分割有三种不同的途径,其一是将各象素划归到相应物体或区域的象素聚类方法即区域法,其二是通过直接确定区域间的边界来实现分割的边界方法,其三是首先检测边缘象素。
2.图像识别的研究现状
图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从 1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别, 应用非常广泛。
数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。现代图像识别技术的一个不足就是自适应性能差,一旦目标图像被较强的噪声污染或是目标图像有较大残缺往往就得不出理想的结果。
图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前,在图像识别的发展中,主要有三种识别方法:统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术,自20世纪70年代,其研究已经有几十年的历史,一直都受到人们的高度重视,至今借助于各种理论提出了数以千计的分割算法,而且这方面的研究仍然在积极地进行着。
现有的图像分割的方法有许多种,有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。从图像的类型来分有:灰度图像分割、彩色图像分割和纹理图像分割等。早在1965年就有人提出了检测边缘算子,使得边缘检测产生了不少经典算法。但在近二十年间,随着基于直方图和小波变换的图像分割方法的研究计算技术、VLSI技术的迅速发展,有关图像处理方面的研究取得了很大的进展。图像分割方法结合了一些特定理论、方法和工具,如基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等。
3.谁有“基于图像处理的数字仪表识别”的源程序或论文,谢谢
介绍了光学字符识别的几种方法以及神经网络的特点 ,神经网络技术能够解决传统OCR方法所不能解决的问题 ,同时指出了手写数字识别存在的困难 ,论证了利用神经网络技术解决这种困难的可能性。
本文实现了通过一个含有 1个隐藏层的BP网络来识别手写数字 ,并取得了良好效果 ,论证了这种技术用于手写数字识别的可行性。 【作者单位】:东华理工学院 江西抚州344000 (杨勇);东华理工学院 江西抚州344000(谢刚生) 【关键词】:神经网络;模式识别;手写数字 【分类号】:TP391.4 【DOI】:cnki:ISSN:1000-2251.0.2003-04-017 【正文快照】: 1 引言目前 ,在字符识别研究中使用最广泛的是光学字符识别 ,即OCR方法。
其统计模式识别方法注重数量特征 ,便于特征提取、分析和计算。但是 ,它将字符看成一种随机的二维点阵 ,没有考虑字符的结构特征和结构信息。
因此 ,这种方法对单一字符比较有效 ,而对不同字体的字符识别效果则较差。结构模式识别的方法是把待识别的模式看成由若干个比较简单的子模式构成的集合 ,任何模式都可以用一组基元及一定的组合关系来描述。
由于字符含有丰富的结构信息 ,可以设法提取含有这种信息的结构特征 ,作为字符识别的依据。但是 ,由于字符结构比较复杂… Some methods of OCR and feature of Neural Networks(NN) are introduced, and NN technique can solve problems which can't be solved by traditional OCR methods. At the same time, the exist difficult in handwritten digit recognition are pointed, and the possibility of solving the problems using NN technique is proved. NN approach for handwritten digit recognition being proposed in this paper and a one hidden layer BP networks being constructed, more effect are received and the feasibility is proved. 【Keyword】:artificial neural network(ANN);pattern recognition;handwritten digit。
4.本人毕设题目是关于神经网络用于图像识别方面的,但是很没有头续~
我简单说一下,举个例子,比如说我们现在搭建一个识别苹果和橘子的网络模型:
我们现在得需要两组数据,一组表示特征值,就是网络的输入(p),另一组是导师信号,告诉网络是橘子还是苹果(网络输出t):
我们的样本这样子假设(就是Sampledata1.txt):
p t
1 0 3 1
2 1 4 2
这两组数据是这样子解释的:
我们假设通过3个特征来识别一个水果是橘子还是苹果:形状,颜色,味道,第一组形状、颜色、味道分别为:1 0 3(当然这些数都是我随便乱编的,这个可以根据实际情况自己定义),有如上特征的水果就是苹果(t为1),而形状、颜色、味道为:2 1 4的表示这是一个橘子(t为2)。
好了,我们的网络模型差不多出来了,输入层节点数为3个(形状、颜色,味道),输出层节点为一个(1为苹果2为橘子),隐藏层我们设为一层,节点数先不管,因为这是一个经验值,还有另外的一些参数值可以在matlab里设定,比如训练函数,训练次数之类,我们现在开始训练网络了,首先要初始化权值,输入第一组输入:1 0 3 ,网络会输出一个值,我们假设为4,那么根据导师信号(正确的导师信号为1,表示这是一个苹果)计算误差4-1=3,误差传给bp神经网络,神经网络根据误差调整权值,然后进入第二轮循环,那么我们再次输入一组数据:2 0 4(当仍然你可以还输入1 0 3,而且如果你一直输入苹果的特征,这样子会让网络只识别苹果而不会识别橘子了,这回明白你的问题所在了吧),同理输出一个值,再次反馈给网络,这就是神经网络训练的基本流程,当然这两组数据肯定不够了,如果数据足够多,我们会让神经网络的权值调整到一个非常理想的状态,是什么状态呢,就是网络再次输出后误差很小,而且小于我们要求的那个误差值。
接下来就要进行仿真预测了t_1=sim(net,p),net就是你建立的那个网络,p是输入数据,由于网络的权值已经确定了,我们这时候就不需要知道t的值了,也就是说不需要知道他是苹果还是橘子了,而t_1就是网络预测的数据,它可能是1或者是2,也有可能是1.3,2.2之类的数(绝大部分都是这种数),那么你就看这个数十接近1还是2了,如果是1.5,我们就认为他是苹果和橘子的杂交,呵呵,开玩笑的,遇到x<=0,5、x=1.5、x>=2.5,我一般都是舍弃的,表示未知。
总之就是你需要找本资料系统的看下,鉴于我也是做图像处理的,我给你个关键的提醒,用神经网络做图像处理的话必须有好的样本空间,就是你的数据库必须是标准的。至于网络的机理,训练的方法什么的,找及个例子用matlab仿真下,看看效果,自己琢磨去吧,这里面主要是你隐含层的设置,训练函数选择及其收敛速度以及误差精度就是神经网络的真谛了,想在这么小的空间给你介绍清楚是不可能的,关键是样本,提取的图像特征必须带有相关性,这样设置的各个阈值才有效。OK,好好学习吧,资料去matlab中文论坛上找,在不行就去baudu文库上,你又不需要都用到,何必看一本书呢!祝你顺利毕业!
5.图像识别的具体应用
摘 要 图像识别技术是人工智能研究的一个重要分支,也是人们日常生活中使用最广泛的人工智能技术之一。近年来,随着深度学习技术的发展,图像识别准确率显著提高。本论文研究了图像识别的传统技术和深度学习技术,分析了深度学习技术的几点不足,并给出未来可行的解决方案。
【关键词】人工智能 图像识别 深度学习
1 概述
图像识别技术是人工智能研究的一个重要分支,其是以图像为基础,利用计算机对图像进行处理、分析和理解,以识别不同模式的对象的技术。目前图像识别技术的应用十分广泛,在安全领域,有人脸识别,指纹识别等;在军事领域,有地形勘察,飞行物识别等;在交通领域,有交通标志识别、车牌号识别等。图像识别技术的研究是更高级的图像理解、机器人、无人驾驶等技术的重要基础。
传统图像识别技术主要由图像处理、特征提取、分类器设计等步骤构成。通过专家设计、提取出图像特征,对图像进行识别、分类。近年来深度学习的发展,大大提高了图像识别的准确率。深度学习从大量数据中学习知识(特征),自动完成特征提取与分类任务。但是目前的深度学习技术过于依赖大数据,只有在拥有大量标记训练样本的情况下才能够取得较好的识别效果。本文认为研究如何在标记数据有限的情况下继续利用深度学习完成物体识别任务具有