1.图像检索技术研究
基于内容的图像检索技术
2.3.1基于颜色特征的图像检索
( 1 )颜色特征
颜色特征是图像检索中应用最为广泛的视觉特征,主要因为颜色往往和图像中所包含的物体或场景十分相关,此外相对于其它视觉特征,颜色特征对图像本身的尺寸、方向、视角和依赖型较小,从而具有较高的鲁棒性。图像检索中颜色特征的表达涉及若干问题,首先需要选择合适的颜色空间来描述颜色特征,其次要采用一定的量化方法将颜色特征表达为向量形式,最后要定义一种相似性度量标准衡量图像之间颜色特征上的相似性。
( 2 )图像的颜色模型
所谓颜色模型是指某个三维颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色。颜色模型的用途是在某个颜色域内方便的标识指定颜色,由于每一个颜色域都是可见光的子集,所以任何颜色模型都无法包含所有的可见光[13]。在常见的几种颜色模型中[14] ,尺GB 、CYMK 、YUV是便于研究用硬件显示彩色的方法而提出的,xyz 、ucs 、u * v * w 是便于色度学的理论研究而提出的,它们都不能很好地与人眼的视觉特性相匹配,常用的视觉颜色以人眼视觉特征为基础,主要有HSV , HSI、HSL 等颜色模型。
( 3 )颜色特征的表达
对颜色的表达方法有很多种,如直方图法,累计直方图法,局部累加直方图法,颜色布局法,中心矩法等。因为彩色图像的数据量很大,所以各种方法共同的一点是都要用较有效和紧凑的方式来表达彩色信息。
.统计直方图[15]:为了利用图像的特征描述图像,可借助特征的统计直方图(简称直方图)表示图像的颜色特征。统计直方图实际上是一个1 --D 的离散函数,即有
以上参考于三七毕业设计论文网,更多参考请点击访问,希望能帮到你、
2.关于计算机文献检索的论文
摘要:在本文中,提出了一种模糊图箱数据模型和模糊空间的概念,给出了模糊相似性度量方法,描述了一个模糊空间中的检索过程。
关键词:基于内容 模糊检索 匹配 数据模型 1.模糊检索的基本概念 模糊检索即根据检索对象的模糊特征来查找所需内容。在传统的信息检索领域,最流行的查询是:精确的查询条件和与满足查询条件的结果。
而在实际使用中,有许多查询条件不能精确定义,查询结果却是一组与查询条件近似匹配的对象。其中包含了模糊概念,这就是模糊查询。
因此,在模糊查询中,查询条件是不确切的,查询结果是近似的。 2.模糊数据库模型 关系模型是传统数据库使用最多的数据模型。
显然,传统关系模型难以适应基于内容的图像数据库的模糊查询。为适应基于内容的图像检索,同时最大限度的利用关系数据库的优点,我们对关系模型的概念进行了 扩展。
其数据结构是一张由基本属性和超属性组成的二维表,即超关系构成。 3.模糊查询过程 模糊查询就是根据模糊特征来查找所需内容,由于检索中查询要求往往是根据人的主观性所决定。
因此很大程度上带有模糊性,我们用图1所示的查询体系结构来说明具有模糊特征的基于内容检索的基本方法。 3.1模糊查询接口 模糊查询接口是用户输入模糊查询条件的人—机交互接口。
模糊特征的描述实际上往往由用户的主观性所决定,对于图像纹理,习惯于用“很粗”、“中等”、“弱”这样的一些模糊概念来描述;形状一般用“几何形的”、“立体形的”或“似长方形的”、“正方形的”等概念描述;颜色特征通常用“很艳”、“一般”、“暗淡”或“大红”、“紫红”、“红”这样的模糊概念来描述。系统将复杂的多维特征经过模糊分类简化为有限的几个特征集上,数字化表示成模糊特征向量(Qji,j=1,…,Mi,i=1,…,q)。
要使用户模糊查询描述更精确,还需进行模糊特征的调整。当用户用模糊概念输入特征,计算机通过用相似性计算公式求得库中一些与用户输入特征相近的对象,返回给用户,然后由用户从这组相似对象中选择一个对象作为目标对象,并用模糊术语 (如“更窄”、“更暗”等调整参考对象的每个特征,这些模糊术语又被转化为一定的数值,经过相似性匹配求出更相似的对象。
假设调整后的特征值为则调整可用如下公式表示: = 其中, 是特征的当前值; 是特征调整后的值; 是特征的标准误差; 是由用户指定的改变映射成特征的结果(如“更窄”“更宽”等模糊术语)。 查询模块经过过滤操作得到更相似的对象组,用户再次选择直至找到要查询的对象。
3.2模糊相似性度量 模糊相似性度量是实现模糊相似匹配的核心,常用模糊相似距离来作为检查模糊查询向量和模糊图像向量之间的相似性的度量标准。为讨论方便,我们以模糊年龄的相似性度量为例,来定义模糊查询向量Qj,j=1,2,…,q和模糊图像向量Bj,j=1,2,…,q之间的相似性度量。
Qj, Bj是相同的模糊空间里的模糊子集(这里我们已经省略了上标)。 我们在多维模糊空间中对Q和B之间的距离dis定义为: card(A)表示模糊集的基数,定义为: 4. 结束语 模糊查询与基于内容的图像检索有着密切的联系。
本文提出了一种模糊图像数据模型和模糊空间的概念,该模型将可视特征、空间特征、语义特征看作超属性,既充分利用了传统关系数据库的优点,同时又考虑了图像数据以及模糊查询的特点,能对图像特征进行操作,文中提出的模糊空间和模糊相似性度量方法能支持基于模糊特征的图像查询,较好地体现用户图像查询的应用需求。 参考文献 1. 白雪生,徐光佑,史元春,基于内容检索的一种中间表达机制,软件学报,Vol.10(4),400-405 2. Wu,J.K.and A. Desai Narasimhalu, Fuzzy content-based retrieval in image database, Information Processing & Management, Vol. 34, No. 5, 513-534。
3.图像边缘检测算法的研究与实现 的开题报告
摘 要 针对基于PC实现的图像边缘检测普遍存在的执行速度慢、不能满足实时应用需求等缺点,本文借助于TI公司的TMS320DM642图像处理芯片作为数字图像处理硬件平台,DSP/BIOS为实时操作系统,利用CCS开发环境来构建应用程序;并通过摄像头提取视频序列,实现对边缘检测Sobel算子改进[1]。
关键词 DM642;Sobel算子;程序优化;图像边缘检测 1 引言 边缘是图像中重要的特征之一,是计算机视觉、模式识别等研究领域的重要基础。图像的大部分主要信息都存在于图像的边缘中,主要表现为图像局部特征的不连续性,是图像中灰度变化比较强烈的地方,也即通常所说的信号发生奇异变化的地方。
经典的边缘检测算法是利用边缘处的一阶导数取极值、二阶导数在阶梯状边缘处呈零交叉或在屋顶状边缘处取极值的微分算法。图像边缘检测一直是图像处理中的热点和难点。
近年来,随着数学和人工智能技术的发展,各种类型的边缘检测算法不断涌现,如神经网络、遗传算法、数学形态学等理论运用到图像的边缘检测中。但由于边缘检测存在着检测精度、边缘定位精度和抗噪声等方面的矛盾及对于不同的算法边缘检测结果的精度却没有统一的衡量标准,所以至今都还不能取得令人满意的效果。
另外随着网络和多媒体技术的发展,图像库逐渐变得非常庞大;而又由于实时图像的目标和背景间的变化都不尽相同,如何实现实时图像边缘的精确定位和提取成为人们必须面对的问题。随着DSP芯片处理技术的发展,尤其是在图像处理方面的提高如TMS320C6000系列,为实现高效的、实时的边缘检测提供了可能性[5]。
在经典的边缘检测算法中,Sobel边缘检测算法因其计算量小、实现简单、处理速度快,并且所得的边缘光滑、连续等优点而得到广泛的应用。本文针对Sobel算法的性能,并借助于TMS320DM642处理芯片[3],对该边缘检测算法进行了改进和对程序的优化,满足实时性需求。
2 Sobel边缘检测算法的改进 经典的Sobel图像边缘检测算法,是在图像空间利用两个方向模板与图像进行邻域卷积来完成的,这两个方向模板一个是检测垂直边缘,一个是检测水平边缘。算法的基本原理:由于图像边缘附近的亮度变化较大,所以可以把那些在邻域内,灰度变化超过某个适当阈值TH的像素点当作边缘点。
Sobel算法的优点是计算简单,速度快。但由于只采用了两个方向模板,只能检测水平方向和垂直方向的边缘,因此,这种算法对于纹理较复杂的图像,其边缘检测效果欠佳;同时,经典Sobel算法认为,凡灰度新值大于或等于阈值的像素点都是边缘点。
这种判定依据是欠合理的,会造成边缘点的误判,因为多噪声点的灰度新值也很大。2.1 图像加权中值滤波 由于图像中的边缘和噪声在频域中均表现为高频成分,所以在边缘检测之前有必要先对图像进行一次滤波处理,减少噪声对边缘检测的影响。
中值滤波是一种非线性信号的处理方法[2],在图像处理中,常用来保护边缘信息;保证滤波的效果。加权中值滤波,首先对每个窗口进行排序,取适当的比例,进行曲线拟合,拟合后的曲线斜率表征了此窗口的图像特征,再根据图像各部分特性适当的选择权重进行加权。
2.2 增加方向模板 除了水平和垂直两方向外,图像的边缘还有其它的方向,如135o和45o等,为了增加算子在某一像素点检测边缘的精度,可将方向模板由2个增加为8个即再在经典的方向模板的基础上增加6个方向模板,如图1所示。2.3 边缘的定位及噪声的去除 通常物体的边缘是连续而光滑的,且边缘具有方向和幅度两个特征,而噪声是随机的。
沿任一边缘点走向总能找到另一个边缘点,且这两个边缘点之间的灰度差和方向差相近。而噪声却不同,在一般情况下,沿任一噪声点很难找到与其灰度值和方差相似的噪声点[4]。
基于这一思想,可以将噪声点和边缘点区分开来。对于一幅数字图像f(x,y),利用上述的8个方向模板Sobel算子对图像中的每个像素计算,取得其中的最大值作为该点的新值,而该最大值对应的模板所表示的方向为该像素点的方向。
若|f(x,y)-f(x+i,y+j)|>TH2,对于任意i=0,1,-1;j=0,1,-1均成立,则可判断点(x,y)为噪声点。图2给出了图像边缘检测系统改进算法的软件流程图。
图1 边缘检测8个方向模板图2 系统结构图3 基于TMS320DM642的图像处理的设计及算法优化3.1 TMS320DM642功能模块及图像处理系统的硬件结构 DSP以高速数字信号处理为目标进行芯片设计,采用改进的哈佛结构(程序总线和数据总线分开)、内部具有硬件乘法器、应用流水线技术、具有良好的并行性和专门用于数字信号处理的指令及超长指令字结构(VLIW)等特点;能完成运算量大的实时数字图像处理工作。 TMS320DM642是TI公式最近推出的功能比较强大的TMS320C6x系列之一,是目前定点DSP领域里性能较高的一款[6]。
其主频是600MHz,8个并行运算单元、专用硬件逻辑、片内存储器和片内外设电路等硬件,处理能力可达4800MIPS。DM642基于C64x内核,并在其基础上增加了很多外围设备和接口,因而在实际工程中的应用更为广泛和简便。
本系统使用50 MHz晶体震荡器作为DSP的外部时钟输入,经过内部锁相。
4.信息检索论文/文献信息检索论文
信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。
但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。
本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。
为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。
集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。
它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。
图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。
2.1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。
因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。
集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。
资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。
下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作。
转载请注明出处众文网 » cnn图像检索毕业论文(图像检索技术研究)