1.求论文(语音识别)
试读结束,如需阅读或下载,请点击购买>
原发布者:吴泽琼
语音信号的分析与处理
摘要:本文针对语音信号时域、频域参数进行了系统详尽的分析,并在MATLAB环境下实现了基于DTW算法的特定人孤立词语音信号的识别。
关键词:语音信号;短时傅里叶;MFCC;动态时间规整
引言
语音信号参数分析是语音信号处理的前提和基础。语音信号处理包括语音通信、语音增强、语音合成、语音识别和说话人识别等方面。只有通过语音信号的分析才能获得语音本质特性的参数,才能利用这些参数进行高效的语音通信,才能建立语音合成的语音库,也才可能建立用于语音识别的模板和知识库。此外,语音合成音质的好坏、语音识别率的高低,都取决于语音信号参数分析的准确性和精度。因此,语音信号参数分析是语音信号处理研究中一项非常有意义的工作[1]。
近年来,语音识别已经成为一个非常活跃的研究领域。在不远的将来,语音识别技术有可能作为一种重要的人机交互手段,辅助甚至取代传统的键盘、鼠标等输入设备,在个人计算机上进行文字录入和操作控制。而在手持式PDA、智能家电、工业现场控制等应用场合,语音识别技术则有更为广阔的发展前景[2]。
在特定人孤立词语音识别中,最为简单有效的方法是采用DTW(Dynamic Time Warping,动态时间规整)算法,该算法基于动态规划(DP)22M-N3.2x=wavread(fname);for i=1:10if nargin < 6endFrameInc=80;count=count+1;
2.基于matlab的语音识别论文难不难
不难,我可以帮你写。
论文提纲可分为简单提纲和详细提纲两种。简单提纲是高度概括的,只提示论文的要点,如何展开则不涉及。这种提纲虽然简单,但由于它是经过深思熟虑构成的,写作时能顺利进行。没有这种准备,边想边写很难顺利地写下去。
编写要点
编写毕业论文提纲有两种方法:
一、标题式写法。即用简要的文字写成标题,把这部分的内容概括出来。这种写法简明扼要,一目了然,但只有作者自己明白。毕业论文提纲一般不能采用这种方法编写。
二、句子式写法。即以一个能表达完整意思的句子形式把该部分内容概括出来。这种写法具体而明确,别人看了也能明了,但费时费力。毕业论文的提纲编写要交与指导教师阅读,所以,要求采用这种编写方法。
3.基于matlab的语音识别论文难不难
不难,我可以帮你写。
论文提纲可分为简单提纲和详细提纲两种。简单提纲是高度概括的,只提示论文的要点,如何展开则不涉及。
这种提纲虽然简单,但由于它是经过深思熟虑构成的,写作时能顺利进行。没有这种准备,边想边写很难顺利地写下去。
编写要点 编写毕业论文提纲有两种方法: 一、标题式写法。即用简要的文字写成标题,把这部分的内容概括出来。
这种写法简明扼要,一目了然,但只有作者自己明白。毕业论文提纲一般不能采用这种方法编写。
二、句子式写法。即以一个能表达完整意思的句子形式把该部分内容概括出来。
这种写法具体而明确,别人看了也能明了,但费时费力。毕业论文的提纲编写要交与指导教师阅读,所以,要求采用这种编写方法。
4.求关于语音学的论文
普通话对英语语音的迁移作用摘 要: 本文在论述语言迁移理论本质的基础上,分析了影响迁移的因素,对汉英两种语言对比,从音素、音位、声调/语调语言、重音和节奏等层面分析了普通话对英语学习的负迁移作用,以便更好地帮助学生克服普通话的负迁移影响,促进英语语音的学习。
关键词: 普通话;英语语音;语言迁移;对比研究The Transferring Effect of Mandarin on English PhoneticsLin YuhangDepartment of Foreign Languages and Literatures, Zhangzhou Teachers College 01021225Abstract: This paper is meant to help the Chinese English-learners to overcome the negative phonetic transfer and promote the study of English phonetics by dealing with language transfer theories, analyzing the factors affecting language transfer, comparing and analyzing some phonetic features of the Chinese and English languages, such as phone, phoneme, tone/intonation language, stress and rhythm.Key words: Mandarin; English phonetics; language transfer; comparative analysis语音过关是英语学习的关键,同时也是难点。然而,外语界对语音教学问题的探讨却明显少于其他领域,这难免有些“避重就轻”之嫌。
将英汉两种语音进行对比研究,对比教学,不失为一种良策,如张凤桐教授编著的《英国英语语音学和音系学》就是按照这一指导思想编写的教材。对比研究的理论基础是语言迁移,同时,对比研究和教学是正视语言迁移作用的科学方法和手段。
然而就在将两种语音进行对比教学的过程中,产生了一些似是而非的说法,例如“普通话好,英语语音就好”是其中最具代表性的。这一说法过分夸大了语际间的正迁移作用,而忽略了负迁移作用。
应该说这一问题的答案是不确定的。世界上有各种各样的语言,虽然各种语言有其相通的一面,但每一种语言都有其特有的语音体系,并有自己独特的发音规律。
要全面正确地了解普通话对英语语音的迁移作用,就应该在认识语言迁移的本质和产生语言迁移因素的基础之上,将英汉语音、音位相关的方面作科学的对比研究。一、语言迁移概念及其实质奥苏伯尔的认知结构迁移理论代表从认知的观点来解释迁移的一种主流倾向,然后有符号性图式理论、产生式理论、结构匹配理论与情境性理论等迁移理论。
根据奥苏伯尔的认知结构迁移理论,“迁移是一种认知活动,体现了个体主动的心理加工过程”[1]。但也存在分歧,一些研究者着眼于各理论在更高层次上的概括,将迁移概括为“一种学习中习得的经验对其他学习的影响,是新旧经验的整合过程”[2],这种整合过程可以通过同化、顺应与重组三种方式实现,其实质是原有认知结构与新学习的相互影响、相互作用,从而形成新的认知结构的过程。
迁移(transfer)作为一个心理术语,是指已获得的指示、技能、方法等对学习新知识、技能的影响。迁移是人类认知的一个普遍特征。
在外语学习中,迁移“指的是人们已经掌握的知识在新的学习环境中发挥作用的心理过程”[3],主要是母语及母语学习经历对学习新语言的影响。语言迁移可分为正迁移(positive transfer)和负迁移(negative transfer)。
如果某个外语结构在母语中有对应结构,或母语对外语的学习起促进作用,在学习中就会出现正迁移现象。但是如果某个结构在母语中没有对应的结构,或者两种语言中的对应结构有差异,也就是说,母语对外语的学习起干扰或抑制作用,就会产生反面的迁移,从而影响外语的学习,这就是学习中的负迁移现象。
系统的语言迁移研究可追溯到上个世纪四五十年代的语言学家弗赖伊斯(C.Fries)和雷多(R.Lado)。他们从斯金娜(B.F.Skinner)的行为主义心理学理论出发,认为“学习是刺激与反应的强化,是习惯的形成,是新旧知识的联结。
因而在外语学习中,母语这种先前语言学习的习惯会对新的外语学习产生迁移作用”[4]。基于这一观点,他们认为“外语学习的主要困难是由两种语言的差异引起的,学习的主要任务就是找出并克服这种差异”[4],据此他们提出了对比分析假说(contrastive analysis hypothesis),即“将学习者的母语(mother tongue/native language)与目标语(target language)进行各方面的比较分析,找出两者的差异,解释或预测外语学习中已经或将要出现的困难与错误,并以此为指导教材的编写和教学活动。”
[4]20世纪60年代末,乔姆斯基提出了语言习得机制( language acquisition device)假说和普遍语法 (universal grammar)理论。他认为:“人类语言结构存在着普遍性(language/linguistic universals),这种语言的普遍性反映了人类的经验过程,反映了人类获得新知识能力的普遍性”[5]。
也就是说,人类生来就有自然学习语言的能力,它植根于人的内在机制,即语言习得机制。格林伯格( J.Greenberg)通过对跨语言调查(cross-linguistic surveys)特别是对语序的分析来研究和证明语言的普遍性。
总之,无论是强调母语迁移作用的对比分析假说,还是强调人类语言的普遍性而忽视母语迁移现象的普遍语法理论,都从不同的方面说明了正是各种语言具有一定的共。
5.毕业论文《数字语音录放系统创新设计》
基于单片机的语音录放系统设计 关键词: 单片机;数字语音电路; ISD1490;波形存储法 摘要: 设计了基于单片机的语音录放系统.该系统以 MCS89C51 单片机为核心器件, 控制四片 ISD1490 语音芯片工作, 每个语音芯片配以简单的外围电路自成独立的语音录放电路, 各个语音录放电路的录放功能及录放时间由单片机来控制, 编写不同的程序可实现不同的录放效果。
前沿 用磁带记录、存储、还原模拟语音信号的方法已有很长的历史, 基于这一方法的电子产品也到处可见,且这些产品的体积都很大,在使用的范围上受到了一定的限制. 单片机语音录放系统就是为解决这一问题而设计的.单片机语音录放系统是以数字电路为基础, 利用数字语音电路来实现语音信号的记录、存储、还原等任务. 数字语音电路是一种集语音合成技术、大规模集成电路技术以及微控制器技术为一体的并在近十几年迅速发展起来的一种新型技术.语音集成电路与微处理器相结合, 具有体积小、扩展方便等特点, 具有广泛的发展前景。 1 固体录音机原理 语音数字处理方法可以分为规则合成法、参数合成法和波形存储法三类, 前两类复杂且难度大, 目前使用较少, 波形存储法是普遍采用的一种.波形存储法的技术基础是A / D、D/ A 转换技术和多种的编码、解码算法.图1 说明了波形存储法的语音数字处理、记录及存储过程:首先用麦克风取得语音的电模拟量信号, 经适当放大后, A/ D转换器以一定的频率对其进行采样并转换为二进制数字量,并实时地对其进行编码,实现对实时数据的压缩以减少数据量,然后送入数据存储器中储存.图一 语音记录过程 图2 是数字语音还原的基本过程:按一定顺序从数据存储器中读出数据, 以对应的算法进行解码,合成为语音数据,这是一种实时的数据解压过程,恢复的语音数据送入D/ A 转换器还原成语音的模拟信号输出.图二 语音回放过程 2. 1 ISD1490 基本录放电路 ISD1490 语音芯片的内部已以 EEPROM 作为数据存储器,因此无需电池即能保存数据10 年以上,擦除和写入均可在片内自动完成而无需外部设备. 此外, 其片内还含有时钟振荡器、话筒扩大器自动增益控制电路、抗干扰滤波器、音频功率放大器等.因此它自身已具备了语音录放系统所需的全部基本电路, 只需配备一只驻极体话筒、一只喇叭、两只按钮、一个电源及少量电阻电容,就可以构成一个基本的录放系统(如图3 所示) .图 3 ISD1490 基本的语音录放系统 该芯片具有下列显著特点:外围元件少, 操作方便;零功率信息存储, 无需备用电源; 信息能可靠保存10 年以上,可重复录音10 万次;语音固化无需编程开发设备; 通过地址的选址可以分段录放,因此可以独立存放汉字语音,构成语音库;具有自动省电模式,在非录放状态时自动省电.有单一电源供电( + 5v) ;静态电流典型值 0. 5uA,最大值2uA;工作电流典型值15mA,最大值30mA. 2. 2 单片机语音录放系统本电路使用了四片 ISD1490, 每片都如图 3 所示接成基本的录放电路,最后用单片机将四个基本录放电路连接成一个整体. 因为每片录音芯片可录音 90 秒,四片共可录音 360 秒, 用单片微处理器 MCS89C51 进行控制, 当录音时间在 90秒之内时,只用 1# 芯片, 如录音时间超过90 秒时,启用2# 芯片, 在录音时间超过 180 秒时, 启用3# 芯片, 这样,用微处理器来完成定时和芯片自动选择,就可实现360 秒内任何时间长度 的语音录制与回放, 从而实现录音放音功能. 系统结构如图4. 图 4 单片机语音录放系统结构图 3 系统的软件设计 本系统软件设计较为简单, 主要是定时选片控制,每片语音电路的地址端均接地,录放控制端受MCS89C51 控制, 根据微处理器的定时, 当需要某一芯片录放时, 单片机相应的控制端起作用,即启动语音电路工作,部分程序框图如图5 所示.图 5 部分程序框图 4 结束语 单片机语音录放系统解决了传统录放机体积大、扩展不方便的缺点.本系统所设计的电路可实现360 秒内任意长时间的语音录放. 在此基础上对硬件和软件稍作改动, 便可完成其他的功能,如语音报警器,智能语音控制器等,为各种智能仪器仪表扩展语音功能奠定了基础, 具有广泛的发展前景。
6.语音识别技术的前景应用
在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”;使用电话与通信网络,人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手表那么大,再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。
可以预测在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着改进语音识别系统的方向一步步地前进。至于什么时候可以建立一个像人一样完善的语音识别系统则是很难预测的。就像在60年代,谁又能预测今天超大规模集成电路技术会对我们的社会产生这么大的影响。
转载请注明出处众文网 » 语音识别毕业设计论文(求论文语音识别)