1.毕业论文《数字语音录放系统创新设计》
基于单片机的语音录放系统设计 关键词: 单片机;数字语音电路; ISD1490;波形存储法 摘要: 设计了基于单片机的语音录放系统.该系统以 MCS89C51 单片机为核心器件, 控制四片 ISD1490 语音芯片工作, 每个语音芯片配以简单的外围电路自成独立的语音录放电路, 各个语音录放电路的录放功能及录放时间由单片机来控制, 编写不同的程序可实现不同的录放效果。
前沿 用磁带记录、存储、还原模拟语音信号的方法已有很长的历史, 基于这一方法的电子产品也到处可见,且这些产品的体积都很大,在使用的范围上受到了一定的限制. 单片机语音录放系统就是为解决这一问题而设计的.单片机语音录放系统是以数字电路为基础, 利用数字语音电路来实现语音信号的记录、存储、还原等任务. 数字语音电路是一种集语音合成技术、大规模集成电路技术以及微控制器技术为一体的并在近十几年迅速发展起来的一种新型技术.语音集成电路与微处理器相结合, 具有体积小、扩展方便等特点, 具有广泛的发展前景。 1 固体录音机原理 语音数字处理方法可以分为规则合成法、参数合成法和波形存储法三类, 前两类复杂且难度大, 目前使用较少, 波形存储法是普遍采用的一种.波形存储法的技术基础是A / D、D/ A 转换技术和多种的编码、解码算法.图1 说明了波形存储法的语音数字处理、记录及存储过程:首先用麦克风取得语音的电模拟量信号, 经适当放大后, A/ D转换器以一定的频率对其进行采样并转换为二进制数字量,并实时地对其进行编码,实现对实时数据的压缩以减少数据量,然后送入数据存储器中储存.图一 语音记录过程 图2 是数字语音还原的基本过程:按一定顺序从数据存储器中读出数据, 以对应的算法进行解码,合成为语音数据,这是一种实时的数据解压过程,恢复的语音数据送入D/ A 转换器还原成语音的模拟信号输出.图二 语音回放过程 2. 1 ISD1490 基本录放电路 ISD1490 语音芯片的内部已以 EEPROM 作为数据存储器,因此无需电池即能保存数据10 年以上,擦除和写入均可在片内自动完成而无需外部设备. 此外, 其片内还含有时钟振荡器、话筒扩大器自动增益控制电路、抗干扰滤波器、音频功率放大器等.因此它自身已具备了语音录放系统所需的全部基本电路, 只需配备一只驻极体话筒、一只喇叭、两只按钮、一个电源及少量电阻电容,就可以构成一个基本的录放系统(如图3 所示) .图 3 ISD1490 基本的语音录放系统 该芯片具有下列显著特点:外围元件少, 操作方便;零功率信息存储, 无需备用电源; 信息能可靠保存10 年以上,可重复录音10 万次;语音固化无需编程开发设备; 通过地址的选址可以分段录放,因此可以独立存放汉字语音,构成语音库;具有自动省电模式,在非录放状态时自动省电.有单一电源供电( + 5v) ;静态电流典型值 0. 5uA,最大值2uA;工作电流典型值15mA,最大值30mA. 2. 2 单片机语音录放系统本电路使用了四片 ISD1490, 每片都如图 3 所示接成基本的录放电路,最后用单片机将四个基本录放电路连接成一个整体. 因为每片录音芯片可录音 90 秒,四片共可录音 360 秒, 用单片微处理器 MCS89C51 进行控制, 当录音时间在 90秒之内时,只用 1# 芯片, 如录音时间超过90 秒时,启用2# 芯片, 在录音时间超过 180 秒时, 启用3# 芯片, 这样,用微处理器来完成定时和芯片自动选择,就可实现360 秒内任何时间长度 的语音录制与回放, 从而实现录音放音功能. 系统结构如图4. 图 4 单片机语音录放系统结构图 3 系统的软件设计 本系统软件设计较为简单, 主要是定时选片控制,每片语音电路的地址端均接地,录放控制端受MCS89C51 控制, 根据微处理器的定时, 当需要某一芯片录放时, 单片机相应的控制端起作用,即启动语音电路工作,部分程序框图如图5 所示.图 5 部分程序框图 4 结束语 单片机语音录放系统解决了传统录放机体积大、扩展不方便的缺点.本系统所设计的电路可实现360 秒内任意长时间的语音录放. 在此基础上对硬件和软件稍作改动, 便可完成其他的功能,如语音报警器,智能语音控制器等,为各种智能仪器仪表扩展语音功能奠定了基础, 具有广泛的发展前景。
2.语音合成技术的现状及发展趋势
文语转换系统的目的是将文字的输入自动地转换成语音输出,它在信息发布系统、语音应答系统、电子邮件中的语音服务、文稿校对系统以及残疾人语音辅助等许多方面有很大的应用前景。
我国对汉语文语转换系统的研究发展迅速,已有许多单位先后研制出汉语文语转换系统。由于汉语的复杂性,使得现有的汉语语音学规则不够完善和精细,目前以此为基础开发出来的汉语文语转换系统的语音质量与实际应用要求还相差一段距离。
本文针对现有汉语文语转换系统所存在的核心问题,从完善汉语的韵律规则展开研究工作。本文与传统的研究方法不同,将数据挖掘技术应用到汉语的韵律规则研究上。
数据挖掘是从数据库中发现新的有用知识的过程,现已发展了很多数据挖掘算法,神经网络是其中的一种。本文以神经网络作为核心算法,开发了一个基于语音数据的数据挖掘系统—SpeechDM,并用SpeechDM系统对汉语中二字词的声调变化进行了研究,初步寻找出更精细、更可用的声调变化规则,为开发高质量的文语转换系统打下了基础。
本文主要包括如下几方面的内容: 1.介绍了语音合成的历史与背景,并介绍了汉语语音合成的发展及汉语韵律规则的研究现状。
3.着急要一篇 多媒体在商业中的应用与发展的毕业论文 急需
摘要: 多媒体通信技术是当今世界科技领域中最有活力、发展最快的高新信息技术,它时时刻刻都在影响着世界经济的发展和科学技术进步的速度,并不断改变着人类的生活方式和生活质量。
多媒体通信综合了多种媒体信息间的通信,它是通过现有的各种通讯网来传输、转储和接收多媒体信息的通信方式,几乎覆盖了信息技术领域的所有范畴,包括数据、音频和视频的综合处理和应用技术,其关键技术是多媒体信息的高效传输和交互处理。 关键词:多媒体 图象 音频 功能 The application of multimedia technology Abstract: Multimedia communications technology is the world's science and technology in the field of the most dynamic and fastest growing high-tech information technology, it always have influence in the world economic development and the pace of scientific and technological progress and changing the human way of life and quality of life . A variety of integrated multimedia communications between the communications media information, it is through the various existing communications network to transmit and receive multimedia information and dump the means of communication, cover nearly the area of information technology in all areas, including data, audio and video The integrated treatment and application technology, its technology is the key to the efficient transmission of multimedia information and interactive processing Key words: Multimedia audio features images 引 言 随着技术的迅速发展,图像、视频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式。
多媒体通信是信息高速公路建设中的一项关键技术,是多媒体、通信、计算机和网络等相互渗透和发展的产物,它将极大地提高人们的工作效率,改变人们的教育、娱乐等生活方式,是21世纪人们通信的基本方式。 第一章 多媒体通信技术基础简介 多媒体通信的基本概念和特征 1.1 基本概念 媒体是信息表示和传输的载体,是一个重要的概念。
ITU-T I .374建议将媒体划分为感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体5类。 多媒体数据是指多种式样信息的载体,如文本、图形、图像、声音等数据。
其特点主要有以下几点: (1)多媒体数据种类繁多(大多是非结构化数据),不同来源的媒体,具有完全不同的形式和格式; (2)多媒体数据量庞大; (3)多媒体数据具有时间特性和版本概念,如在视频点播系统中必须考虑到媒体间以及媒体内部在时间上的同步关系。 由此可知多媒体数据与传统的数值和字符不同,因而其存储结构和存取方式也具有特殊性,描述它的数据结构和数据模型也是有差别的。
在这种情况下就产生了一种全新的数据库系统--多媒体数据库系统。 多媒体数据库是能够有效实现多媒体数据的存储、读取、检索等功能的数据库系统。
它的主要特点是: (1)继承了传统数据库的一些优点,例如数据独立性、利用数据库查询语言进行高层次查询、开发控制、容错技术等; (2)能对具有时空关系的数据进行同步和管理。 但是目前对于多媒体数据库的功能以及实现方法还没有达成共识,因而出现了多种形式的媒体数据库,并且实现方法也各不相同。
从其总体发展上看,多媒体数据库的数据模型可分为关系数据模型、面向对象的数据模型和超媒体数据模型3类。 基于不同数据模型的多媒体数据库管理系统(DBMS)的功能也有很大差别,通常基于关系数据模型的多媒体DBMS可以实现多媒体数据的存取,对多媒体数据对象之间的语义关系、时态关系、空间关系不加处理,所以这部分工作就留给应用程序去完成了。
面向对象的数据模型和超媒体数据类型可以支持多媒体数据对象之间的语义关系、时态关系、空间关系的处理,其抽象程度更高,但DBMS的实现也相对复杂。 在多媒体通信系统中另一个常出现的词汇是"超媒体"。
在出版物中经常会出现表示注解意思的"注"字,由"注"你可以找到与之相关的一段文字或一篇文章。这种由"注"而链接到一段文字或一篇文章的链即称为超链拨,同理,超级链也可以将若干不同媒体链接起来,其集合便称为"超媒体"。
1.2多媒体通信的特征 多媒体通信技术的发展打破了传统通信的单一媒体、单一电信业务的通信系统格局,反映了通信向高层次发展的一种趋势,是人们对未来社会工作和生活方式的向往。多媒体通信技术是一种综合技术,涉及多媒体技术、计算机技术、通信技术等多个领域。
多媒体通信系统必须同时兼有集成性、交互性、同步性3个主要特征。 1.2.1 集成性 多媒体通信系统的集成性指的是能对内容数据信息、多媒体和超媒体信息、脚本信息和特定的应用信息等4类信息进行存储、传输、处则和显现的能力。
(1) 内容数据信息 (2) 信息是以某一种结构的形式存在的,典型的结构有两种:一种是对象 构,其中可处理的最小单元为对象(Object);另一种是文件结构,其中 处理的最小单元为文件(File)。 多媒体和超媒体信息 多媒体和超媒体信息与单媒体信息不一样,它们是结构化的信息,由结构框架和内容数据2部分组。
4.求论文(语音识别)
试读结束,如需阅读或下载,请点击购买>
原发布者:吴泽琼
语音信号的分析与处理
摘要:本文针对语音信号时域、频域参数进行了系统详尽的分析,并在MATLAB环境下实现了基于DTW算法的特定人孤立词语音信号的识别。
关键词:语音信号;短时傅里叶;MFCC;动态时间规整
引言
语音信号参数分析是语音信号处理的前提和基础。语音信号处理包括语音通信、语音增强、语音合成、语音识别和说话人识别等方面。只有通过语音信号的分析才能获得语音本质特性的参数,才能利用这些参数进行高效的语音通信,才能建立语音合成的语音库,也才可能建立用于语音识别的模板和知识库。此外,语音合成音质的好坏、语音识别率的高低,都取决于语音信号参数分析的准确性和精度。因此,语音信号参数分析是语音信号处理研究中一项非常有意义的工作[1]。
近年来,语音识别已经成为一个非常活跃的研究领域。在不远的将来,语音识别技术有可能作为一种重要的人机交互手段,辅助甚至取代传统的键盘、鼠标等输入设备,在个人计算机上进行文字录入和操作控制。而在手持式PDA、智能家电、工业现场控制等应用场合,语音识别技术则有更为广阔的发展前景[2]。
在特定人孤立词语音识别中,最为简单有效的方法是采用DTW(Dynamic Time Warping,动态时间规整)算法,该算法基于动态规划(DP)22M-N3.2x=wavread(fname);for i=1:10if nargin < 6endFrameInc=80;count=count+1;
5.跪求 多媒体技术在电力系统中的应用 毕业论文(有开题报告和任务书
摘要: 多媒体通信技术是当今世界科技领域中最有活力、发展最快的高新信息技术,它时时刻刻都在影响着世界经济的发展和科学技术进步的速度,并不断改变着人类的生活方式和生活质量。
多媒体通信综合了多种媒体信息间的通信,它是通过现有的各种通讯网来传输、转储和接收多媒体信息的通信方式,几乎覆盖了信息技术领域的所有范畴,包括数据、音频和视频的综合处理和应用技术,其关键技术是多媒体信息的高效传输和交互处理。 关键词:多媒体 图象 音频 功能 The application of multimedia technology Abstract: Multimedia communications technology is the world's science and technology in the field of the most dynamic and fastest growing high-tech information technology, it always have influence in the world economic development and the pace of scientific and technological progress and changing the human way of life and quality of life . A variety of integrated multimedia communications between the communications media information, it is through the various existing communications network to transmit and receive multimedia information and dump the means of communication, cover nearly the area of information technology in all areas, including data, audio and video The integrated treatment and application technology, its technology is the key to the efficient transmission of multimedia information and interactive processing Key words: Multimedia audio features images 引 言 随着技术的迅速发展,图像、视频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式。
多媒体通信是信息高速公路建设中的一项关键技术,是多媒体、通信、计算机和网络等相互渗透和发展的产物,它将极大地提高人们的工作效率,改变人们的教育、娱乐等生活方式,是21世纪人们通信的基本方式。 第一章 多媒体通信技术基础简介 多媒体通信的基本概念和特征 1.1 基本概念 媒体是信息表示和传输的载体,是一个重要的概念。
ITU-T I .374建议将媒体划分为感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体5类。 多媒体数据是指多种式样信息的载体,如文本、图形、图像、声音等数据。
其特点主要有以下几点: (1)多媒体数据种类繁多(大多是非结构化数据),不同来源的媒体,具有完全不同的形式和格式; (2)多媒体数据量庞大; (3)多媒体数据具有时间特性和版本概念,如在视频点播系统中必须考虑到媒体间以及媒体内部在时间上的同步关系。 由此可知多媒体数据与传统的数值和字符不同,因而其存储结构和存取方式也具有特殊性,描述它的数据结构和数据模型也是有差别的。
在这种情况下就产生了一种全新的数据库系统--多媒体数据库系统。 多媒体数据库是能够有效实现多媒体数据的存储、读取、检索等功能的数据库系统。
它的主要特点是: (1)继承了传统数据库的一些优点,例如数据独立性、利用数据库查询语言进行高层次查询、开发控制、容错技术等; (2)能对具有时空关系的数据进行同步和管理。 但是目前对于多媒体数据库的功能以及实现方法还没有达成共识,因而出现了多种形式的媒体数据库,并且实现方法也各不相同。
从其总体发展上看,多媒体数据库的数据模型可分为关系数据模型、面向对象的数据模型和超媒体数据模型3类。 基于不同数据模型的多媒体数据库管理系统(DBMS)的功能也有很大差别,通常基于关系数据模型的多媒体DBMS可以实现多媒体数据的存取,对多媒体数据对象之间的语义关系、时态关系、空间关系不加处理,所以这部分工作就留给应用程序去完成了。
面向对象的数据模型和超媒体数据类型可以支持多媒体数据对象之间的语义关系、时态关系、空间关系的处理,其抽象程度更高,但DBMS的实现也相对复杂。 在多媒体通信系统中另一个常出现的词汇是"超媒体"。
在出版物中经常会出现表示注解意思的"注"字,由"注"你可以找到与之相关的一段文字或一篇文章。这种由"注"而链接到一段文字或一篇文章的链即称为超链拨,同理,超级链也可以将若干不同媒体链接起来,其集合便称为"超媒体"。
1.2多媒体通信的特征 多媒体通信技术的发展打破了传统通信的单一媒体、单一电信业务的通信系统格局,反映了通信向高层次发展的一种趋势,是人们对未来社会工作和生活方式的向往。多媒体通信技术是一种综合技术,涉及多媒体技术、计算机技术、通信技术等多个领域。
多媒体通信系统必须同时兼有集成性、交互性、同步性3个主要特征。 1.2.1 集成性 多媒体通信系统的集成性指的是能对内容数据信息、多媒体和超媒体信息、脚本信息和特定的应用信息等4类信息进行存储、传输、处则和显现的能力。
(1) 内容数据信息 (2) 信息是以某一种结构的形式存在的,典型的结构有两种:一种是对象 构,其中可处理的最小单元为对象(Object);另一种是文件结构,其中 处理的最小单元为文件(File)。 多媒体和超媒体信息 多媒体和超媒体信息与单媒体信息不一样,它们是结构化的信息,由结构框架和内容数据2部分组。
6.语音识别技术的前景应用
在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”;使用电话与通信网络,人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手表那么大,再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。
可以预测在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着改进语音识别系统的方向一步步地前进。至于什么时候可以建立一个像人一样完善的语音识别系统则是很难预测的。就像在60年代,谁又能预测今天超大规模集成电路技术会对我们的社会产生这么大的影响。