资源描述:
《 基于ocr识别信息的语音合成在web上的实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现基于OCR识别信息的语音合成在WEB上的实现第
2、22卷第2期V0I-22NO.2湖北工业大学JournalofHubeiUniversityofTechnology2007年O4月Apr.2007[文章编号]1003—4684(2007)02—0041—04基于OCR识别信息的语音合成在WEB上的实现彭伟,刘幺和,谭保华.(1湖北工业大学计算机学院,湖北武汉430068;2湖北工业大学机械工程学院,湖北武汉430068;3湖北工业大学理学院,湖北武汉430068)[摘要]系统使用OCR设备,扫描与识别学生卡信息,并对所得信息进行软件支持和补偿.在此基础上,建立了一个基于A
3、SP.Net的在线考试系统.通过web技术与TTS技术相结合,实现了信息在不同客户端播报与提示,为外部信息转换到汉语文本进行探索,并为ATR实现语音播报打下基础.[关键词]光学字符识别;文语转换;语音合成;网络服务[中图分类号]TP318[文献标识码]:A近年来,ATR(AutomaticTargetRecognition)和TTVS(TexttoVisualSpeech)成为模式识别学科的研究热点[1].对于ATR系统和TTVS系统来说,在图像检测,识别方面,人们基本上能找到对应算法,但如何从数据方法转换到汉语文本,从而驱
4、动语音合成在Internet上实现却是个问题.而智能监控系统能够看到并理解物体行为,并把理解结果用自然语音的形式通过Internet表达出来,从而代替常规任务中人的大部分工作.为此,本文实现了一个系统,以对学生卡进行OCR识别,得到姓名,职务,地址,联系方式等一系列信息流,然后在中间件上进行软件支持与补偿,从而结合Web技术与TTs技术,在Internet不同客户端实现语音播报.1系统结构本系统采用3层结构.分别为外观层,中间层和数据层.如图1所示:外观层为WEB服务器,位于最外层,为用户提供一种交互式的界面;中间层为文语转
5、换服务器,处理业务逻辑;数据库层为数据库服务器,实现对数据的保存和读取操作.通过OCR名片识别,得到最原始数据,再通过软件补偿的方式,解析数据格式,并将数据导入到数据库中,然后基于ASP.NET,按照需求,从数据库中取得所需的数据,并通过TTS服务器进行文语转换.最后,客户通过WEBBROWSER在不同的客户端得到语音数据.客户端客户端web服务器TTS语音服务器图1系统构架数据库服务器采用的TTS服务器系北京捷通华声公司的JTTS4.0网络版.它通过TCP/IP进行网络传输和控制,为网络节点内的其他设备提供语音合成服务.后
6、台数据库系统使用微软公司的SQLSERV—ER2000,通过oCR数据到SQLSERVER数据格式的转换,可以方便,快捷地对数据进行操作.OCR技术是利用OCR识别器,对扫描之后的文字,数字,符号等信息进行识别.OCR设备选择汉王公司的A8NameCardcontroller.它识别速度快,准确率高,并且能够将识别数据存储为Ex—cel文件格式.[收稿日期]2006—1l一28[基金项目]湖北省教育厅重大科研项目基金(2003Z002),湖北省自然科学基金(2003ABA054),湖北省科技厅攻关项目基金(2003AA101
7、C06).[作者简介]彭伟(198O一),男,河北霸县人,湖北工业大学硕士研究生,研究方向;计算机应用.]●~一嗣■42湖北工业大学2007年第2期2TTS与TTVS语音合成技术语音合成技术简称TTS,学名文语转换系统.而TTVs是把声音和文字,图像集成在一起,实现直接由文本到可视语音的转换,TTVS对视觉语音(VisualSpeech)的研究是一种综合考虑声音和图像的多媒体技术.视觉语音是指人们在用语言交流时所表达出的面部表情和动作,它能在一定程度上传达人们想要表达的意思,并能帮助人们加深对语言的理解.在人机交互的过程中,
8、如果人们面对的不是单纯的文本,而是一个会说话的人物形象,则计算机界面更为友善,方便人们与计算机的交流.系统基本框架如图2所示.文本音位-FAP转换器HFAP图2TTVS基本框架同步播放●3基于XML的SSML语音合成标记{置吉Hj目3.1XML语言XML(ExtensibleMarkupL