基于CTI技术的医疗信息声讯系统
济南奥格兰医疗器械有限公司    2016-07-21 08:39:00    文字:【】【】【

  为模拟信号,通过PSTN传输到电话用户。回放的波特率同其中/|ABC…代表状态机的各个稳定状态abc"表!录音时一样,所以可1以得到近似的原始语音效果,*,问文本信息。

  1前言近年来,计算机电话集成(CTI)W技术发展迅速。使用该技术,人们可以通过电话与计算机进行信息交流本文设计实现的医疗信息声讯系统,给电话用户提供了一语音界面,用户只要拨通系统的特服电话号码,按照语音提示,就可以查询录音信息或通过文语转换技术直接查询相应数据库的信息,从而获得相关的医疗帮助。

  2系统开发支持平台2.1DialogicD/41ESC电话语音卡电话语音卡是语音系统的基础,它一般包括语音处理和电话网络接口两部分。D/ 41ESC卡采用双处理器结构,由数字信号处理器和通用微处理器组成可帮助主机处理低层任务,如放音、录音等硬盘读写操作。极大地减轻了主机任务的处理负担,以小的主机开销达到大的系统性能2.2事件驱动状态机模型在系统中,我们通过建立有限状态机模型2〕来实现各种功能。状态机是一个事件驱动的程序模型。其处理条件和相关动作的逻辑都被定义在一个表中,该表描述了应用程序中所有可能的处理状态,及驱使应用程序从一个状态转到另一状态的事件。有限状态机是基于程控交换中大量使用状态转移这一原理来实现状态转移图示引起状态转移的事件。

  3系统软件功能模块系统主要有两方面的功能特点。一是利用语音信箱访问语音信息;二是利用数据库接口访问文本信息。包括以下功能模块:3.1语音数据库音元的选取:利用汉语音节独立性较强和数目有限的特点,以音节为单位,建立由汉语带调音节采样数据构成的语音库。

  汉语音节是带调音节,每个音一般有五个音调。汉语的音节特征明显,音节音联小于音素音联,所以本系统使用的音元以音节为单位。

  按拼音字母顺序排列音节,每个音节描述如下:structyinjie非汉字音音库:确定数字串(0- 9)英文字母(a-z)希腊文字(aP…)特殊符号(+、-、*、/n…)及组合符号(MbDb……)的读音。

  静寂音处理:文本中不发音字符比如标点符号皆作静音处理音库包括汉字音库和非汉字音库,共338ft 128个音元语音库结构合理,可方便检索、增加、修改维护等。

  3.2医疗信息语音信箱利用语音信箱,用户可以访问如下医疗信息。比如医院简介,专家信息,科室介绍,就医指导等。各科室、各专家都可以申请信箱。信箱通过录音和回放两个过程建立录音的过程就是将语音从一个连续的波形经过采样、量化转换为数字信号。录音质量受采样率和压缩比的影响。在应用程序中采用ADPCM4bits压缩编码、6KHz采样率选择合适的采样率和压缩比使语音质量高而存储量不大。回放的过程就是将存储在磁盘上的数字化语音信号恢复3.3文语转换文语转换是电话访问数据库的关键。基于多级内码的文语转换可以保证转换的正确性。它包括两个过程:①利用单向转换算法将多级文本转换为分词正确、无重音字的单级文本;②利用波形合成技术将单级文本转换为具有较高的清晰度和自然度的语音流如图所示:单向转换波形合成多级文本单级文本合成语音访问文本文件是检索式播放的具体实现,它是以语音数据库为语音播放文件,依据被访问文本文件建立检索式播放表,从而实现文本文件的电话访问。

  波形拼接合成步进行韵律设置,由音长、音强和音高的模式得到合成因素的韵律参数值。第二步从音库中选择拼接单元(子波),系统规定了一些选择规则。例如,合成因素的上下文和建库截取子波的上下文接近,所设置韵律特征与音库中的子波差别小等。第三步是调整所选择的子波,使其符合合成语句的韵律要求,其中音强调节对子波进行线性放大,调节声波的振幅即可;用在子波的相对稳定段抽取和插入整基音周期的方法来调节音长;音高调节比较复杂,先用一个目标基音周期的两倍长度的时间窗,按基音同步的方式,时间窗的中心对准信号基音周期起始点,从原始信号截取一系列波形片段,再将这些波形段按1/2重叠的方式循环叠加起来,就得到具有新的音高的子波。后,将这些调整好的子波拼接起来,就得到合成语音输出。

  3.4数据库信息查询数据库操作是指用户通过电话可以查询数据库的信息为此我们设计了数据库接口,通过该接口,用户可以访问病房信息、药房信息,还可以根据就诊号及时了解与本次就医有关的数据信息=它主要包括如下函数或过程:建关键字索引;求数据库结构信息;获得一条记录中几个字段或所有字段的内容;更新某条记录的指定字段的内容等索引库按关键字从小到大的顺序排列Dbfidx的长度为定值。

  有了数据库接口,可以实现数据库的电话查询。只要用户通过电话键输入查询关键字,系统会根据该关键字,利用数据库接口,将其对应的记录内容从缓冲区传递给文语转换模块,后,由该模块及电话语音卡的通讯模块将待查询信息从电话端播放3.5信息访问过程对多功能的语音信息系统,信息访问的路线设计非常重要。访问办法可分为一次拨号、多次拨号两种。多次拨号即语音菜单式的访问方式。用户在语音菜单的提示下,连续拨号后,就能听到要查询的信息一次拨号是用户把要查询的信息号码一次拨出。由计算机自动识别、分解该号码串,决定访问流程,把要查询的信息播放给用户。

  ①语音菜单:在语音菜单的设计中,我们采用了IndexPlay方式,具体实现如下:将所有提示音文件合并成一个音库分别求出每个语音文件的长度及它们在音库中的位置。

  每当需要某个提示时,就根据该提示文件在对应的状态建立相应的IndexPlay表,后调用inde5Lplay()播放提示音。

  ②一次拨号:一次拨号的信息号码由标志码、类别码、关键字码、结束码组成标志码的值或1或0,分别表示文件操作、数据库操作。类别码由三位数字组成,在文件操作中,用来区别录音回放、文本文件播放;在数据库操作中,类别码即不同的数据库代码。关键字码长大定义为7位结束码是“”整个信息号码的长度12但实际输入数码往往少于12个。例如:访问录音文件MSG123.VOX,只需输入*000112:“即可;访问关键字为33140的住院信息,只需一次输入”101433140“即可,其中014为数据库DATA014.DBF的类别码。在信息号码串中,* 4结束语我们设计的系统是单卡的四线小系统。由于该卡采用的是SCSA的开放式结构,可以将多个卡级连,使用户线从4条扩展到64条,从而提高接通率,方便更多的用户使用。

浏览 (18) | 评论 (0) | 评分(0) | 支持(0) | 反对(0) | 发布人:管理员
将本文加入收藏夹