应用简介
文语通电脑版是一款专业并实用的语音朗读软件,支持各种常用的文档格式,如txt、html等常用格式,再配上真人语音库,就可以用清晰、自然、流畅的语音朗读出来,可供选择的配音有很多,按照喜欢的语音下载相应语音包即可。
文语通在朗读过程中,可以按照顺序播放多个音频,并支持音频合成,可实现一边合成一边朗读的“实时预览模式”,帮助用户更准确地选择语音效果。
【软件特色】
方便灵活的应用架构:基于TCP/IP的高效网络语音合成服务和集中式的资源管理机制,形成客户端-资源管理器-服务器有机结合的体系架构,构建可灵活伸缩的方案,其高可用性历经众多重点行业大规模关键业务的应用检验,确保提供值得信赖的7×24小时不间断自动化语音服务。 并支持分布式应用架构(专利技术),负责文本分析和预处理的前端与负责语音合成的后端可以分别部署在异地服务器上,远程网络之间传输的只是经分析标注的文本信息,从而极大降低语音应用的网络带宽要求,非常适合基于互联网的大规模分布式语音应用。
灵活高效的开发接口:InterPhonic SDK针对不同开发工具,不同集成要求和方案,提供多种形式的开发接口,包括:标准开发接口(DLL)、COM组件、SAPI开发接口等,开发者可以根据实际需要灵活选择。提供丰富的开发例程和文档,帮助合作伙伴加速语音应用开发过程。
丰富的参数设置与灵活调整功能:提供丰富完善的动态参数设置与调节功能和工具,帮助用户对语音合成效果进行灵活高效的控制与管理。提供对全局参数(如音量、语速、音高等)、用户词典、用户规则、定制资源包统一进行配置和管理的工具;数字、标点符号、英文发音方式的设定;中英文加词功能,可以指定每个字词的拼音或音标等等;提供统一的简单易用图形化用户界面进行操作设定,并可通过API参数进行动态设置和调整,还支持以CSSML(中文语音合成标记语言)进行标记、描述和控制。
支持开放式标准:全面支持中文语音合成系统通用技术标准(GB/T21024-2007),遵循标准规定的术语定义、分类标准、数据交换格式标准和应用规范。
支持语音合成标记语言(SSML:Speech Synthesis Markup Language),它是W3C的语音接口框架的一部分,是关于语音应用和在万维网上构建语音应用的一套规范,通过SSML,人们可以更多的通过移动电话、桌面计算机和其他设备来聆听合成语音,把计算和信息传输延伸到全球每个角落。
支持媒体资源控制协议(MRCP:Media Resource Control Protocol),它由IETF发布,定义了媒体服务器和网络语音资源(包括语音识别和语音合成服务器)之间的接口标准。
高效便捷的增强工具集:科大讯飞在长期帮助客户进行应用开发和效果优化的过程中,积累了丰富的实践经验,在此基础上逐步形成了一系列使用便捷的高效组件,如离线语音应用工具、CSSML可视化编辑工具、DOC/XLS文本格式转换工具等。灵活运用这些工具有助于加速应用开发,优化合成效果、方便系统维护和技术支持。
字符集、语音数据格式支持:全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE编码字符集,自动识别UNICODE文本;支持直接输出多种采样率的语音数据格式(包括6K/8K/11K/16K)的线性Wav、A/U率Wav和Vox等多种格式的语音数据。
广泛的平台支持:支持主流的操作系统,服务器端支持Windows、Unix、Linux等操作系统,客户端支持Microsoft Windows、SUN Solaris、REDHAT Linux、SUSE Linux等操作系统。
与业内知名的相关平台和设备商均有过成功的集成案例。通过与众多平台和设备提供商、系统集成商及软件开发商的紧密合作,能够保证向用户提供围绕语音应用全程的专业服务。
CSSML,效果提升更自如:CSSML(Chinese Speech Synthesis Markup Language)是由科大讯飞提出并牵头制订的中文语音数据描述规范。该标准得到了国家863专家组、国家信标委和国家技术监督局的大力关注与支持,2005年正式通过国家标准化组织的评审,成为中文语音合成技术标准与规范的重要内容。CSSML针对中文语音应用设计和扩展,可以对多种特性进行灵活标注与控制,并与SSML兼容。
预录语音,衔接流畅应用简便:InterPhonic提供业界创新的预录音统一管理功能,将预录音作为语音合成系统的资源,并通过提示音智能匹配和合成模板等方式使预录音与合成音匹配更加容易、衔接更加流畅,同时避免频繁处理提示音播放与语音合成的切换与过渡问题,简化应用流程的复杂程度,进一步提高服务效果与质量。
背景音乐,快捷提升用户体检:InterPhonic提供业界首创的背景音功能,通过系统提供的简单易用工具,可以便捷高效的添加背景音乐,调整背景音乐和合成语音的音量对比,并可直接试听实际效果,使语音服务更加亲切自然。
【怎么保存音频】
1、首先下载安装文语通,并安装相应的音频输出插件。语音转换工作就是通过文语通输出插件进行的,正常输出的音频格式为WAV,虽然音质完美然而储存位置大,不是保存的最佳格式。
2、打开文语通5.0,输入文本内容,并在音库中选择喜欢的音色,可以选择的有粤语、普通话、英语等多个语种,还可以设置语速、音高、音量等多种参数。
3、点按Ctrl+A,选中文本内容,点击【合成】-【导出到(X)】按钮,生成语音文件。
4、设置音频文件名称,并选择保存类型,点击【保存】即可。
5、在文件夹位置中找到刚保存的WAV音频。
6、想要转换为MP3格式的,需要打开音频处理软件,常用的有Audition,将音频拖拽进来,形成相应的音轨。
7、调整音频位速、比率、频率等参数,点击【文件】-【另存为】选择MP3格式,最后点击保存即可,保存后的MP3文件更有利于分享传播。
【如何增加语音包】
首先下载文语通5.0,配置合成引擎,如果你的系统没有语音库(xp系统默认只有一个英文声音的语音库);
可在软件中单击:下载语音库按钮;
进入语音库下载页后,可先试听各个语音库的朗读效果;
再下载一个你认为朗读声音最好的语音库,安装即可使用本软件进行朗读了。
【怎么循环播放】
1、首先在文语通中添加多个音频文件,建立播放列表。
2、点击“打开文件”的2~4步骤打开文件,按住Ctrl键的同时单击鼠标可以选择多个文件。
3、单击“循环播放”按钮,启动循环播放功能,能够在朗读完播放队列的最后一个文件后,自动从第一个文件开始重新朗读。
4、再次单击该按钮,可以取消循环播放的功能。