TTS 在线生成语音 本文详细介绍了利用文本转语音(TTS)技术在线生成语音素材的过程,并对文本配置、变量插入及特殊格式读法进行了全面阐述。 功能概述 TTS 功能用于将文本内容实时转换为标准音频文件,适用于动态话术场景(如账单金额通知、验证码播报)。用户可灵活配置固定文本与参数变量,支持在保存前实时试听,合成后的音频纳入素材库供外呼任务调用。 功能入口 登录呼叫中心控制台,在左侧导航栏选择 语音 > 语音素材 > 生成语音 ,进入管理页面。 功能介绍 创建 TTS 语音 在 TTS 文本生成语音页面,点击 添加 按钮; 在弹出窗口中填写以下信息: 语音名称:必填项,建议包含业务场景与版本(如“双11促销通知_男声版”),1–20 个字符; 文本类型:必选项,支持两种模式: 固定文本:直接输入全程不变的播报内容; 参数文本:输入包含变量的模板文本,实际呼叫时由系统动态替换; 语言选择:必选项,下拉选择目标国家/地区语言(如“中文(中国)”、“英文(美国)”、“日文(日本)”等),系统将据此加载对应的发音引擎; 文本内容编辑区: 在此区域输入具体话术; 插入变量:点击工具栏 插入 按钮,可选择预设变量(如 {name}、{amount}),用于动态替换; 插入停顿:点击工具栏 ⏸ 图标,可在语句间插入指定时长的停顿(如 0.5s, 1s),优化听感; 朗读方式:针对选中变量或文本段,下拉选择以下五种读法规则之一: 默认:按常规文本语境自然朗读; 号码:将数字串作为整体号码朗读(常用于电话号码、卡号等,保持连贯性); 字母逐个读出:将字符串中的字母或数字拆解为单个字符依次朗读(如“ABC123”读作“A、B、C、一、二、三”),常用于验证码或序列号; 日期格式:自动识别并规范播报年月日(如“20231001”读作“二零二三年十月一日”); 货币金额:自动转换为大写金额或规范读法(如“100.50”读作“一百元五角”); 实时试听(重要): 在点击保存前,可点击编辑区下方的 试听 按钮; 系统将根据当前配置的文本、变量样例、停顿及朗读方式即时合成语音并播放; 用户可反复调整参数并试听,直至效果满意; 确认无误后,点击 生成并保存 完成创建。 ⚠️ 格式要求: 文本长度:单次生成不超过 500 个字符(含变量占位符); 变量规范:变量名需与外呼数据表头严格一致,否则无法替换; 特殊符号:不支持复杂数学公式或特殊表情符号,系统将自动过滤或报错; 生成时长:合成后的音频时长不得超过 60 秒。 查看与播放已生成语音 在 TTS 语音列表中,点击目标条目操作列的 播放语音 按钮; 系统将播放该条目最终生成并保存的音频文件; 可通过播放器控制暂停、调节音量以及下载音频文件。 删除 TTS 语音 在 TTS 语音列表中,点击目标条目操作列的 删除 ; 在弹出的确认对话框中,点击 确认 ; 若删除成功,条目将从列表中移除。 ⚠️ 重要:仅当该 TTS 语音 未被任何自动外呼或预测式外呼任务引用时,才允许删除。若已被使用,系统将提示:“该语音素材正在被使用,无法删除”。