TTS 在线生成语音

本文详细介绍了利用文本转语音（TTS）技术在线生成语音素材的过程，并对文本配置、变量插入及特殊格式读法进行了全面阐述。 
 功能概述 
 TTS 功能用于将文本内容实时转换为标准音频文件，适用于动态话术场景（如账单金额通知、验证码播报）。用户可灵活配置固定文本与参数变量，支持在保存前实时试听，合成后的音频纳入素材库供外呼任务调用。 
 功能入口 
 登录呼叫中心控制台，在左侧导航栏选择 语音 > 语音素材 > 生成语音 ，进入管理页面。 
 
 功能介绍 
 创建 TTS 语音 
 在 TTS 文本生成语音页面，点击 添加 按钮； 
 
 在弹出窗口中填写以下信息： 
 
 
 
 语音名称：必填项，建议包含业务场景与版本（如“双11促销通知_男声版”），1–20 个字符； 
 
 
 文本类型：必选项，支持两种模式： 
 
 固定文本：直接输入全程不变的播报内容； 
 参数文本：输入包含变量的模板文本，实际呼叫时由系统动态替换； 
 
 
 
 语言选择：必选项，下拉选择目标国家/地区语言（如“中文（中国）”、“英文（美国）”、“日文（日本）”等），系统将据此加载对应的发音引擎； 
 
 
 文本内容编辑区： 
 在此区域输入具体话术； 
 
 插入变量：点击工具栏 插入 按钮，可选择预设变量（如 {name}、{amount}），用于动态替换； 
 插入停顿：点击工具栏 ⏸ 图标，可在语句间插入指定时长的停顿（如 0.5s, 1s），优化听感； 
 朗读方式：针对选中变量或文本段，下拉选择以下五种读法规则之一：
 
 默认：按常规文本语境自然朗读； 
 号码：将数字串作为整体号码朗读（常用于电话号码、卡号等，保持连贯性）； 
 字母逐个读出：将字符串中的字母或数字拆解为单个字符依次朗读（如“ABC123”读作“A、B、C、一、二、三”），常用于验证码或序列号； 
 日期格式：自动识别并规范播报年月日（如“20231001”读作“二零二三年十月一日”）； 
 货币金额：自动转换为大写金额或规范读法（如“100.50”读作“一百元五角”）； 
 
 
 
 
 
 实时试听（重要）： 
 
 在点击保存前，可点击编辑区下方的 试听 按钮； 
 系统将根据当前配置的文本、变量样例、停顿及朗读方式即时合成语音并播放； 
 用户可反复调整参数并试听，直至效果满意； 
 
 
 
 确认无误后，点击 生成并保存 完成创建。 
 ⚠️ 格式要求： 
 文本长度：单次生成不超过 500 个字符（含变量占位符）； 
 变量规范：变量名需与外呼数据表头严格一致，否则无法替换； 
 特殊符号：不支持复杂数学公式或特殊表情符号，系统将自动过滤或报错； 
 生成时长：合成后的音频时长不得超过 60 秒。 
 查看与播放已生成语音 
 在 TTS 语音列表中，点击目标条目操作列的 播放语音 按钮； 
 
 系统将播放该条目最终生成并保存的音频文件； 
 可通过播放器控制暂停、调节音量以及下载音频文件。 
 
 删除 TTS 语音 
 在 TTS 语音列表中，点击目标条目操作列的 删除 ； 
 
 在弹出的确认对话框中，点击 确认 ； 
 
 若删除成功，条目将从列表中移除。 
 ⚠️ 重要：仅当该 TTS 语音 未被任何自动外呼或预测式外呼任务引用时，才允许删除。若已被使用，系统将提示：“该语音素材正在被使用，无法删除”。