强大的语音交互能力
赋能AI应用创新

由声云自主开发，为开发者赋能，促进智能语音产品快速落地，具有多功能，全链路支持，多场景，且适配海量语音终端应用方案。

开始使用了解更多

核心技术能力

我们提供业界领先的语音交互技术，助力开发者构建智能化应用

语音合成

可将文本实时、准确地转换为自然、流畅的语音，提供男声、女声、童声等多种合成音色，支持上百种语言，可调节语速、音调、音量等。

语音识别

采用行业领先的深度学习算法，为开发者提供行业领先的语音识别服务，广泛应用于客服中心、呼叫中心智能客服系统、智能电视等场景中。

声纹识别

能够通过抽取说话人语音中的声纹特征和已登记的声纹模型进行比较，对用户进行身份校验和鉴别，可进行“一对一验证”和“一对多辨识”，具有采集方便，支持远程身份认证等优点。

语义理解

可实现意图理解与智能问答两类核心功能，支持上下文语义分析、多轮对话、实体属性等，广泛应用于智能客服、车载导航、智能家居、穿戴式设备、智能机器人等领域。

机器翻译

采用国际先进的翻译技术及深度学习算法，可生成流畅的译文，支持中英、中俄、中韩等多种语言互译，具有翻译准确率高、翻译快速等优点。

语音识别

语音识别技术是将语音信号转换为文字的技术，它可以帮助我们实现语音输入、语音搜索、语音助手等功能。采用行业领先的深度学习算法，为开发者提供行业领先的语音识别服务，广泛应用于客服中心、呼叫中心智能客服系统、智能电视等场景中。

自然度

进一步提升了自然度、流畅度以及情感表现力，使其更接近真人发音

深度学习

实时语音合成技术的基础上，加入深度学习和神经网络算法的优化

多场景

支持多种应用场景，如客服系统、智能音箱、车载导航等

立即接入

语音合成

语音合成技术是将文字转换为语音的技术，它可以帮助我们实现语音播报、语音助手等功能。可将文本实时、准确地转换为自然、流畅的语音，提供男声、女声、童声等多种合成音色，支持上百种语言，可调节语速、音调、音量等

多样化

提供多种音色选择，包括男声、女声、童声等，满足不同应用场景的需求

可调节

支持调节语速、音调、音量等参数，用户可以根据需要自定义合成语音的效果

多语言

支持百种语言和多种方言，覆盖全球主要语言，满足不同地区用户的需求

立即接入

录音文件转写

录音文件转写技术是将录音文件中的语音转换为文字的技术，它可以帮助我们实现语音数据的整理和分析。采用先进的语音识别算法，确保转写结果的高准确率，支持多种音频格式的录音文件转写，如MP3、WAV等，支持批量上传和转写，提升工作效率

高准确率

采用先进的语音识别算法，确保转写结果的高准确率

多格式支持

支持多种音频格式的录音文件转写，如MP3、WAV等

批量处理

支持批量上传和转写，提升工作效率

立即接入

文字识别

文字识别技术是将图片中的文字转换为文字的技术，它可以帮助我们实现图片文字的提取和识别。支持多种文字类型的识别，如身份证识别、银行卡识别、车牌识别等，采用高效的图像处理算法，确保文字识别的速度和准确性，支持多种语言的文字识别，满足全球用户的需求

多语言支持

支持多种语言的文字识别，满足全球用户的需求

高效处理

采用高效的图像处理算法，确保文字识别的速度和准确性

多场景应用

适用于身份证识别、银行卡识别、车牌识别等多种应用场景

立即接入

行业解决方案

针对不同行业场景，提供定制化的语音交互解决方案

AI智能录音卡片

通过AI技术，实现录音文件的智能转写和分析，提升工作效率。

客服系统中心

提供7×24小时智能语音交互服务，合成甜美客服声音，如同真人，高效协助完成客户服务工作。

会议记录

将会议音频转换为文字，方便后期的文字处理和内容存档。

呼叫中心

将电话语音数据转写成文本，方便进行检索、质检及数据分析。

亚运会广播

为亚运会场馆提供赛事信息等语音广播服务。

有声阅读

协助文学小说类软件直接朗读相关作品，流畅清晰，解放双眼。

医院语音呼叫

协助医院完成叫号服务，减轻护士工作压力。

导航播报

将地图导航等信息直接语音播报给用户，极大提升了用户体验。

开发者中心

丰富的开发资源，助力快速集成语音交互能力

完善的文档

详细的API文档、开发指南和最佳实践，帮助开发者快速上手

多语言SDK

提供Java、Python、JavaScript等多种语言SDK，适配各类开发场景

在线调试

提供可视化API调试工具，快速验证接口功能和参数配置

查看开发文档

认证赠送免费额度

完成实名认证即可领取免费额度，企业认证享更高权益

功能模块	细分类型	个人认证（免费额度）	企业认证（免费额度）
语音识别	实时语音转写	10 小时	50 小时
语音识别	一句话识别	10 小时	50 小时
语音识别	录音文件转写	10 小时	50 小时
语音合成	语音合成	1 万字符	2 万字符
文本翻译	文本翻译	2 万字符	5 万字符
大模型会议总结	大模型会议总结	2 万 Token	5 万 Token
-	QPS	1	50

用量方案

套餐制计费，按能力购买资源包，单价更优惠。用完即止，无有效期。

实时语音转写

按时长计费

¥2000元 / 1000小时

实时将语音流转换为文字，适用于会议、直播、客服等在线场景。
按时长计费，用完即止，无有效期
实名认证可领免费额度，用尽后再购买

一句话识别

按时长计费

¥1900元 / 1000小时

针对短语音的高准确率识别，适用于语音指令、搜索、输入等场景。
按时长计费，用完即止，无有效期
实名认证可领免费额度，用尽后再购买

录音文件转写

按时长计费

¥1900元 / 1000小时

批量上传音频文件转写为文字，支持 MP3、WAV 等多种格式。
按时长计费，用完即止，无有效期
实名认证可领免费额度，用尽后再购买

语音合成

按字数计费

¥1000元 / 1000万字符

将文本转换为自然流畅的语音，支持多音色、多语言与语速调节。
按字数计费，用完即止，无有效期
实名认证可领免费额度，用尽后再购买

文本翻译

按字符计费

¥400元 / 1000万字符

高质量多语种互译，译文流畅准确，覆盖中英、中俄、中韩等。
按字符计费，用完即止，无有效期
实名认证可领免费额度，用尽后再购买

完成实名认证可领取对应能力的免费额度，免费额度用尽后可购买上述资源套餐继续使用。

License 资费说明

按设备授权，一次付费一年内所有接口无限调用，采购量越大单台年费越低，适合规模化设备出货场景。

标准版 · 100 台

按 SN 设备授权

¥180元 / 台 · 年

适合初创团队与小批量设备出货，按 100 台起授权。
授权有效期一年，到期可续期
一年内所有接口无限调用，无单独用量限制

进阶版 · 500 台

按 SN 设备授权

¥150元 / 台 · 年

适合中等规模批量出货，单台年费更优惠。
授权有效期一年，到期可续期
一年内所有接口无限调用，无单独用量限制

旗舰版 · 1000 台以上

按 SN 设备授权

¥120元 / 台 · 年

适合大规模设备出货，享最低单台年费与专属支持。
授权有效期一年，到期可续期
一年内所有接口无限调用，无单独用量限制

以上为公开参考价，1000 台以上及更大规模采购可享更优惠价格，详情请联系商务。

开始构建您的智能语音应用

注册开放平台账号，即可免费试用核心语音技术，开启智能交互新体验

免费注册

强大的语音交互能力 赋能AI应用创新

核心技术能力

语音合成

语音识别

声纹识别

语义理解

机器翻译

热门案例

AI录音笔落地案例

语音识别

自然度

深度学习

多场景

语音合成

多样化

可调节

多语言

录音文件转写

高准确率

多格式支持

批量处理

文字识别

多语言支持

高效处理

多场景应用

行业解决方案

AI智能录音卡片

客服系统中心

会议记录

呼叫中心

亚运会广播

有声阅读

医院语音呼叫

导航播报

开发者中心

完善的文档

多语言SDK

在线调试

认证赠送免费额度

用量方案

实时语音转写

一句话识别

录音文件转写

语音合成

文本翻译

License 资费说明

标准版 · 100 台

进阶版 · 500 台

旗舰版 · 1000 台以上

开始构建您的智能语音应用

强大的语音交互能力
赋能AI应用创新