据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:Hume AI,这家专注于情感智能语音界面的初创公司,最近推出了一项令人振奋的实验性功能——“语音控制”。这一全新工具旨在让开发者与用户,无需具备任何编码、AI 提示工程或音效设计技能,就能轻松创造个性化的AI声音。通过精准调节声音特征,用户可以轻松定制出符合需求的独特声音。
此功能是建立在Hume之前推出的“共情语音界面2”(EVI2)基础上的,EVI2显著提升了语音的自然性、情感反应能力及可定制性。与传统语音克隆技术大相径庭,Hume的产品专注于提供独特且富有表现力的声音,满足客户服务聊天机器人、数字助手、教师、导游以及无障碍功能等多种应用需求。
在“语音控制”中,开发者可以在十个不同维度上调整声音特征,如性别、果断性、兴奋度和自信心等。具体维度包括:
– 性别:在男性化和女性化之间调节。
– 自信度:声音的坚定度,介于胆怯和大胆之间。
– 浮力:声音密度,范围介于放气和浮力之间。
– 热情:声音中的兴奋感,平静与热情之间切换。
– 鼻音:声音的开放度,从清晰到鼻音。
– 放松度:声音压力,从紧张到放松。
– 平滑度:声音质感,介于平滑与断奏之间。
– 温和:声音活力,温和与有力之间变换。
– 紧密度:声音包容度,范围在紧密与气喘吁吁之间。
用户可通过虚拟滑块实时微调这些属性,使得定制过程简单明了。这一功能目前在Hume的虚拟平台上提供,用户只需免费注册即可访问。语音控制已经推出测试版本,并与Hume的Empathic Voice Interface(EVI)完美集成,广泛适用于各种应用程序。开发者可以选择基本语音,调整特性并实时预览结果,确保客户服务机器人或虚拟助手等实时应用程序间的可重复性和稳定性。
EVI2的影响在语音控制功能中表现得淋漓尽致。早期型号引入对话提示和多语言功能,拓宽了语音AI应用范围。例如,EVI2支持亚秒级响应时间,实现自然且即时的对话,并允许动态调整说话风格,成为企业的多功能工具。这一举措正是为了解决AI行业对预设声音的依赖问题,使品牌和应用更容易找到满足其需求的声音。Hume致力于开发出情感细腻的语音AI,引领行业进步。2024年9月发布的EVI2已大幅提升了语音延迟和成本效益,为语音调节功能提供安全替代方案。
总之,Hume AI的新功能为语音定制开辟了全新的可能性,让每一个用户都能轻松实现个性化声音!