在AI的发展进程中,语音交互和声波加密是两个极具潜力的方向。
语音交互的核心入口是“说话”,但现实中,大量用户的普通话夹杂着方言、口音、习惯语——这对语音识别模型是巨大的挑战,也是决定AI能否真正“普惠”的关键。
同时,声音的安全性正在成为新的隐患。现在已经有人利用AI技术,对某人的声音进行采样、调整、合成,生成足以以假乱真的语音。现在大家的注意力集中在“形象侵权”方面(如AI换脸),但声音侵权同样值得警惕——你听到的“他说的”,未必真的是他说的。
当语音交互成为主流,声音既是入口,也是身份。口音的包容性,决定了AI的普及深度;声纹的安全性,决定了AI的信任底线。