我校在大数据时代的说话人声纹识别研究取得新进展
最近,开云下注(中国)官网-卡内基梅隆大学联合工程学院(SYSU-CMU Joint Institute of Engineering,简称JIE)教师李明博士提出了一种无需说话人标注的无监督说话人识别算法,对于大数据时代的海量语音数据信息提取具有重要的意义。
语音作为人类获取信息的主要来源之一,是人与外界交流中使用最方便、最有效、最自然的交际工具和信息载体。随着人类社会全面步入信息化,特别是通讯、多媒体和互联网技术的迅猛发展,智能语音技术也被越来越多地应用于人们的日常生活,如何更全面、更准确的识别出语音信号所包含的说话人信息,是该领域的一个研究热点。
李明博士课题组提出了一种利用无监督学习进行说话人识别任务的框架。他们面对的是一系列没有任何标记的数据,在训练数据中,利用affinity propagation聚类算法对未标记语音数据进行聚类,可生成若干聚类,每一个聚类可认为代表一个说话人,课题组为每一类别做一个临时的标签。在此时,未标记数据变成了已标记数据。利用此...



