您好、欢迎来到现金彩票网!
当前位置:秒速快三 > 说话人确认 >

测试规整零规整 相比只是在计算 的顺序上有所不同其计算流程为

发布时间:2019-07-17 09:15 来源:未知 编辑:admin

  测试规整零规整 相比只是在计算 的顺序上有所不同其计算流程为 用第二批冒认者 用于 的冒认数据 与第一批冒认者 用于 的冒认数据 计算得分矩阵 计算其相应 目标说话人与测试语音计算原始得分然后与 规整最后与 作规整。实验结果与分析 实验语音库本章实验的目的主要是研究 技术在信道变化情况下说话人确认的

  测试规整零规整 相比只是在计算 的顺序上有所不同其计算流程为 用第二批冒认者 用于 的冒认数据 与第一批冒认者 用于 的冒认数据 计算得分矩阵 计算其相应 目标说话人与测试语音计算原始得分然后与 规整最后与 作规整。实验结果与分析 实验语音库本章实验的目的主要是研究 技术在信道变化情况下说话人确认的鲁棒性。实验的实施需要有一个好的说话人识别数据库它应该具备多种语音信道 电话信道、麦克风信道等 发音人的规范化 性别、年龄、健康状况、语种、教育水平、分布地域等 数据采集环境规范化 传输信道移动、固话、网络传输、安静的室内、办公环境、嘈杂的室外环境等 。为达以上要求 评测中提供了标准说话人确认数据库。数据库的标准化可以为研究成果提供一个公平的、更有说服力的平台。本章实验需要用到 数据库相关描述如下 数据库 数据库先后按三个时期录制 分别为 。三个时期都以电话交谈的方式录制 采样率为 双声道 语言为英语 每个录音参与者被要求每次电话交谈至少 分钟 期间会被邀约录制多次。本章实验涉及 语音库。其中语音库参与者一共 个人 位男性、 位女性 语音库参与者一共为个人 位男性、 位女性 数据库从年开始 评测以来 后续每一次评测使用的数据库都是在前面几年评测的基础上 根据当前研究水平及实际应用情况进行适当的调整录制的 在说话人确认中的研究博士论文而积累了大量的数据库。年以前 数据库的环境比较简单 主要从 数据中进行挑选适合用于说话人识别的语音段 而且主要都是在移动峰窝电话上采集的数据。自 年后 开始从自己组织录制的数据库 中挑选训练、测试和开发集的数据。而且随着评测研究成果的反馈 数据库 逐渐针对说话人识别任务做了多方面的改进 使其不仅限于用于研究 而是越来越贴近实际应用场合 从而大大提高了对话者识别技术的鲁棒性要求 具体体现在以下几个方面 、对同一个说话人 训练和测试中覆盖了多个不同说话风格的语音样本 如不仅有普通语速的通话风格 还有随着说话人情感和谈话主题变化的语料 朗读、故意在高、中、低声调中变化着谈话、歌曲、语速变化等 、环境“噪声和传输信道开始逐渐复杂化和多样化 电话信道涵盖了移动电话、固定电话 无绳电话等 麦克风类型几乎开始覆盖实际应用中所有类型 从最初的碳棒性和动圈式发展到现在的普通式、耳塞式、手持式等各种情形。 、多语种的引入。目前 评测中虽然主要是以英语为主 但其他语种数据在也逐渐增加 中就已经达到了 多种 且一般都会保证每个说话人至少含有双语的情况。 】数据库为 采样 量化 含有 位女性 位男性 个说话人。为日常的通话数据 信道涵盖固定、移动电话和无绳电话、并且开始考虑到多语种及双语话者问题 语种平均分布在英语、汉语、阿拉伯语、法语、俄语这 个语种上。该数据库的设计在信道和语音上都比较平衡 主要用于训练 模型 信道空间及得分规整等。 不同的是开始加入麦克风信道的数据 而且信道环境更加复杂 语种数目有所增加 但主要是英语。 数据基本情况跟类似 数据库的设计也同样考虑了跨语种、双语说话人情况、复杂信道等问题。但语种数目和交叉测试情况比 又有所增加 总数达到了 多种。 墩据库在以前数据库上增加了采访情况下的电话麦克风信道数据同时也含有电话通话情况下的麦克风数据 和一般情况下的电话信道数据 数据来自最新的数据库。不管是在信道复杂性、语种、还是背景噪声上 复杂度都有所增加。而最大的变化在于引入了采访环境下的 风格的数据 并加入到核心测试集中 而集合的人数也增加到了上千人。 包括 种训练情况和 种测试情况 其中 是核心任务。训练 包括 两种情况每句原始语音长度 分钟左右 双声道录制 每位注册人只有一句训练语音。测试 包括 情况每句测试 分钟左右。博士论文基于短语音和信道变化的说话人识别研究核心任务是 评测要求必须完成的 为了便于结果的比较 本章实验主要是在 任务上完成的。 基于 的说话人确认实验 实验目的本实验的目的是考察 技术完成 核心任务的情况。相同任务的前提下执行三种不同的方案 说话人确认最常用的标准模型 方法 传统的 方法 参照文献 本章提出的基于本征信道空间拼接的 方法。通过三种方案的对比来验证第 种方案对信道变化的情况更具一定的鲁棒性。 实验设计本实验执行 核心任务 。该任务有八个子任务 、任务 次测试 、任务 训练和测试使用同样的麦克风 、任务 训练和测试使用不同的麦克风 、任务 次测试 、任务 次测试 、任务 次测试 、任务 仅英语 、任务 仅英国本土的说话人 其中 任务 包括任务 和任务 任务 包括任务 和任务 所以本章实验做任务 。本实验采用男女分别执行任务的形式即实验中男女分开训练和测试。 前端处理使用过零率与能量相结合的双门限端点检测 预加重系数 特征构成 维特征。 基线系统实验在任务 系统作为一个基线系统 实验具体方法可参考文献 时的相关因子取。男女 各自独立训练 训练数据包含尽可能多的信道类型 本章实验采用电话、麦克风、采访三种信道。最后形成男女各 采用目标说话人及测试说话人以外的说话人。包含了电话、麦克风两种信道。及得分规整所使用的数据库设计如表 个语音段第一批冒认女 个说话人 第二批冒认女个说话人个说话人 个说话人个说话人系统在 上的说话人确认实验如表 所示。其中 代表等错误率 代表最小检测代价 代表没有做任何得分规整。任务 任务 任务 任务 任务任务 任务 任务 任务 任务 任务 任务 任务 任务 任务 任务 任务 任务 任务 任务 分析可得得分规整技术对说话人确认性能的提高大有帮助 以女性任务 表现最好的要比表现最差的 减少 。大部分黑体数字 每项任务中表现最好的 偏高。博士论文基于短语音和信道变化的说话人识别研究传统 系统实验 三大空间的训练所用数据库见表 三大空间矩阵训练数据库列表实验中及得分规整所用冒认数据库同表 。说话人因子数为 信道因子数为 。传统 系统在 上的说话人确认实验如表 所示表 传统 系统在 上的说话人确认实验因实验 已证明 其它规整方法好这里只列出传统 系统在这两种较好得分规整方法下的 。与基线系统相比任务性能已有很大提高 以女性为例 四大任务在各个最佳时期相比 黑体 传统 比基线系统在 上减少 。所以当采用技术时 其性能比 标准技术有了很大提高 在信道变化的情况下 表现出了很强的鲁棒性。 基于本征信道空间拼接的 系统实验该实验分翔 练其独立的本征信道空间矩阵 加。训练时采用 数据、训练乩扣时采用 数据、训练 时采用 数据。说话人因子数为 信道因子数为 信道因子数为 信道因子数为 。基于本征信道空间拼接的 系统在 上的实验结果如表 所示。 在说话人确认中的研究博士论文表基于本征信道空间拼接的 系统在 上的说话人确认实验对比表 改进后的在四大任务中的表现都要比传统 优秀。以女性为例 分别减少 。可见拼接技术可解决本征信道训练数据不均衡问题该技术提高了 在信道变化情况下的实用性。 基于 的说话人确认实验 实验目的本实验的目的是考察 在核心任务 中的表现 通过实验验证三种信道补偿方法 在信道变化情况下的有效性并进一步与本章所提出的 补偿方法比较。 实验设计本实验执行 任务 次测试 无信道补偿的基线系统实验该实验最后得到每个说话人的 之后 直接采用余弦距离进行得分计算 而不进行信道补偿 用此作为基线系统与基于信道补偿方法的 作比较。全局差异因子取 。该实验及后续实验所需相关训练数据库如表 基于的鲁棒说话人确认实验训练数据库列表全局差异矩阵丁 个说话人博士论文基于短语音和信道变化的说话人识别研究基线系统在 中任务 的表现见表 基线系统在任务 中的说话人确认实验 基于 实验计算类内协方差矩阵的数据库见表其补偿方法在 中任务 的表现见表 在任务中的说话人确认实验 可得通过 信道补偿之后 其识别性能与基线系统相比已有很大提高 男性和女性的 分别下降了 实验计算投影矩阵的数据库见表 其补偿方法在 中任务 的表现见表 在任务中的说话人确认实验 技术应用中本文为了最小化信道差异而旋转空间 但没有降维 其性能比基线系统还差些 但通过降维 信道补偿的优 在说话人确认中的研究博士论文越性就突显出来了其性能越来越好 当降到 男性及女性的达到最低。从 维降到 男女分别下降了 。男女最高与最低分别相差 实验通过去除特征空间中干扰的方向来寻求适合的投影矩阵 显示的是技术中去除的维数和系统性能之间的关系。表 基于 在任务中的说话人确认实验 通过表分析可得 从去除 维到去除 系统性能己提高到最佳状态从男女 来看 已下降 。再继续增加去除维数其性能会越来越差 因为在去除信道干扰方向的同时 也去除了许多反映说话人个性的方向。 基于 实验根据的分析 本文把 两种信道补偿技术结合起来在最大化特征空间可分性的同时 最小化总体代价来规整最后余弦距离得分。我们直接选取在 中表现较好的三个降维数目 结合。其性能如表所示。表 基于 在任务中的说话人确认实验 通过表分析可得 相比以上三种补偿方法 具有更强的信道补偿能力 男女达到最好状态。相比基线系统下降了 相比去除维数 系统下降了 下各信道补偿技术与基线系统的比较以上实验已证明各信道补偿技术相比基线系统未做任何信道补偿 上有很大提高为了比较每种信道补偿技术的整体性能 绘出了各方法所对应的曲线。由图可得 经过信道补偿技术后系统性能明显优于基线系统 蓝线 。在各种补偿技术中 优于 稍优于 而本文采用的 方法表现最优。 本章小结图 各信道补偿技术与基线系统的 曲线比较本章主要研究 技术和 技术在信道变化情况下说话人确认的鲁棒性。两者都是基于均值超矢量 但建模方法略有不同。 是在超矢量空间估计说话人空间和信道空间 我们必须把信道空间的影响去除。虽是受 技术的启发 但它与 有本质区别 它不再像 在超矢量空间估计两个空间 而是只估计一个空间 全局差异空间 并用固定长度的全局差异因子 来代表每一段长短不一的语音段 在测试前 我们需要对 空间进行信道补偿 然后再计算得分。因为 相比 中的超矢量 所以在进行补偿技术和得分计算方面要快的多。本章也分别对 做了相关改进。在方面 针对文献【 】传统训练本征信道空间矩阵的方法 提出基于本征信道空间拼接的算法。根据 核心任务 中麦克风信道、电话信道和采访信道的存在 分别对这三种信道训练其相应的本征信道矩阵 然后把三个矩阵拼接成一个大的矩阵 该矩阵作为最后本征信道矩阵训练的初始状态。通过拼接思想较好地解决了在 数据库中三种信道 在说话人确认中的研究博士论文不平衡的问题实验结果也表明算法的有效性。在 方面 主要研究其三种信道补偿技术 。在此基础上提出 相结合的补偿方法该方法可以很好的融合两者的优点 在最大化特征区分性的同时用最小化总体代价来规整最后的余弦距离。实验表明 该方法相比三种补偿技术 在信道变化情况下更具鲁棒性。 的改进方法相比 的改进方法 计算更简单 模型空间也大大降低 在计算得分阶段明显快于 。从性能上来讲略逊于 但可以寻求更鲁棒的信道补偿方法来超越

  基于短语音和信道变化的说话人识别研究,语音识别,语音识别软件,语音识别系统,语音识别技术,语音识别芯片,win7语音识别,android语音识别,连续语音识别,语音识别算法

http://lenjproductions.com/shuohuarenqueren/379.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有