Zhou's home Zhou's home
首页
说话人识别
算法题库
编程相关
语音识别
关于
  • 分类
  • 标签
  • 归档
  • 常用工具
  • 友情链接

ZhouWJ

吾生也有涯,而知也无涯
首页
说话人识别
算法题库
编程相关
语音识别
关于
  • 分类
  • 标签
  • 归档
  • 常用工具
  • 友情链接
  • Kaldi Toolbox

  • 算法原理梳理

    • 几种PLDA模型探究
      • mixPLDA
      • Neural PLDA
    • PRML|高斯分布
    • PRML|概率图模型(贝叶斯网络)
    • 几种PLDA自适应算法
    • 矩阵相关基础知识
    • 深度学习基础知识
    • 微分方程相关基础知识
    • 泛函梯度下降
  • 文献记录

  • 我的工作

  • 声纹识别
  • 算法原理梳理
xugaoyi
2021-03-19
目录

几种PLDA模型探究

# mixPLDA

# Neural PLDA

DCF定义【具体查看《NPLDA: A Deep Neural PLDA Model for Speaker Verification》】:

$$C_{\text { Norm }}(\beta, \theta)=P_{\text {Miss }}(\theta)+\beta P_{F A}(\theta)$$

其中,$\beta=\frac{C_{F A}\left(1-P_{\text {target }}\right)}{C_{\text {Miss }} P_{\text {target }}}$,$P_{\text {target }}$为先验概率,$P_{\text {Miss }}$及$P_{F A}$为错误拒绝和错误接受率

$$P_{M i s s}(\theta)=\frac{\sum_{i=1}^{N} t_{i} \mathbb{1}\left(s_{i}<\theta\right)}{\sum_{i=1}^{N} t_{i}}$$

$$P_{F A}(\theta)=\frac{\sum_{i=1}^{N}\left(1-t_{i}\right) \mathbb{1}\left(s_{i} \geq \theta\right)}{\sum_{i=1}^{N}\left(1-t_{i}\right)}$$

其中,1(·)为指示函数。现在的DCF函数是不能作为损失函数的,因为不可微分,因此提出近似估计函数,将阶跃函数改为Sigmoid函数:

$$P_{M i s s}^{(\mathrm{soft})}(\theta)=\frac{\sum_{i=1}^{N} t_{i}\left[1-\Sigma\left(\alpha\left(s_{i}-\theta\right)\right)\right]}{\sum_{i=1}^{N} t_{i}}$$

$$P_{F A}^{(\text {soft })}(\theta)=\frac{\sum_{i=1}^{N}\left(1-t_{i}\right) \Sigma\left(\alpha\left(s_{i}-\theta\right)\right)}{\sum_{i=1}^{N}\left(1-t_{i}\right)}$$

#PLDA
上次更新: 2024/04/10, 22:12:29
Kaldi中的nnet3
PRML|高斯分布

← Kaldi中的nnet3 PRML|高斯分布→

最近更新
01
方言语音识别综述
04-05
02
主流ASR模型概述
03-26
03
一些参考图表及表述
05-28
更多文章>
Theme by Vdoing | Copyright © 2019-2024 Evan Xu | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式