唇语识别概念杂记

xiaoxiao2022-07-02 221

##1.认知

唇语识别系统使用机器视觉技术，从图像中连续识别出人脸，判断其中正在说话的人，提取此人连续的口型变化特征，随即将连续变化的特征输入到唇语识别模型中，识别出讲话人口型对应的发音，随后根据识别出的发音，计算出可能性最大的自然语言语句。

##2.相关信息

2003 Intel，Audio Visual Speech Recognition（AVSR）

2016，Google，DeepMind 的唇语识别技术

2017，搜狗，唇语识别技术

##3.相关内容

用于视听识别的三维卷积神经网络：

https://codeocean.com/capsule/0232951/tree/v1

https://github.com/zr940326/lip-reading-deeplearning

搜狗，基于模态注意力的端到端音视觉语音识别

https://www.leiphone.com/news/201905/sDbudP0p2oxc8YF4.html

最新回复(0)