##1.认知
唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,判断其中正在说话的人,提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音,随后根据识别出的发音,计算出可能性最大的自然语言语句。
##2.相关信息
2003 Intel,Audio Visual Speech Recognition(AVSR)
2016,Google,DeepMind 的唇语识别技术
2017,搜狗,唇语识别技术
##3.相关内容
用于视听识别的三维卷积神经网络:
https://codeocean.com/capsule/0232951/tree/v1
https://github.com/zr940326/lip-reading-deeplearning
搜狗,基于模态注意力的端到端音视觉语音识别
https://www.leiphone.com/news/201905/sDbudP0p2oxc8YF4.html