唇语识别概念杂记

    xiaoxiao2022-07-02  119

    ##1.认知

       唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,判断其中正在说话的人,提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音,随后根据识别出的发音,计算出可能性最大的自然语言语句。

     

    ##2.相关信息

     2003  Intel,Audio Visual Speech Recognition(AVSR)

     2016,Google,DeepMind 的唇语识别技术

     2017,搜狗,唇语识别技术

    ##3.相关内容

    用于视听识别的三维卷积神经网络:

    https://codeocean.com/capsule/0232951/tree/v1

    https://github.com/zr940326/lip-reading-deeplearning

     

     

    搜狗,基于模态注意力的端到端音视觉语音识别

    https://www.leiphone.com/news/201905/sDbudP0p2oxc8YF4.html

     

     

     

     

     

     

     

     

     

     

    最新回复(0)