職位描述

職位描述:1、在短視頻和直播場景下,結合圖像,聲音,文字等,對視頻進行理解,包括但不限于音頻分離、音頻檢測與分類、語音識別、語種識別、音樂理解等;
2、推動音頻理解算法在快手短視頻相關應用上的落地;
3、追蹤多模態視頻理解的前沿算法和技術,保持算法先進性。
任職要求:1、機器學習、模式識別、信號處理等計算機相關專業的碩士或者博士;
2、有多模態技術、音頻分離和生成等相關經驗者優先;
3、熟練掌握C/C 、Python,有較強的工程實現能力。熟悉常見的機器學習算法工具,如tensorflow,pytorch等;
4、相關頂會或期刊上發表論文者優先(ICASSP,Interspeech,ACL,ICML,NIPS,CVPR等);
5、有團隊精神,良好的表達能力和溝通能力。
工作地點
地址:北京海淀區北京-海淀區上地西路6號快手總部
