郭境熙 劉 嘉
(北京電影學院聲音學院,北京 100088)
隨著影視文化產業的繁榮,社會對影視產品的需求也越來越大。今天,由于工業化技術水平的提高,影視聲音后期制作的分工越來越細,質量也越來越好。無論是院線電影、電視劇,還是網絡平臺上播放的一些劇集,甚至包括目前非常流行的抖音小視頻,都很明顯地感受到了這種趨勢。然而,隨著節目數量爆發性地增長,隨之而來的問題是有限的制作勞動力資源與越來越多的節目數量和質量需求之間不可調和的矛盾。從目前的工藝來看,聲音編輯環節在整個制作流程中占據了絕對的時間比例,它有著人力高度密集、工作強度大、時間占比長、重復性勞動非常多的特點,在實際工作中,從業人員大量的時間和精力會耗費在對聲音素材的檢索、分類、編輯、聲畫同步等工作上。與此同時,我們看到聲音編輯工作并非簡單勞動,一個合格的聲音編輯人員往往需要經過長時間的職業技能培訓,才能滿足這種藝術產品的生產質量要求。所以,無論是采用簡單地增加個體勞動時間,還是快速擴大聲音編輯從業人員的規模來滿足越來越多、越來越高的行業制作需求,都是不現實的。
從2015年起,人工智能的研究和應用逐步開始進入到大眾的視野,在圖像識別領域和神經網絡系統領域不斷出現了一些有趣的思路和新的應用場景。得益于算法的發展以及計算能力的提升,圖像識別的準確度相對以前有了很大的提高,近年來ImageNet的年度大規模視覺識別挑戰賽中(ILSVRC),排名前五的深度學習神經網絡錯誤率即能做到小于5%。……