基于视觉画面的空间音频合成及电影行业应用研究

李思佳; 刘世光

摘要

新时代电影强国建设对电影技术的发展提出了新要求，创新视听算法和更优模型的自主研发成为人们关注的重点。部分早期影片存储时仅包含单声道音频，不能提供良好的听觉体验。为了解决这个问题，本文提出了一种利用视觉画面和已有单声道音频合成空间音频的方法，重构音频中的空间信息。该方法首先对单声道视频进行声源分离和定位，将其拆解成多个单声源及其位置信息。之后再对其进行空间音频重构，得到与视觉位置信息相一致的更加逼真的音频。实验结果表明，本文方法可以得到与视觉位置信息相一致的更加逼真的空间音频，给用户带来更好的沉浸体验。

出版日期2023
单位天津大学

收藏分享被引(1) 浏览

更新时间：2024-03-18 16:49

基于视觉画面的空间音频合成及电影行业应用研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友