消息 | 我国 AVS VR 音频团体标准发布,字节跳动、腾讯、小米、华为等起草
12 月 19 日消息,据“新一代人工智能联盟”公众号消息,2023 年 12 月 7 日,中关村视听产业技术创新联盟批准发布《信息技术 虚拟现实内容表达 音频》(标准号 T / AI 125-2023)团体标准。起草单位包括:
据介绍,AVS VR 音频团体标准《信息技术 虚拟现实内容表达 音频》的正式制定起始于 2016 年 6 月举行的工作组第 57 次会议,AVS 音频组输出“AVS 虚拟现实音频技术方案征集书 V1.0”,启动虚拟现实中沉浸式音频编解码及渲染技术的征集工作。
2020 年 4 月 7 日,经新一代人工智能产业技术创新战略联盟和中关村视听产业技术创新联盟标准工作组联合审议决定立项 AVS VR 音频团体标准。
AVS VR 音频团体标准历经工作组正式和临时加会议 41 次,共收到 VR 音频相关提案 115 项,被采纳的技术提案 39 项,于 2022 年 11 月 25 日形成 AVS VR 音频团标 FCD。
2023 年 1 月 6 日 AVS VR 音频完成团标征求意见稿的组内公示后,形成了送审稿,并在 2023 年 10 月 26 日通过了全国信标委多媒体分委会的审查,终于 2023 年 12 月 7 日形成团体标准正式发布。
AVS VR 音频标准描述了虚拟现实音频表达所需要的元数据、渲染器及面向传输的数据流方式,支持 3DOF 和 6DOF 等虚拟现实场景下所需要的技术功能,涉及基于声道、对象、场景三类信号的采集制作和渲染回放等相关技术描述。AVS VR 音频标准中采纳的所有技术均依据 VR 音频测试方案进行了第三方测试验证,包括规范性验证,功能性验证和渲染效果主观测试,并在实际系统中进行了系统验证。
标准中的相应技术在各大赛事、活动中也早有应用。2022 年 9 月中央广播电视总台“云听”客户端使用 AVS VR 音频标准中的耳机渲染技术完成 CCTV 中秋晚会现场直播;2022 年 11 月世界杯央视转播演示系统使用了 AVS VR 音频标准中的扬声器渲染技术进行监听,从制作端生成元数据下发,并按制作者意图生成实时、动态元数据下发,实现了制作、监听与下发数据的完整流程。同时,AVS VR 音频双耳渲染技术还在 VR 头显设备中基于 Unity3D 软件平台进行了 3DOF 和 6DOF 下的主观听音测试验证。
AVS VR 音频标准在遵循 ITU-R BS.2076-2 规范的前提下,面向适应我国全景音频播出、沉浸式音频通信、虚拟现实音频交互等领域,提供虚拟现实音频内容的元素定义、编码规范和渲染重建建议,服务于虚拟现实(VR / AR / MR / XR)设备和相关系统中的音频应用。
结合国内虚拟现实音频产业发展的实际情况,按照 AVS 工作组的标准制订流程和 AVS 音频组工作规范,在 AVS 音频组的组织下,依照技术需求,审议技术提案、制定测试方案、进行测试和评比,采纳满足技术需求且性能更优的技术提案,构建标准技术的基础架构,通过标准文本编辑、参考软件验证形成标准草案。该标准填补了国内虚拟现实音频技术标准的空白,并争取为相关国际标准的制定发挥关键作用。
该标准将首先作为 AVS 团体标准发布,并申请成为国家标准和 IEEE 国际标准发布。
IT之家注:新一代人工智能产业技术创新战略联盟(AITISA)由两百余家来自人工智能行业内的企业、高校和科研院所、资本机构、服务机构、创新创业企业组成。