2022 WebRTC发展趋势分析

作者 | Tsahi Levent-Levi

翻译 | Alex

技术审校 | 刘连响

WebRTC

年终盘点

#006#

本篇为WebRTC技术专家Tsahi Levent-Levi发布在BlogGeek.me上的文章,我们翻译了其中部分内容发布在LiveVideoStack的公众号上。感谢Tsahi的授权。

2022年WebRTC的五大趋势与我们之前所见稍有不同:有聚焦在规模上的,有探讨新要求的,还有关注新市场的。

规模和性能

希伯来语中有句谚语:“尽快开始,缓慢发展”。这句谚语形象地描绘了WebRTC现在的处境。

WebRTC在2021年明显就是这样发展的。规模依然非常重要,而2022年规模将延续其重要地位。

在2021年11月份的Kranky Geek活动上,谷歌工程师分享了他们在过去一年所做的工作。下面是一张围绕性能优化的幻灯片。可以看到,他们不断努力,同时进行多项任务。其中很多任务已经完成,但还有更多工作要做。

这些改进的目的都是为了向加入单一对话的更多参与者提供更好的可扩展性。我们在最近几个月跟踪到的硬件编解码bug在2022年将继续存在。

同时,我们看到很多公司为了扩展它们的服务而投资基础设施。

2022将延续2021。

新技术

大量新技术现在开始成熟,这些技术可以使供应商充分利用WebRTC的价值。比如,在Kranky Geek上,我们就花了很多时间来介绍这些技术,并了解各个供应商对这些技术的初步使用。

WebAssembly

WebAssembly很可能是WebRTC技术中的最佳选手。

WebAssembly 可提高Web 代码性能并支持跨语言编译。对于WebRTC来说,主要好处是将 WebAssembly 用于媒体操纵的机器学习任务。从噪声抑制,到背景替换和视频特效,再到视频灯光效果。 这些都可以用WebAssembly实现。

希望越来越多的供应商使用WebAssembly,也希望WebAssembly能支持更多特性。

WebTransport&WebCodecs

对WebRTC不满意?还有WebTransport和WebCodecs。

WebTransport和WebCodecs(一起)理论上可以实现媒体的编解码以及从服务器发送或接收媒体。

细节决定成败,虽然WebTransport和WebCodecs还没有达到可以取代WebRTC的受欢迎程度,但它们却非常有前景。

我们将看到越来越多的供应商试验这些技术,并且将它们和WebRTC一起使用,这很合理。一年以前我就提出过这点,当时谷歌正在拆分部分WebRTC。

谷歌自己对这些新技术热情满满,因此人们也担心它在几年后是否会对WebRTC失去兴趣。

AV1

然后是新的编解码器。

AV1在2018年推出。2018年以来,显然有人在推动AV1成为WebRTC的解决方案(不完全是)。事实上,到了2021年底,AV1仍然没有对WebRTC产生重要影响。并不是因为AV1不够优秀,而是因为推出新的编解码器需要花费很长时间,尤其是视频编解码器。

不过,等待快要结束了。AV1即将进入WebRTC,我们将在2022看到它的应用,虽然仍有限制,但它最终会变得有趣并增加与WebRTC的相关性。

新的基于机器学习的音频编解码器(想想Lyra)还需要一点时间。对于它应该是哪种音频编解码器目前还没有达成共识。AV1就不会出现这种问题——我们已经知道它将会是下一个统一共识下的编解码器。

WebRTC基础设施、超扩展和SD-WAN

设计和部署WebRTC的方式正在发生变化。平日里所使用的mesh/mix/route 解决方案依然存在。很多人也会选择混合方法。最近的讨论和关注都围绕硬件、硬件部署以及如何准确转发数据包。声网也许是第一家公开大规模使用此技术的公司,并将其作为更好的解决方案进行宣传。2021年,我们看到Subspace 和Cloudflare宣布部署超过100个区域数据中心用于托管TURN服务。

我在2021年的Workshop中已将基础设施列为WebRTC所面临的挑战之一。2022年,这一话题将变得更加有趣。Anycast将作为供应商技术加入到竞争中。

我们现在还无法确定2022年哪些技术将更受青睐。这些技术在全球十几个地区使用时,是否会带来真正价值上的差异化以及质量上的可观提升?这么做还值得吗?尤其是在大型云厂商每隔一个月就推出新的数据中心的情况下。

直播

从特性和技术到用例。

通过WebRTC实现直播。

其他技术也可以实现直播,但是它们都没有WebRTC高效,而且可以在浏览器中运行。

人们越来越习惯使用视频沟通。新冠疫情催生了很多新的远程交流方式。人们渴望以直播、实时的方式互动。2秒钟的延迟也许还过得去,但是次秒级的延迟会更棒!我们将看到越来越多的供应商使用WebRTC达到次秒级的延迟。对于很多用例来说,低延迟还有更大的发展空间。但是要达到瞬时延迟,那就需要更多WebRTC的使用。至少要等到WebTransport 和WebCodecs技术成熟以后。

从2D到元宇宙

每个人都在重新思考未来通信方式,这些方式可不是过去20多年间我们所依赖的那种对着摄像机讲话。

我看到的两个终极方向:

将视频会话置于2D和3D的合成环境中,其中用户的Avatar可以自由出入。

在Facebook和微软引领下的元宇宙(至少现在如此)。

相关文章