好记性不如铅笔头

随手记

opus相关概念笔记

Opus

参考链接:【 https://zh.wikipedia.org/wiki/Opus_(%E9%9F%B3%E9%A2%91%E6%A0%BC%E5%BC%8F)

Opus是一个有损声音编码的格式,由Xiph.Org基金会开发,之后由互联网工程任务组进行标准化,目标是希望用单一格式包含声音和语音,取代Speex和Vorbis,且适用于网络上低延迟的即时声音传输,标准格式定义于RFC 6716文件。Opus格式是一个开放格式,使用上没有任何专利或限制。
Opus集成了两种声音编码的技术:以语音编码为导向的SILK和低延迟的CELT。Opus可以无缝调节高低比特率。在编码器内部它在较低比特率时使用线性预测编码在高比特率时候使用变换编码(在高低比特率交界处也使用两者结合的编码方式)。Opus具有非常低的算法延迟(默认为22.5 ms)[3],非常适合用于低延迟语音通话的编码,像是网络上的即时声音流、即时同步声音旁白等等,此外Opus也可以透过降低编码比特率,达成更低的算法延迟,最低可以到5 ms。在多个听觉盲测中,Opus都比MP3、AAC、HE-AAC等常见格式,有更低的延迟和更好的声音压缩率。

Speex

参考链接:【 https://zh.wikipedia.org/wiki/Speex

Speex是一个声音编码格式,目标是用于网络电话、在线广播使用的语音编码,基于CELP(一种语音编码算法)开发,Speex宣称可以免费使用,以BSD授权条款开放源代码。Speex的开发者将这个格式视为Vorbis(通用音频压缩格式)的补充。Speex是一种有损格式,这意味着使用此格式的音频,质量将会永久性地降低以减少文件的大小。开发Speex的Xiph.org基金会已经宣布废弃Speex,建议改用Opus取代。[1]
Speex是针对网际协议通话技术(VoIP)和基于文件的压缩。Speex的设计目标是开发一个保有高质量语音的同时降低其比特率(bit rate)的编码器。 为了实现前述目标,Speex编码器使用多位比特率(multiple bit rates),并支持超宽频(32 kHz 采样率),宽带(16 kHz 采样率)和窄带(电话通话质量,8 kHZ 采样率)。 由于Speex是设计用于VoIP而不是手机,因此Speex编码器必须能容忍丢失数据包(lost packets),但不能数据包是损坏的。基于上述的要求,选择CELP算法作为Speex的编码技术。使用CELP的主要原因之一是,CELP早已证明,它可以同时做到低比特率和高比特率。

CELP

参考链接:【 https://zh.wikipedia.org/wiki/%E7%A0%81%E6%BF%80%E5%8A%B1%E7%BA%BF%E6%80%A7%E9%A2%84%E6%B5%8B

码激励线性预测(英语:Code-excited linear prediction,简称CELP)是一种语音编码算法,最早由M. R. Schroeder和B. S. Atal在1985年提出。在当时,它能提供比其他低比特率算法更好的质量,包括如剩余激励线性预测和线性预测编码声码器(例如FS-1015)。它存在不少变种,例如代数CELP、松弛码CELP、低延迟CELP和矢量和激励线性预测(VSELP)编码。它是目前使用最广泛的语音编码算法。它也被用于MPEG-4音频语音编码器。CELP通常是一个通用术语,指一类算法而非特定编解码器。

Vorbis

参考链接:【 https://zh.wikipedia.org/wiki/Vorbis
Vorbis是一种有损音频压缩格式,由Xiph.Org基金会所领导并开放源代码的一个免费的开源软件项目。Vorbis通常以Ogg作为容器格式,所以常合称为Ogg Vorbis
Vorbis是1993年由克里斯·蒙哥马利开始的音频压缩开发的延续[5][6]。1998年9月,夫朗和斐协会宣布计划收取MP3音频格式的专利许可费用,该事件触发了Vorbis的密集开发[7][8]。
目前Xiph.Org基金会建议使用延迟更低、音质更好的Opus编码来取代Vorbis[18]。

SILK

参考链接:【 https://zh.wikipedia.org/wiki/SILK

SILK是一个Skype Limited开发的音频压缩格式和音频编解码器。它被开发用于Skype,以取代SVOPC编解码器。自从提供许可,它也已被用于其他目的。它已被扩展为互联网标准Opus的编解码器。该编解码器的技术基于线性预测编码(LPC)。SILK取代了早前在Skype中使用的SVOPC,其是一个取代iSAC和iLBC的内部解决方案,这也是再次从Global IP Solutions获取授权。

CELT

参考链接:【 https://zh.wikipedia.org/wiki/CELT

CELT是一种开放、免版税的有损音频压缩格式和自由软件编解码器,具有非常低的算法延迟,可用于低延迟音频通信。这些算法是公开记录的,其使用不受软件专利限制。该格式的开发由Xiph.Org基金会(作为Ogg编解码器系列的一部分)维护,后来由互联网工程任务组(IETF)整合到Opus工作组中。CELT旨在弥合Vorbis和Speex之间的差距,适用于需要高品质音讯和低延迟的应用。它适用于语音和音乐,藉鉴了CELP算法的想法,但通过专门在频域中操作避免了它的一些限制。

Leave a Reply

5 + 19 =

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据