Кодекс сжатия

12 ноября 2009 Стандарт
Стандарт
#1, ноябрь 2009 г.

Прежде чем упаковать речь в пакеты, IP-телефон преобразовывает ее в цифровую форму, а затем сжимает, чтобы ускорить обмен информацией между абонентами и снизить нагрузку на сеть. При этом параметры сжатия определяются специальными кодеками, от которых напрямую зависит качество голоса в трубке. О том, какие кодеки используются в IP-телефонах и чем они отличаются друг от друга, специально для «Стандарт-ТЕХНО» рассказал Алексей Власов, инженер-конструктор отдела сетей компании Открытые Технологии.

К основным характеристикам кодеков, влияющих на качество речи, относится диапазон звуковых частот, обрабатываемый кодеком, а также используемый алгоритм кодирования и глубина дискретизации, которая обозначает количество бит, выражающих амплитуду сигнала. Остальные параметры, такие как частота дискретизации и битрейт, являются производными. Частота дискретизации определяется диапазоном звуковых частот по теореме Котельнико-ва, а битрейт зависит от совокупности всех остальных параметров кодека. Сточки зрения диапазона звуковых частот кодеки можно разделить на узкополосные (G.711 и G.729 с полосой частот в пределах 300-3400 Гц) и широкополосные (G.722, работающий в диапазоне 150-7000 Гц). Для сравнения, диапазон человеческого голоса охватывает частоты от 30 до 18 000 Гц. И хотя параметров узкополосных кодеков достаточно для распознавания слов и человека по голосу, применение широкополосных кодеков заметно улучшает качество звука и позволяет четче различать особенности речи. В современных IP-решениях активно используются два узкополосных кодека: G.711 и G.729. Первый ориентирован на традиционные сети связи с коммутацией каналов. В IP-телефонии он обычно используется для звонков в пределах ЛВС и внешних вызовов вТФОП через локальный шлюз. Второй кодек, напротив, адаптирован именно для использования в IP-телефонии на каналах с ограниченной полосой про- : пускания (например, WAN). G.729 требует втрое меньшей полосы пропускания по сравнению с G.711, с учетом заго-ловков транспортного и сетевого уровня, но при этом обеспечивает приемлемое ухудшение качества голоса.

Для осуществления вызовов по локальной сети в современных решениях применяется широкополосный кодек G.722. Он заметно улучшает качество голоса по сравнению с G.729, требуя при этом большей полосы пропускания, что абсолютно некритично для проводных локальных сетей. G.722 поддерживается далеко не всеми VoIP-устройствами (особенно бюджетными). Еще один относительно новый кодек-iLBC (Internet Low Bitrate Codec) - применяется при звонках через WAN-каналы с нестабильным качеством соединения. Он гораздо более устойчив к потерям пакетов, чем G.729, но требует небольшого увеличения полосы пропускания. Стоит упомянуть еще и кодек RPE-LTP, разработанный для использования в сетях сотовой связи стандарта GSM. Он поддерживается производителями шлюзов для обмена голосовым трафиком между сотовыми и VoIP-сетями.

Основной причиной использования нескольких кодеков в рамках одного IP-решения является нестабильность параметров каналов, по которым передается голосовой трафик. В сетях с коммутацией каналов каждому вызову предоставляется фиксированный канал в 64 кбит/с со стабильными параметрами соединения. Поэтому в них с успехом применяется только один кодек-G.711, обеспечивающий высокое качество голоса. В сетях с коммутацией пакетов доступная для вызова полоса может быть как значительно шире 64 кбит/с, так и уже. Поэтому, в зависимости от параметров каналов, используются различные кодеки, позволяющие получить либо высокое качество голоса при широкой полосе (например, в локальных сетях), либо большое количество одновременных соединений через узкие и нестабильные WAN-каналы.

Процедура сжатия голоса приводит к алгоритмическим задержкам при передаче речи. Они зависят от используемого конкретным кодеком алгоритма кодирования и могут составлять от 0,125 до 50 мс. Согласно рекомендаци- I ям ITU G.114 для обеспечения естественного общения посредством IP-телефонии величина задержки в одну сторону не должна превышать 150 мс. Практика показывает, что даже задержка до 200 мс не вносит существенный дискомфорт в общение. Поэтому алгоритмические задержки сжатия не играют определяющей роли в суммарном времени передачи голоса.

Отдельного внимания заслуживает коммерческая сторона применения кодеков. Производители IP-оборудования и ПО, как правило, лицензируют использование кодеков у правообладателей и не берут за это дополнительные деньги с конечных потребителей. Но есть и исключения: например, лицензионная политика GNU Public License, под которой распространяется IP-АТС Asterisk, не позволяет включить коммерческий алгоритм G.729 в состав дистрибутива ПО Asterisk. Поэтому компания Digium, разработчик G.729, предлагает всем желающим приобретать платную лицензию на его использование. При этом общая стоимость эксплуатации кодека зависит от запланированного количества каналов, одновременно преобразуемых вG.729.




Предыдущая новость:
"У большинства игроков возникло понимание правил игры"
Следующая новость:
Открытые Технологии: 15 лет интеграции