Інтернет Windows Android

Компресія даних h 264 звукової інформації. Профілі кодека H.264

/ від

Тип компресії Н.264, більше відомий під назвою MPEG-4 Part 10 Advanced Video Codec, досить швидко став переважаючим стандартом видеокомпрессии для телевізійної індустрії.

Четверте покоління кодеків, H.264 стає популярним навіть серед контенту для провідних мобільних пристроїв. Виробники встановлюють підтримку кодека практично в усі пристрої. Така універсальність передбачає використання кодека повсюдно. Але це ж якість робить кодек набагато складніше в настройках для оптимального використання, ніж його попередники. Він вимагає більш високих технологічних потужностей для кодування і декодування процесів, що обмежує його використання в пристроях нижчої цінової категорії.

Це одна з тем, по якій ведуться численні дискусії про введення H.264 в усі фази телевізійного виробництва і про те, як швидко потрібно адаптувати потокову медіаіндустрію що б повністю змінити її цифрову сутність.

Що таке H.264?

H.264 / MPEG-4 part10 AVC - передова, на сьогоднішній день, технологія компресії-результат колективної роботи команди відомої як Joint Video Team (JVT). Група була заснована членами ITU (International Telecommunication Union) і (MPEG) Motion Picture Expert Group і опублікувала свій перший технічний документ - специфікацію ITU-T H.264 і ISO / IES MPEG-4 Part 10 в 2003 році. Тоді ж команда фахівців запевнила, що кодек буде адаптована і прийнятий у виробництво телекомунікаційної і телевізійної індустрією вже незабаром.

Специфікація MPEG-4 визначає 27 окремих і часто сумісних стандартів, названих Частинами (Part), які можуть застосовуватися в телебаченні. Але деякі з них не сумісні і не мають ніякого відношення до стандарту Part 10. Тільки Н.264 еквівалентний специфікації MPEG4 Part10. Що б уникнути конфузів слід дотримуватися тільки цих понять в підборі обладнання для виробництва.

H.264, в свою чергу, має також багато підрозділів, іменованих профілями, кожен з яких має свої специфічні якості і межі застосувань. Деякі з них витісняються більш сучасними профілями. Специфікації змінюються так часто, як відбувається заміна профілів.

Мовникам найцікавіший Constrained Baseline Profile, який використовується для інтернет мовлення і мовлення для мобільних пристроїв з 2009 року. Для телевізійного наземного мовлення використовується Main Profile. Scalable High і Scalable High-Intra профіль, який був виділений з профілю High в 2007 році використовується в відео продакшен і в деяких широкосмугових мережах. Також H.264 був стандартизований для 3D відео починаючи з 11-ої версії, з огляду на можливе його застосування в майбутньому в 3D телебаченні.

H.264 успадкував від своїх попередніх трьох поколінь кодеків основні напрямки в методиках кодування, але з більш розвиненим математичним апаратом і з відповідними перевагами.

- Кадри цифрового відео аналізуються, порівнюються з попередніми і наступними кадрами, детектируются тотожності і відмінності. Як результат прогнозується зображення відтворюється кадру і в останньому етапі, якщо дані губляться, то вони відновлюються з попередніх даних.

- Вибір різних алгоритмів кодування для оптимального прорахунку процесів і контроль над їх різноманіттям - особливість кодека. Це важливо в оптимізації кодування для вузьких смуг пропускання і пристроїв з обмеженим дозволом.

переваги H.264

Кодек має кілька переваг, а саме:

- Низький bit rate при високому рівні якості. Це особливо важливо для кабельних, супутникових, а в Україні особливо важливо для ефірних, операторів. Замість одного каналу з кодуванням MPEG2, можна вмістити два - з кодуванням H.264. Це суттєво здешевлює мовлення і дає можливість вести мовлення в прийнятній якості там, де технології передачі даних обмежені в смузі пропускання.

- Прийнятне якість зображення при низькому bit rate. Це якість можна використовувати в обмежених смугах пропускання, наприклад для мобільних пристроїв. У багатьох випадках MPEG-4 є єдиним можливим стандартом мовлення при низькому bit rate.

- Менше технологій на ринку - більше аудиторія. Якщо ви хотіли б додати нову форму мовлення, то шанси є тільки у технологій кодування базуються на H.264. Рішення з використанням головних станцій та інфраструктури, що підтримують MPEG-4, буде значно дешевше, ніж використання якихось незвичайних пристроїв.

-Краща сумісність на довгий час. Вибір пристроїв підтримують H.264 постійно розширюється, а в недалекому майбутньому кожне медіапристроїв матиме вбудований кодек H.264. і так буде тривати до тих пір, поки це метод компресії не зміна іншого. Але він повинен бути настільки революційним, що на його створення підуть багато років.

- Низька вартість впровадження. Невисока конкуренція з боку інших стандартів призведе до швидкого зростання ринку і зниження ціни на продукти, також ми зможемо спостерігати поступове зниження попиту на дорогі Мультістандартний пристрою. Виробництво пристроїв суміщають в собі кодер і плеєр буде рости.

Оптимізація H.264 для телебачення

З гнучкістю приходять і складності. І H.264 не виняток. Установки кодера H.264 для вашого рішення можуть бути простими, якщо вибрати їх натисненням однієї кнопки «за замовчуванням». Насправді оптимальна настройка кодера дуже складна. Тільки одна популярна бібліотека налаштувань кодека H.264 має більш 200 конфігурацій.

На щастя найпоширеніші set'и є в шаблонах, тим не менш, кращі можливості програвання відео можуть бути обрані лише шляхом ретельної індивідуальної настройки в інтерфейсі.

Є кілька критичних пунктів, які особливо важливі для H.264.

Постійний (CBR) і змінний (VBR) bit rate. При постійному bit rate, а приблизно половина трафіку має CBR, немає ніяких питань щодо складності або інших чинників, які б розширювали смугу пропускання. Це дуже гарна якість для потоків для мобільних пристроїв, тому що вони мають вузьку смугу пропускання і не дуже потужний процесор, якому легше обробляти постійний потік даних без пікових навантажень. CBR також зручно використовувати в інтернет мовленні, використовуючи адаптивний стрімінг. Тому що плеєр автоматично перемикається вперед і назад між різними потоками. А CBR допомагає плеєру синхронізуватися і відтворювати відео бесшовно і стабільно.

Але CBR неоптимальна з боку якості, тому що потік не змінюється в залежності від динаміки і складності відео. У той час як специфіка VBR дозволяє в необхідних складних місцях підвищувати bit rate і знижувати ступінь стиснення для отримання більш якісного зображення. Це необхідно в сценах з швидким рухом дрібних предметів. З іншого боку, більше бітів - ширше смуга пропускання. Це може створити великі проблеми. Тому якщо ви потребуєте в якісному H.264, скачайте фільм заздалегідь.

- Розміри макроблоку. Подібно до інших кодекам H.264 створює в захопленому кадрі індивідуальні розподілу, звані макроблоків. Компресія відео і компенсаційна технологія, яка створює магічне стиснення кожного макроблоку, в кінцевому рахунку, прогнозує кадр, що розраховується з різниці між кінцевим і початковим макроблоків. Старі кодеки мали фіксовану величину макроблоку 16х16 пікселів, але H.264 дозволяє вибирати змінювати цей розмір. Незважаючи на те, що мінімальний розмір блоку становить 4х4 пікселя, в особливих випадках блоки можуть зменшуватися до 1 пікселя, тобто не компрессированного.

Малі, середні та великі блоки, чергуючись в кадрах, адаптивно регулюють процес кодування, сприяючи отриманню оптимального зображення і в значній мірі визначаючи навантаження процесора під час real-time кодування. Для кодування в мовних рішеннях переважно використовувати мінімальні макроблоки, але настільки що б не викликати пропуску кадрів або інших затримок пов'язаних з відставанням компресора. Збільшення розміру макроблоків можна домогтися, при необхідності, шляхом попередньої фільтрації зображення (наприклад, блюрінг). Головне визначитися з компромісом цих параметрів.

Більшість професійних кодерів має можливість автоматично змінювати розмір макроблоку при зміні розміру вихідного кадру.

-GOP структура. Group of Picture (GOP) зазвичай змінюється так часто, як потрібно вставити повний кадр, для відтворення прогнозованих кадрів без істотних втрат. Ваш вибір налаштувань може істотно вплинути на процес кодування. Більшість кодерів мають автоматичну можливість вчасно вставляти в сцену повний кадр. Однак деякий контент, наприклад, як новини, має часті зміни сцен, і часта автоматична вставка повних кадрів може привести до великих затримок. Я пам'ятаю один такий пристрій, який не стартувало, якщо в новому футажами не було першого повного кадру. Ну, це надзвичайний випадок, але збільшення структури GOP за рахунок повних кадрів може створити додаткову затримку потоку на 1-2 секунди. Якщо кеш пристрої переповниться, то глядачів почнуть дратувати стоп-кадри і розсипання відео.

Таким чином, використовуючи деякі настройки кодека можна адаптувати зображення для конкретних завдань.

P.S. Я б не став живити великих ілюзій з приводу якості мовлення DVB-T2 в Україні. До потрібного профілю з 8-бітовим перетворенням не дозволить, навіть за найоптимальніших рішеннях, підняти чіткість ТВЛ вище 400. Тобто чіткість залишиться на тому ж рівні, що і зараз. А розміри екранів в домогосподарствах за останні роки зросли в два рази. Так, звичайно, підуть ефірні перешкоди і шуми в зонах слабкого і невпевненого прийому. Але додадуться природні спотворення, що вносяться кодуванням зі швидкістю потоку всього лише 2,5 мБс. Вихід один - дуже ніжно фільтрувати високі частоти, збільшуючи розмір макроблоків, але без фанатизму. Як це зробити в окремо взятій телекомпанії с, як правило, непередбачуваним контентом - окрема головний біль головних інженерів.

Сьогодні у телекомпаній є свобода вибору в питаннях щодо стиснення телесигналу. Формати MPEG-2, H.264 і JPEG 2000 є найбільш конкурентними варіантами для виконання стиснення відеопотоку на професійному рівні. В кінцевому підсумку, інфраструктура мережі, смуга пропускання і бюджет є вирішальними факторами для телекомпанії, які допомагають визначитися з «правильним» вибором. Формати MPEG-2 і H.264 є ефективними рішеннями стиснення мультимедійних додатків з метою їх подальшого відтворення.

Вагомі аргументи можна привести на користь формату JPEG 2000, який заснований на передових внутрікадрових методах кодування і забезпечує високу ступінь гнучкості і керованості, незрівнянну з гнучкістю і керованістю інших форматів стиснення. Більш того, факт появи все більших і більших різновидів переданих відеопріложеній, які вимагають більш низького часу затримки і більш високої якості зображення, робить формат JPEG 2000 оптимальним рішенням у задоволенні вимог передачі відео в HD-якості.
Головним завданням всіх телекомпаній - незалежно від інфраструктури мережі, обраного методу стиснення і особливостей трансльованих програм - є передача сигналу максимальної якості при заданій смузі пропускання, обмеживши при цьому витрати з метою отримання максимального прибутку. Майте на увазі, що передача відеопотоку є комплексною ланцюг процесів. Будь-який процес, що відбувається всередині ланцюга, впливає на процес передачі відео в цілому, в результаті серйозна недоробка всередині ланцюга зачіпає всі наступні ланки і призводить до погіршення якості передачі відео в цілому. Звичайно, те, як обраний формат стиснення реалізовується, і як здійснюється управління ним, також грає вкрай важливу роль в досягненні оптимальної роботи незалежно від обраної схеми стиснення.

MPEG-2: «застарілий» кодек

Алгоритми стиснення відео, такі як MPEG-2 і H.264 є кодеками, які засновані на дискретному косинусном перетворенні (ДКП). З метою скорочення обсягу даних відеосигналу між серіями кадрів ці кодеки використовують алгоритм межкадрового передбачення. Суть даного алгоритму полягає в методі диференційованого кодування, коли наступний кадр порівнюється з вихідним, а потім робиться кодування тільки тих пікселів, які змінилися.
В результаті кількість пікселів, які необхідно кодувати і передавати, зменшується. Коли така кодированная послідовність передається на екран ТВ, отримане відео нічим не відрізняється від вихідної послідовності кадрів.
Поява MPEG-2 було обумовлено необхідністю трансляції сигналів з більш високою швидкістю передачі даних - сигналів SD-формату (величина бітрейта від 3 Мб / с до 15 Мб / с) і HD-формату (величина бітрейта від 15 Мб / с до 30 Мб / с). При передачі відеозображення з використанням методу предикативного стиснення MPEG-2 кожен закодований кадр в послідовності зображень може передаватися як незалежно стислий кадр ( «I-кадр»), стислий кадр з використанням передбачення руху в одному напрямку ( «P-кадр») і стиснений кадр з використанням передбачення руху в двох напрямках ( «B-кадр»). Завдяки скороченню просторової і тимчасової надмірності MPEG-2 забезпечує підвищену стиснення. Проте використання «B-кадрів» призводить до появи затримки предупорядочіванія, яка залежить від кількості переданих «B-кадрів». При великій кількості переданих «B-кадрів» ця затримка може бути дуже значною.
MPEG-2 до сих пір є широко поширеним кодеком і розглядається як конкурентоспроможний вибір завдяки його низькій вартості впровадження та підтримки широкого діапазону передачі кольору - 4: 2: 2. Проте існує ряд обмежень, які обумовлені як самим кодеком, так і стандартами, які регулюють його реалізацію.
Наприклад, MPEG-2 в порівнянні з конкуруючими кодеками вимагає, як правило, більш високої пропускної здатності для забезпечення досить високої якості відео. Внаслідок потокової бітової структури сигналу і його форми передачі у вигляді окремих пакетів закодований сигнал в MPEG-2 вкрай чутливий до помилок і будь-яким втрат інформації. Втрата або пошкодження одного з пакетів робить істотний вплив на процес декодування, що призводить до «битим» кадрам або вираженим спотворень зображення, а це в кінцевому підсумку призведе до припинення використання MPEG-2 в середовищі професійного телемовлення.

H.264: кодек наступного покоління

H.264 або MPEG-4 Part 10 (Advanced Video Coding) кодек був розроблений в якості альтернативи кодеку MPEG-2 і характеризується підвищеною продуктивністю і більш широким набором інструментів, що забезпечує високу гнучкість щодо передачі інформації. В результаті H.264, в порівнянні з MPEG-2, забезпечує еквівалентну якість відео при більш низькій швидкості передачі даних. При переході на кодування H.264, в порівнянні з MPEG-2, пропускна здатність, достатня для передачі зображення аналогічної якості, може бути знижена на величину до 50 відсотків. В цей кодек використовується асиметрична архітектура. Складність обчислень в ньому мінімізована, що обумовлює його високу гнучкість, достатню для застосування цього кодека для широкого спектру додатків, включаючи трансляцію, зберігання і передачу даних по бездротовій мультимедійної зв'язку.
Алгоритм стиснення H.264 схожий з алгоритмом MPEG-2 і заснований на тих же основних принципах, включаючи компенсацію руху зі змінним розміром блоків і дискретне косинусное перетворення. Більш того, H.264 характеризується високою продуктивністю і надійністю. Він виконує як просторове передбачення при Внутрікадровий кодуванні, так і оцінку руху при міжкадрового кодуванні, що покращує ефективність стиснення. При Внутрікадровий кодуванні кожен кадр кодується сам по собі, без використання інформації сусідніх кадрів. Крім того, H.264 використовує попередню обробку етапів, використовуючи для цього сусідні пікселі з раніше закодованих блоків, що є перевагою в порівнянні з внутрікадровой просторової кореляцією.
Ключові особливості даного стандарту - це ефективність стиснення і передачі даних, а також спрямованість на стиск відео широкого спектру додатків. Завдяки тому, що на сьогоднішній день кодек підтримує 17 профілів і 16 рівнів, кожен з яких націлений на конкретний клас популярних переданих відеопріложеній, досягається високий рівень гнучкості і масштабованості.
Формату H.264 властиві такі ж обмеження, як і для формату MPEG-2. В кінцевому підсумку, ці обмеження пов'язані з можливістю існуючої технології, що перешкоджає застосуванню формату H.264 в професійному середовищі мовлення. На сьогоднішній день найбільш технологічно просунутим кодеком, сумісним зі стандартами мовлення, є H.264, що виконує стиснення відео зі швидкістю 80 Мб / с, обмежений дозволом в 8 біт. Реалізація мережі на основі H.264 може бути дорогим. Вартість в порівнянні з конкуруючими стандартами може бути в чотири рази вище за рахунок собівартості і споживання потужності. Завдяки архітектурної асиметрії кодеків може скластися враження, що високоякісні декодери мають низькою вартістю, в результаті чого користувачі дуже часто дивуються високою ціною на професійні відеодекодери.

JPEG 2000: вибір прогресивного методу стиснення

Метод JPEG 2000, пропонований сучасним ринком, є його ключовим гідністю. Стандарт і система кодування JPEG 2000 засновані на «вейвлет-технології» стиснення зображення. Спочатку він був задуманий не як кодек для стиснення відео, а як кодек стиснення графічних зображень. Застосована в ньому Внутрікадровий схема кодування має ряд переваг, характерних для всього циклу мовлення - доставка, формування, а також первинне і вторинне розподіл.
JPEG 2000, в порівнянні з форматами H.264 і MPEG-2, добре відомий своїм відмінним візуальним якістю (див. Малюнок 1). JPEG 2000 виконує кодування в межах повного кадру, в той час як інші схеми стиснення вимагають, щоб зображення було розбито на більш дрібні блоки, в результаті чого погіршення якості відбувається нерівномірно і може відрізнятися в межах кадру. Це призводить до появи візуально дратівної спотворення, відомого як «блокинг-ефект». У випадку з JPEG 2000 втрата якості відбувається рівномірно по всій області кадру і візуально сприймається як згладжування країв, інакше кажучи, відбувається розмитість. Таке спотворення візуально є менш дратівливим, ніж «блокинг-ефект», так як розмитість більшою мірою відповідає природному сприйняттю людського ока. JPEG 2000 має унікальну можливість доставки інформації в первісному вигляді для подальшої обробки. За рахунок забезпечення високої якості на більш низькому рівні можлива передача високої якості на більш високий рівень. Відео JPEG 2000 залишається практично незмінним при здійсненні багаторазових циклів кодування / декодування. Це дозволяє зберегти високу якість відео, передавши його по цьому ланцюжку.

JPEG 2000 характеризується низьким часом затримки - близько 1.5 кадру або менше на весь цикл кодування-декодування. Цей параметр є критичним для інтерактивних додатків і може привести до відсутності зв'язку при переході від одного кадру до наступного кадру. Низький час затримки близько 45 мс при стисненні HD-потоку є перевагою в порівнянні з форматами H.264 і MPEG-2, час затримки в яких сягає від однієї до двох секунд.
Висока швидкість передачі, яка досягається за рахунок стиснення JPEG 2000, також критично важлива. При порівнянні реалізованих проектів помічено, що, як правило, JPEG 2000 може працювати при дуже високих швидкостях - набагато більш високих, ніж H.264. Для передачі зображення високої якості це є ключовим моментом, так як пропускна здатність може бути обмежена конкретним типом інфраструктури, однак ширина смуги пропускання не обов'язково є критичною. Наприклад, HD-відео при 1.5 Гб / с неможливо передати по мережі Ethernet в 1 Гбіт, але для цієї мети може бути виділений весь канал. Отже, передача HD-відео може бути здійснена, якщо задіяти всю ширину смуги пропускання і застосувати «легке» JPEG 2000 стиск для досягнення як найвищої якості, так і вписування в ширину каналу або, коли доречно, закодувати з використанням математичного стиснення без втрат з метою виключення втрат відеоінформації.
Одним з найбільш значних переваг формату JPEG 2000 є його гнучкість. Можлива передача даних по безлічі типів мережевих інфраструктур - Ethernet / IP, SONET / SDH / PDH і по оптоволокну. Коли дані упаковані за допомогою JPEG 2000 в ASI-потік, то відео може передаватися всюди, в будь-який час і на будь-яку відстань. JPEG 2000 виконує незалежне кодування кожного поля і кожного кадру, яскравості і кольоровості компонента. Якість, яке досягається за рахунок математичного стиснення без втрат, можна порівняти з якістю математичного стиснення з втратами. Відео може бути закодовано шляхом математичного стиснення без втрат, але через недостатню пропускну спроможність каналу може обрізатися і перетворюватися в стиснення з втратами.
Конструктивно для JPEG 2000 характерним є однаковий рівень складності як для процесу кодування, так і для процесу декодування. Так як JPEG 2000 є симетричним кодеком, одне і те ж апаратне засіб може бути надано як в якості кодера, так і в якості декодера, в той час як асиметричні кодеки вимагають абсолютно різних апаратних засобів, особливо при високій швидкості передачі даних. Відносно низька складність JPEG 2000 має переваги в вартості, капітальних і експлуатаційних витратах, а також знижує витрати на електроживлення мережі.

підводимо підсумки

Кожен з розглянутих у статті кодеків грає свою індивідуальну роль в сфері якісної передачі даних. Кодеки H.264 / MPEG-4 і MPEG-2 як і раніше актуальні в сфері професійного телемовлення. Вони забезпечують високу якість в мережах з обмеженою пропускною спроможністю, але вони не обов'язково є єдино правильним вибором у всіх можливих сферах застосування.
Формат JPEG 2000 забезпечує високу якість зображення і низький час затримки при кодуванні в кілька циклів. На сьогоднішній день він підтвердив свою значимість у всіх сферах відеотехнологій, в сфері передачі даних по IP- і 3G-мереж, а також в HD- і 3D-технології.
Крім якості та інфраструктури мережі, в процесі порівняння і вибору методу стиснення необхідно враховувати ступінь витрат ресурсів і його вартість. В цілому, методи стиснення MPEG-2 і H.264 є дорогими, енерговитратними і вимагають застосування складних технологій.
Так як кодек JPEG 2000 в порівнянні з іншими вимагає менше енерговитрат і в цілому забезпечує велику масштабованість, гнучкість і якість зображення, то перед ним відкривається блискуче майбутнє. Все більше число провідних світових постачальників послуг телемовлення, а також телекомпаній використовують JPEG 2000 для трансляції великих, глобально значущих подій - особливо з використанням потужностей IP-мереж. Однак існуюча ситуація постійно змінюється, і, можливо, завтра перед нами постане новий, більш «наворочений» метод стиснення.

Сьогодні камери спостереження можна побачити практично на кожному кроці. Можливо, ви також плануєте встановити одну або кілька камер у себе вдома. Такі пристрої працюють з відеофайлами форматов.264 або H.264. Але як подивитися відео і чим відкрити файл розглянемо в статті.

Відмінності і подібності форматів 264 і H.264

Формат.264 - це необроблені елементарні потоки відеофайлів H.264-ES (ще називають тимчасовим відео-файлом MPEG-4). У свою чергу H.264-ES є частиною специфікації формату H.264. Старі моделі відеореєстраторів записують відео в формате.264. Такі відеофайли не можуть використовуватися для прямого перегляду звичайними програвачами і вимагають обробки спеціальними програмами.

Дозволяє зменшити відеозапис до мінімального розміру. Після того, як відеозаписи проходять повне стиснення, якість відео і аудіо і раніше залишається на високому рівні. З цим форматом працюють камери відеоспостереження і відеореєстратори нового зразка. Файли H.264 ще називаються MPEG-4 Part 10 AVC / H.264. Незважаючи на довге і страшне назву в мережі дуже легко знайти програвач файлів H.264.

Для відкриття таких файлів необхідно скористатися одним з нижченаведених способів:

  • використовувати спеціальні програми і утиліти;
  • виконати конвертацію відеофайлів.

Відкриття відео H.264

Практично всі популярні програми та конвертери працюють з форматом H.264, Популярними є:

Робота з форматом.264

Давайте розглянемо більш детально, ніж відкрити файл.264 з відеореєстратора або камери спостереження.

спеціальні програми

Для відкриття відео.264 стануть корисними наступні програми:

Відеофайли.264 можна об'єднати або роз'єднати. Як це зробити ми розглянемо далі.

утиліти

Щоб відтворити файл.264, необхідно помістити його в контейнерний формат, який зможе розпізнати будь-який медіа-програвач. Для цієї мети рекомендуємо скористатися однією з наступних утиліт:

  1. Demuxer - вміє створювати записи dsm або mpc. Варто відзначити, що файли dsm можна відтворити тільки в цій утиліті.
  2. MKVcleaver - з її допомогою ви зможете вирізати відео в.MKV.
  3. Mkvmerge - здатна змінити, вирізати, об'єднати або роз'єднати відеофайли. Після обробки відео якість відео не погіршується, а формат змінюється на.MKV.
  4. Haali Muxer - може допомогти в перетворенні, об'єднанні або роз'єднати відеофайлів. Після обробки відео йому присвоюється формат.MKV.