Главная

Статьи

Високий ступінь стиснення. Що таке H.264. MPEG-4 Part 10

Головна Головна   Терміни: Відеоспостереження   Що таке H Терміни: Відеоспостереження Що таке H.264

Що таке H.264? | H.264, MPEG-4 Part 10 або AVC (Advanced Video Coding) - стандарт стиснення відео, призначений для досягнення високого ступеня стиснення відеопотоку при збереженні високої якості.

Про стандарт

Стандарт H.264 був створений ITU-T Video Coding Experts Group (VCEG) спільно з ISO / IEC Moving Picture Experts Group (MPEG) в рамках спільної програми Joint Video Team (JVT).
Стандарти ITU-T H.264 і ISO / IEC MPEG-4 Part 10 (формальна назва - ISO / IEC 14496-10) технічно повністю ідентичні. Фінальний чорновий варіант першої версії стандарту був закінчений в травні 2003 року.
Стандарт H.264 Використовується в цифровому телебаченні високої чіткості (HDTV) і як основний кодек для відеозаписів Міністерством оборони США, компанією Apple (в тому числі відеороликів плеєрів iPod) і в багатьох інших областях цифрового відео.

можливості

Стандарт H.264 / AVC / MPEG-4 Part 10 містить ряд нових можливостей, що дозволяють значно підвищити ефективність стиснення відео в порівнянні з попередніми (такими, як ASP) стандартами, забезпечуючи також більшу гнучкість застосування в різноманітних мережевих середовищах. Основні з них:

Багатокадрового пророкування кадрів:

  • Використання стислих раніше кадрів як опорних (тобто із запозиченням частини матеріалу з них) куди більш гнучко, ніж в попередніх стандартах. Дозволяється використання до 32 посилань на інші кадри, тоді як в ASP і більш ранніх число посилань обмежене одним або, в разі B-кадрів, двома кадрами. Це піднімає ефективність кодування, так як дозволяє кодеру вибирати для компенсації руху між великою кількістю зображень. Ця функція забезпечує невелике поліпшення в якості і економію бітрейта в більшості сцен. Однак для деяких сцен, наприклад з частими повторюваними ділянками, зворотно-поступальним рухом і т. П. Подібний підхід при збереженні якості дозволяє дуже сильно знизити витрати бітрейта.
  • Незалежність порядку відтворення зображень і порядку опорних зображень. У попередніх стандартах встановлювалася жорстка залежність між порядком проходження зображень для використання при компенсації руху і порядком проходження зображень при відтворенні. У новому стандарті ці обмеження значною мірою усунуті, що дозволяє кодеру вибирати порядок зображень для компенсації руху і для відтворення з високим ступенем гнучкості, яка обмежена тільки об'ємом пам'яті, який гарантує можливість декодування. Усунення обмеження також дозволяє в ряді випадків усунути додаткову затримку, раніше пов'язану з двонаправленим передбаченням.
  • Незалежність методів обробки зображень і можливості їх використання для передбачення руху. У попередніх стандартах зображення, закодовані з використанням деяких методів (наприклад, двонаправленого передбачення), не могли використовуватися в якості опорних для передбачення руху інших зображень відеопослідовності. Усуваючи це обмеження, новий стандарт забезпечує кодеру велику гнучкість і, в багатьох випадках, можливість використовувати для передбачення руху зображення, ближче за змістом до кодованого.
  • Компенсація руху зі змінним розміром блоку (від 16x16 до 4x4 пікселя) дозволяє вкрай точно виділяти області руху.
  • Вектори руху, що виводять за межі зображення. В MPEG-2 і попередніх йому стандартах вектори руху могли вказувати тільки на пікселі, що знаходяться в межах декодованого опорного зображення. Методика екстраполяції за межі зображення, що з'явилася як опція в H.263, включена в новий стандарт.
  • Шеститочкові фільтрація компонента яскравості для полупіксельного передбачення з метою зменшення зубчастості країв і, в кінцевому рахунку, забезпечення більшої чіткості зображення.
  • Точність до чверті пікселя (Qpel) при компенсації руху забезпечує дуже високу точність опису рухомих областей (що особливо актуально для повільного руху). Кольоровість, як правило, зберігається з дозволом, зменшеним вдвічі по вертикалі і горизонталі (проріджування кольору), тому компенсація руху для компонента кольоровості використовує точність в одну восьму пікселя кольоровості.
  • Виважена пророкування, що дозволяє використовувати масштабування і зрушення після компенсації руху на величини, зазначені кодером. Така методика може надзвичайно сильно підняти ефективність кодування для сцен зі зміною освітленості, наприклад при ефекти затемнення, поступового появи зображення.

Просторове передбачення від країв сусідніх блоків для I-кадрів (на відміну від передбачення лише коефіцієнта трансформації в H.263 + і MPEG-4 Part 2, і дискретно-косинусного коефіцієнта в MPEG-2 Part 2). Нова методика екстраполяції країв раніше декодованих частин поточного зображення підвищує якість сигналу, використовуваного для передбачення.

Стиснення макроблоків без втрат:

  • Метод уявлення макроблоків без втрат в PCM, при якому відеодані представлені безпосередньо, що дозволяє точно описувати певні області та допускає суворе обмеження на кількість закодованих даних для кожного макроблоку.
  • Покращений метод беспотерьного уявлення макроблоків, що дозволяє точно описувати певні області, при цьому зазвичай витрачаючи істотно менше бітів, ніж PCM (підтримується не у всіх профілях).

Гнучкі функції чересстрочного стиснення (підтримується не у всіх профілях):

  • Адаптивне до зображення кодування полів (PAFF), що дозволяє кодувати кожен кадр як кадр або як пару полів (напівкадрів) - в залежності від відсутності \ наявності руху.
  • Адаптивне до макроблоків кодування полів (MBAFF), що дозволяє незалежно кодувати кожну вертикальну пару макроблоків (блок 16 × 32) як прогресивні або черезрядкові. Дозволяє використовувати макроблоки 16 × 16 в режимі розбиття на поля (порівняйте з 16 × 8 полумакроблокамі в MPEG-2). У більшості випадків ефективніше PAFF.

Нові функції перетворення:

  • Точне цілочисельне перетворення просторових блоків 4 × 4 (концептуально подібне широко відомому DCT, але спрощене і здатне забезпечити точне декодування), що дозволяє точне розміщення різницевих сигналів з мінімумом шуму, часто виникає в попередніх кодеках.
  • Точне цілочисельне перетворення просторових блоків 8x8 (концептуально подібне широко відомому DCT, але спрощене і здатне забезпечити точне декодування; підтримується не у всіх профілях), що забезпечує більшу ефективність стиснення схожих областей, ніж 4 × 4.
  • Адаптивний вибір кодеком між розмірами блоку 4 × 4 і 8 × 8 (підтримується не у всіх профілях).
  • Додаткове перетворення Адамара, що застосовується до дискретно-косинусного коефіцієнтам основного просторового перетворення (до коефіцієнтів яскравості, і, в особливому випадку, кольоровості) для досягнення більшого ступеня стиснення в однорідних областях.

квантування:

  • Логарифмічні управління довжиною кроку для спрощення розподілу бітрейта кодером і спрощеного обчислення зворотної довжини квантування.
  • Частотно-оптимізовані матриці масштабування квантування, які обираються кодером для оптимізації квантування на основі людських особливостей сприйняття (підтримується не у всіх профілях).

Внутрішній фільтр деблокінгу в циклі кодування, що усуває артефакти блочности, часто виникають при використанні заснованих на DCT техніках стиснення зображень.

Ентропійне кодування квантованих коефіцієнтів трансформації:

  • Context-adaptive binary arithmetic coding (CABAC, контекстнозавісімое адаптивне бінарне арифметичне кодування) - алгоритм беспотерьного стиснення синтаксичних елементів відеопотоку на основі ймовірності їх появи. Підтримується тільки в Main Profile і вище. Забезпечує більш ефективне стиснення, ніж CAVLC, але вимагає значно більше часу на розшифровку.
  • Context-adaptive variable-length coding (CAVLC, контекстнозавісімое адаптивне кодування зі змінною довжиною кодового слова) - альтернатива CABAC меншої складності. Проте, воно складніше і ефективніше, ніж алгоритми, що застосовуються для тих же цілей в більш ранніх технологіях стиснення відео (як правило це алгоритм Хаффмана).
  • Часто використовується, просте і високо структуроване кодування словами змінної довжини багатьох елементів синтаксису, що не закодованих CABAC або CAVLC, відоме як коди Голомба (експоненціальне кодування Голомба).

Функції стійкості до помилок:

  • Визначення рівня мережевої абстракції (NAL), що дозволяє використовувати один і той же синтаксис відео в різних мережевих середовищах, включаючи набори параметрів послідовності (sequence parameter sets, SPSs) і набори параметрів зображення (picture parameter sets, PPSs), які забезпечують більшу надійність і гнучкість , ніж попередні технології.
  • Гнучке упорядкування макроблоків (FMO), також відоме як групи частин (підтримується не у всіх профілях) і довільне упорядкування частин (ASO) - методи реструктурування порядку подання фундаментальних областей (макроблоків) в зображеннях. При ефективному використанні гнучке впорядковування макроблоків може істотно підвищити стійкість до втрати даних.

Завдяки ASO, так як кожна частина зображення може бути декодована незалежно від інших (при певних обмеженнях кодування), новий стандарт дозволяє посилати і отримувати їх в довільному порядку один щодо одного. Це може знизити затримку в додатках реального часу, особливо при використанні на мережах, що мають режим роботи доставка позачергово Ці функції можуть також використовуватися для безлічі інших цілей крім відновлення помилок.

  • Розбиття даних - функція, що забезпечує поділ даних різної важливості (наприклад, вектори руху та інша інформація передбачення має велику значимість для подання відеоконтенту) по різних пакетах даних з різними рівнями захисту від помилок (підтримується не у всіх профілях).
  • Надлишкові частини. Можливість здійснення кодером надлишкового представлення областей зображень, дозволяючи відтворити області зображень (зазвичай з деякою втратою якості), дані про яких були втрачені в процесі передачі (підтримується не у всіх профілях).
  • Нумерація кадрів, що дозволяє створення «підпослідовностей» (включаючи тимчасове масштабування включенням додаткових кадрів між іншими) а також виявлення (і приховування) втрат цілих кадрів при збоях каналу або зникнення пакетів.

недоліки

Кодеки для MPEG-4 AVC більш вимогливі до ресурсів, ніж кодеки на основі MPEG-4 ASP (такі, як DivX і XviD), проте це компенсується іншими перевагами.

Новости