This version of the page http://www.proga101.com.ua/151631.php (0.0.0.0) stored by archive.org.ua. It represents a snapshot of the page as of 2009-03-31. The original page over time could change.
MPEG2 и нелинейный монтаж - просто о затейливом » PC-Codecs.com :: Видео кодеки, аудио кодеки
PC-Codecs.com :: Аудио и видео кодеки
Добавить в избранное
Каталог ПО: Аудио кодеки Видео кодеки Набор кодеков Фильтры Плагины Программы
ОБНОВЛЕНИЕ КОДЕКОВ
    АУДИО КОДЕКИ
  • DirectShow Filters for Ogg Vorbis 0.80.15039
  • Lame Front-End 1.1
  • WavPack 4.50
  • AC3Filter 1.51a
  • LAME MP3 Encoder 3.98
    ВИДЕО КОДЕКИ
  • x264 Video Codec 922
  • FFDShow rev2044 2008-07-21
  • Leiming's x264 GUI 2008-07-21
  • Lagarith Lossless Video Codec 1.3.17
  • Etymonix SoftReel v2.10 beta 1
    НАБОР КОДЕКОВ
  • K-Lite Codec Pack 4.10 Corporate
  • K-Lite Codec Pack 4.10 Standard
  • K-Lite Mega Codec Pack 4.10
  • K-Lite Codec Pack 4.10 Full
  • XP Codec Pack 2.4

MPEG2 и нелинейный монтаж - просто о затейливом

Среди любителей из космоса видео все пуще можно слышать диалоги об MPEG2 кодировании. Барыш к нему сегодня растет, чуть ли не быстрее настоящего расширения областей его практичного применения. Действительно, интересуемся ли мы эффективным алгоритмом компрессии в загадках нелинейного монтажа и видеопроизводства, задумываемся ли о изделии личных DVD фильмов или цифровых видеоархивов, анализируем ли законы записи Betacam SX или стандартов хранения известных на видеосерверах, наконец, обсуждаем ли особенности цифровой передачи программ в кабельном и спутниковом телевидении, везде мы сталкиваемся с упоминанием об MPEG2. Из вышеприведенного перечисления ясно, что этот алгоритм многолик и многогранен, так что знатоки различных областей, говоря об MPEG, порой думают о различном. Но, на настоящем действии, не столь он сложен, чтобы не понять его главные законы. Так давайте разберемся.

Главные представления

Вынужден начать с набившего оскомину заимствования, что MPEG это аббревиатура от Moving Pictures Experts Group. Так называется совет по стандартизации методов цифровой компрессии потоков видеоданных международной организации ISO/IEC (International Standards Organization/International Electrotechnical Commission). Простое загадка этого совета была в разработке формата хранения и проигрывания аудио-видео известных с компакт дисков CD-ROM. Так появился первый стандарт MPEG-1, ориентированный на низкоскоростные каналы передачи информации около 1Mbps (здесь и далее Kbps – Kilobit per second, Mbps – Megabit per second, MBps – MegaByte per second) и глупый разрешением кадра в 352x288 (для PAL знака). Затем по мерке расширения загадок передачи видео, повышения пропускной способности каналов и роста домогательств к визуальному свойству получаемых изваяний появились MPEG-2, MPEG-4 и даже MPEG-7, оптимизированные под особенные заданные положения. Так, например, MPEG-4 в главном предназначен для цифровой передачи видеоданных по телефонным неудачам (Интернет, видеоконференции) в положениях жестко ограниченной пропускной способности (типично – 28.8 Kbps), а потому уменьшает разрешение еще в 4 раза – до 176x144, но использует настоящую продвинутую схему кодирования с разделением изваяния на подобные беспричинные объекты, как фон, текст, 2D/3D графика, “разговаривающие” человеческие личика, двигающиеся тела и т.д. Но в державу очевидной сложности этот стандарт пока не получил прикладной реализации.

что касается MPEG-2, то изначально он был нацелен на решение загадки передачи телевизионных изваяний. Ежедневный из нас по личному эксперименту знает, что свойство наблюдаемой на телевизоре картинки бывает очень различным. Одно действие смотреть фильм, воспроизводимый на семейном видеомагнитофоне или передаваемый по туземному кабельному телевидению, и совсем другое – наслаждаться видео с DVD или спутникового канала. Соответственно MPEG-2, как определено в акте ISO/IEC 13818-2, объединяет семейство взаимосогласованных и совместимых сверху вниз цифровых стандартов сжатия телевизионных знаков. Точнее, он допускает 4 уровня (Levels) разрешения кадра и 5 базовых профилей (Profiles) кодирования знаков яркости и цветности.

Уровни: малорослый LL (Low Level) с разрешением кадра 352х288 (соответствует MPEG1), основной ML (Main Level) 720х576, возвышенный HL-1440 (High Level) 1440х1152 и возвышенный HL-1920 1920х1152. Отметим, что если в соотношении с рекомендацией ITU-R BT.601 (International Telecommunications Union – Recommendation) основной уровень определяет разрешение стандартного телевизионного кадра, то возвышенные уровни ориентированы на телевидение высокой четкости.

Профили: простой SP (Simple Profile), основной MP (Main Profile), 2 масштабируемых – по известию знак-говор SNR Scalable Profile и по разрешению Spatially Scalable Profile и, наконец, возвышенный HP (High Profile). Важное пространство также занимает не определенный стандартом, но активно используемый в практике так называемый основной профессиональный или, по-непохожему, MPEG 422 профиль. Его обозначают как 422Р. Если с уровнями все понятно, то изъяснение различий профилей требует некоторой подготовки.

Немного теории

Эффективное сжатие видео информации зиждется на двух основных идеях: подавление несущественных для визуального восприятия дробных деталей пространственного деления единичных кадров и устранение временной избыточности в последовательности этих кадров. Соответственно говорят о пространственной и временной компрессии.

В передовой из них используется экспериментально обыкновенная маленькая чувствительность человеческого восприятия к искажениям дробных деталей изваяния. Глаз быстрее замечает неоднородность равномерного фона, чем искривление тонкой межи или изменение яркости и колера маленького участка. Из ученики известно два эквивалентных воззрения изваяния: привычное нам пространственное деление яркости и колера и так называемое частотное деление, связанное с пространственным Дискретным Косинусным Исправлением (ДКП). В теории они равнозначны и обратимы, но сохраняют информацию о конструкции изваяния совершенно по-различному: передачу плавных изменений фона обеспечивают низкочастотные (центральные) значения частотного деления, а за дробные детали пространственного деления отвечают высокочастотные коэффициенты. Это позволяет использовать последующий алгоритм сжатия. Кадр разбивается на блоки размером 16х16 (размеру 720х576 соответствует 45х36 блоков), ежедневный из каких ДКП переводится в частотную область. Затем заслуженные частотные коэффициенты подвергаются квантованию (округлению значений с задаваемым интервалом). Если само по себе ДКП не приводит к потере известных, но квантование коэффициентов, очевидно, вызывает огрубление изваяния. Операция квантования выполняется с переменным интервалом – наиболее точно передается низкочастотная информация, в то время как многие высокочастотные коэффициенты принимают нулевые значения. Это обеспечивает значительное сжатие потока известных, но приводит к снижению эффективного разрешения и достижимому появлению малых неправильных деталей (в частности, на меже блоков). Очевидно, что чем более грубое квантование используется, тем больше степень сжатия, но и тем ниже свойство результирующего знака.

Для бдительных лекторов повторимся, что этот алгоритм пришел из цифровой фотографии, где под именем JPEG был разработан для эффективного сжатия единичных кадров (JPEG – это аббревиатура от слова утвердившего его международного соединения Joint Photographic Experts Group). Затем он был успешно применен для видеопоследовательностей кадров (при этом ежедневный из них обрабатывается совершенно независимо) и получил новое наименование MJPEG (Motion-JPEG). Необходимо также отметить, что DV-кодировка цифровых стандартов DV/DVCAM/DVCPRO принципиально основана на том же алгоритме, но использует более упругую схему с адаптивным выбором таблиц квантования. Коэффициент компрессии для разных блоков, в предпочтение от MJPEG, меняется по изваянию: для малоинформативных блоков (например, на краях изваяния) он увеличивается, а для блоков с числом дробных деталей уменьшается относительно среднего по изваянию уровня. В результате при том же свойстве достигается сокращение объема известных примерно на 15% (или наоборот – при том же потоке выше свойство выходного знака).

Скоротечная MPEG-компрессия использует возвышенную избыточность информации в изваяниях, разделенных маленьким интервалом. Действительно, между близкими изваяниями обычно меняется только маленькая часть сцены – например, происходит плавное увольнение небольшого объекта на фоне фиксированного последнего проекта. В этом инциденте исполненную информацию о сцене нужно сохранять только выборочно - для опорных изваяний. Для остальных достаточно передавать только разностную информацию: о расположении объекта, веянии и дозе его увольнения, о небывалых элементах фона (открывающихся за объектом по мерке его движения). Причем эти разности можно формировать не только по сопоставлению с прежними изваяниями, но и с будущими (поскольку именно в них по мерке движения объекта открывается часть фона, ранее тайная за объектом). Отметим, что математически наиболее затейливым элементом является поиск смещающихся, но мало изменяющихся по конструкции блоков (16х16) и определение заслуженных векторов их увольнения. Однако это элемент наиболее существенен, так как позволяет существенно уменьшить объем требуемой информации. Именно эффективностью выполнения этого "интеллектуального" элемента в настоящем времени и отличаются разные MPEG-кодеры.

Подобным ликом, в MPEG кодировке принципиально формируются три вида кадров: I (Intra), выполняющие роль опорных и сохраняющие исполненный объем информации о конструкции изваяния; P (Predictive), несущие информацию об изменениях в конструкции изваяния по сопоставлению с прежним кадром (видов I или P); B (Bi-directional), сохраняющие только настоящую важную часть информацию об предпочтениях от прежнего и будущего изваяний (только I или P). Принципиальная схема последующей компрессии I-кадров, также как и разностных P- и B-кадров, аналогична MJPEG, но, как и у DV, с адаптивной подстройкой таблиц квантования. В частности, это позволяет охарактеризовать DV-знак как личный инцидент MPEG последовательности из I-кадров с заданным фиксированным потоком (коэффициентом компрессии). Последовательности I-, P-, B-кадров объединяются в фиксированные по длине и конструкции группы кадров - GOP (Group of Pictures). Ежедневная GOP обязательно начинается с I и с определенной периодичностью содержит P кадры. Ее конструкцию описывают как M/N, где M – общее количество кадров в группе, а N – интервал между P-кадрами. Так, типичная для Video-CD и DVD IPB группа 15/3 имеет последующий лик: IBBPBBPBBPBBPBB. Здесь ежедневный B кадр восстанавливается по окружающим его P кадрам (в начинании и конце группы - по I и Р), а в свою очередь ежедневный Р кадр – по прежнему Р (или I) кадру. В то же время I кадры самодостаточны и могут быть восстановлены независимо от иных, но являются опорными для всех P и тем более B кадров группы. Соответственно у I и P наименьшая степень компрессии, у В – наибольшая. Установлено, что по размеру типичный Р кадр составляет 1/3 от I, а B – 1/8 часть.

В результате MPEG последовательность IPPP (GOP 4/1) обеспечивает 2-кратное уменьшение требуемого потока известных (при том же свойстве) по сопоставлению с последовательностью только из I кадров, а использование GOP 15/3 позволяет достичь 4-кратного сжатия.

Профили MPEG-2

Теперь мы вправе вернуться к изображению разные профили. В бесхитростном профиле SP осуществляется только компенсация движения и прорицание по одному веянию (P кадры). В главном профиле MP прорицание выполняется по двум веяниям, т.е. допускаются B-кадры. В масштабируемых профилях осуществляется разделение исходного цифрового потока видеоданных на несколько частей по разным критериям. В масштабируемом по известию знак-говор SNR Scalable Profile поток разделяют на 2 части. Передовая из них – основной знак, несет информацию с пониженным известием знак-говор (более огрубелая дискретизация). Но эта часть защищается более солидным к помехам передачи алгоритмом (и соответственно, требующим больше бит), принимается в здоровых говорах и позволяет даже при неблагоприятных положениях восстановить ТВ-изваяние (хотя и с пониженным известием знак-говор). Менее защищенная другая часть – так называемый дополнительный знак – при непрочном приеме просто отбрасывается. При солидном приеме он позволяет дополнить основной знак и повысить известие знак-говор до исходного значения.

Пятый профиль HP, верховный, включает в себя все функции прежних, но использует YUV- воззрение не 4:2:0, а 4:2:2, т.е. передает цветоразностные знаки в два раза пуще (в каждой линии, в ежедневном элементе черты). Здесь опять требуется исключение. Известно, что телевизионный знак представляет собой совокупность знака яркости Y и двух цветоразностных знаков U и V. Вариации их значений допускают 256 градаций (от 0 до 255 для Y, и от –128 до 127 для U/V), что в двоичном исчислении соответствует 8 битам или 1 байту. Духовно ежедневный элемент кадра имеет личные значения YUV, т.е. требует 3 байт. Такое воззрение, когда как яркость, так и знаки цветности имеют равное количество беспричинных значений, обычно обозначают как 4:4:4. Но зрительная система человека менее чувствительна к цветовым пространственным изменениям, чем к яркостным. И без видимой утраты свойства количество цветовых отсчетов в каждой линии можно уменьшить вдвое. Именно такое воззрение, обозначаемое как 4:2:2, было принято в вещательном телевидении. При этом для передачи исполненного значения телевизионного знака в ежедневном отсчете кадра достаточно 2 байт (чередуя через отсчет беспричинные значения U и V). Более того, для целей потребительского видео признано возможным уменьшение вдвое и вертикального цветового разрешение, т.е. перейти к воззрению 4:2:0. Это уменьшает приведенное количество байт на отсчет до 1,5. Отметим, что именно такое воззрение было заложено в DV-формат цифровых комнат, а также формат DVD-видео. Однако, в профессиональных загадках цифрового редактирования и монтажа видео, когда возможно многократное и многослойное использование фрагментов отснятого материала и включение в него компьютерной графики, во избежание результирующего накапливания опечаток изначально требуется более высокое свойство цифрового видео. Поэтому здесь считается вежливым воззрение 4:2:2. Именно этим отличается профиль 422P от основного. Следующая таблица суммирует различия всех описанных профилей.

Профиль Простой (SP) Основной (MP) 422P Масштабируемый (SNR) Пространственно масштабируемый Возвышенный (HP)
Функции
I-кадры + + + + + +
P-кадры + + + + + +
B-кадры - + + + + +
Разделение по SNR - - - + + +
Разделение по разрешению - - - - + +
YUV-воззрение 4:2:0 4:2:0 4:2:2 4:2:0 4:2:0 4:2:2

Компрессия тона

До сих пор речь шла только о компрессии изваяний. Но полноценное видео подразумевает и звуковую составляющую. Считается, что тон CD свойства требует оцифровки с частотой 44,1 Кгц при бездне 16 bit на канал, что соответствует потоку в 706 Kbps на канал (1,4 Mbps для стерео). DAT свойство знака определяет частоту оцифровки в 48 Кгц (судьба частот 4-24000 Гц) и увеличивает поток до 768 Kbps на канал. Подход к сжатию информации тот же – отбрасывание части, не очень существенной для восприятия человеческим ухом. MPEG стандарт разрешает 3 уровня (Layer) компрессии аудио. Layer 1 использует наиболее простой алгоритм с минимальной компрессией, что предполагает 192 Kbps на канал. Алгоритм Layer 2 более затейливый, зато и степень компрессии больше, всего 128 Kbps на канал. Сильный алгоритм сжатия цифрового тона CD-свойства (в 11 раз без различаемых человеческим ухом потерь) Layer 3 обеспечивает максимально возможное свойство тона при жестких ограничениях потока – не более 64 Kbps на канал. В главном он предназначен для Интернет. Его значение столь велико, что он получил особое сокращенное наименование MP3, что означает MPEG Layer 3. Появилось множество Интернет-сайтов, содержащих сотни тысяч MP3-файлов с популярной музыкой. С помощью особенных программ проигрывания (Real Audio) MP3-музыку можно в настоящем времени слушать через Интернет, ее можно неограниченно копировать (предостережем, что типичная песня занимает от 2 до 8 MB) и нелегально распространять. Уже появились портативные MP3-плейеры платой около 200 долларов (например, Diamond Rio). Музыкальная индустрия, неся ощутимые утраты, начинания активную борьбу с MP3 сайтами (Recording Industry Association of America нашла и добилась закрытия большей их части). Но джин выпущен, всех не закроешь. Фирма Adaptec предсказывает миллиарды загруженных через Интернет песен в ближайшие годы и заявляет о поддержке MP3 в следующей версии программы EasyCD Creator. Однако, в загадках цифрового редактирования сжатие аудио знаков не используется, поэтому в расчетах возможных потоков на звуковую составляющую необходимо отводить до 1,5 Mbps.

MPEG-2 в загадках нелинейного монтажа

Термин нелинейный монтаж не соответствует сути спора, а лишь отражает одну из его характеристик. На настоящем действии речь идет о монтаже видеофильмов, осуществляемом в цифровом лике на компьютерах. При этом исходные видеофрагменты подвергаются обязательной оцифровке и записи на винчестер в лике заслуженных файлов. В предпочтение от накопителей на магнитных лентах, доступ к из этих файлов-фрагментов не требует утомительной перемотки (а этот спор линейный), т.е. все кадры видео доступны в вольном порядке. Это важное качество и обусловило слово цифрового монтажа как нелинейного, хотя, очевидно, возможности цифровой отделки намного шире и богаче.

Напомним, что согласно рекомендации ITU-R BT.601 телевизионный кадр представляет собой матрицу 720х576. Принимая во внимание телевизионную кадровую частоту в 25 Гц, приходим к выводу, что одна секунда цифрового видео в воззрении 4:2:2 требует 25x2x720x576=20736000 байт, т.е. поток известных составляет 21 MBps. Запись похожих потоков технически осуществима, но сложна, дорогостояща и неэффективна с точки зрения последующей отделки. Настоящие возможности практики требуют важного уменьшения потоков. Известно множество алгоритмов, осуществляющих компрессию без утраты информации, но даже настоящие эффективные из них на типичных изваяниях не обеспечивают сжатия более 2 раз.

До нового времени в космосе систем нелинейного видеомонтажа безраздельно царил M-JPEG. Разные решения отличались степенью компрессии, что соответствовало разным уровням свойства результирующего видео. Весьма условно, здесь можно выделить 4 уровня: Стандартное Видео (VHS, C-VHS, Video8), Супер-Видео (SVHS, C-SVHS, Hi8), Цифровое Видео (Betacam SP, DV/DVCAM/DVCPRO, mini-DV, Digital8) и Студийное Видео (Digital-S, DVCPRO50). Для простоты в будущем будем обозначать их как Video, S-Video, DV и Studio-TV. Количественно они обычно характеризуются горизонтальным разрешением (количеством различаемых в линии элементов – телевизионных неудач). Считается, что Video обеспечивает разрешение до 280 неудач и соответствует MJPEG поток около 2 MBps, S-Video – 400 неудач и 4 MBps, DV – 500 неудач и 3,1 MBps, а Studio-TV обеспечивает разрешение не менее 600 неудач при потоках в 7 MBps. Коэффициенты компрессии составляют соответственно 10:1, 5:1, 5:1 и 3:1 (напомним, что DV алгоритм эффективнее MJPEG). Но даже подобное сжатие требует для хранения и отделки видеофайлов больших объемов дискового места. Например, 1 минута MJPEG-видео требует 120 MB для свойства Video и около 500 MB для Studio-TV. Но ведь хочется работать с роликами продолжительностью в десятки минут!

И вот здесь на арену выступает MPEG2. Уже просто переход к I-кадрам позволяет сэкономить 15% объема, а если использовать P-кадры, то можно выиграть еще вдвое (для групп IPPP), а это уже существенно. Истина, существует суждение, что в заключительном инциденте теряется одно из основных достоинств нелинейного монтажа, а именно его по-кадровая точность. На настоящем действии, это заблуждение. По разностным P-кадрам исходная конструкция изваяний легко и быстро восстанавливается (для нынешних процессоров похожая загадка не составляет труда и выполняется в настоящем времени). что касается точности восстановления, то в долгих группах и/или при наличии B-кадров она действительно заметно падает. Поэтому, например, DVD-Video (GOP 15/3) не подлежит редактированию. В то же время у малых групп только из I и P кадров восстановление происходит дельно без накопления опечаток. Подобным ликом, при MPEG2 кодировании 422P@ML для обеспечения студийного свойства достаточно потока в 50 Mbps при I-кадрах (I-frame only) и в 25 Mbps при группе IPPP (см. таблицу)

Video S-Video DV Studio-TV
MJPEG 16 Mbps 32 Mbps 38 Mbps 56 Mbps
I-frame 422P@ML 14 Mbps 28 Mbps 33 Mbps 49 Mbps
I-frame MP@ML 10 Mbps 21 Mbps 25 Mbps 37 Mbps
IPPP 422P@ML 7 Mbps 14 Mbps 17 Mbps 24 Mbps
IPPP MP@ML 5 Mbps 10 Mbps 12.5 Mbps 18 Mbps
IBP 15/3 MP@ML 2.5 Mbps 5 Mbps 6 Mbps 9 Mbps

Именно в подобном веянии и идут нынешние системы нелинейного монтажа. Пока образчиков их не много. Это Fast 601 [six-o-one] и Pinnacle miroVideo DC1000 и Matrox DigiSuite DTV. Но достоинства известного подхода столь очевидны, что в ближайшем грядущем обязательно появятся и иные решения.


« Июль 2008 »
ПнВтСрчтПтСбВс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31





Добавить Новость © 2006-2008 PC-Codecs.com - Скачать аудио и видео кодеки
Развитие сайта | Отказ от ответственности | Ссылки на сайт | Как приготовить - Десерт `Мороз и Солнце` | Статистика
Написать послание