H.264

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

H.264/MPEG-4 AVC est une norme H. pour la compression vidéo . Les successeurs sont H.265 , VP9 et Daala . Il a été initialement développé par l' ITU (Study Group 16, Video Coding Experts Group) sous le nom de H.26L. En 2001, le groupe ITU fusionne avec MPEG-Visuel et poursuivi le développement ensemble au sein de l'équipe vidéo conjointe (JVT). L'objectif du projet était de concevoir une méthode de compression qui réduirait au moins de moitié le débit de données requis par rapport aux standards de l'époque, tant pour les applications mobiles que dans les secteurs TV et HD, tout en conservant la même qualité. Les membres du groupe de travail viennent de l' Institut Fraunhofer pour les télécommunications , Microsoft et Cisco Systems , entre autres . [1] En 2003, la norme a été adoptée par les deux organisations avec un libellé identique. La désignation ITU est H.264. Avec ISO / IEC MPEG, la norme fonctionne sous la désignationMPEG-4/AVC ( Advanced Video Coding ) et est la dixième partie de la norme MPEG-4 ( MPEG-4/Part 10, ISO/IEC 14496-10 ). La norme ne doit pas être confondue avec la norme MPEG-4/ASP (MPEG-4/Part 2, ISO/IEC 14496-2).

H.264 atteint généralement environ trois fois l'efficacité de codage de H.262 ( MPEG-2 ) et, comme H.262 [2] , est conçu pour les données d'image haute résolution (par exemple HDTV ). Cela signifie qu'une qualité comparable peut être obtenue avec environ un tiers du volume de données MPEG-2. Cependant, l'effort de calcul est également plus élevé d'un facteur 2 à 3.

Les FourCC utilisés pour la norme sont « AVC1 », « DAVC », « H264 », « x264 » et « VSSH ». L' ID de codec Matroska est "V_MPEG4/ISO/AVC".

Le format de fichier / format de conteneur standardisé est MP4 .

zones d'application

H.264 n'a pas été conçu pour un usage spécifique, mais fonctionne plutôt bien dans une gamme assez large d'applications. Par conséquent, les domaines d'application actuellement les plus prometteurs sont également très différents :

TVHD
H.264 est l'une des méthodes de compression vidéo obligatoires de la norme Blu-ray et est obligatoire pour la transmission de télévision haute résolution utilisant DVB-S2 (par exemple HD-1 et Sky HD , ainsi que ProSieben HD et RTL HD). La norme HD-DVD , abandonnée en 2008, prévoyait également la compression vidéo à l'aide de la méthode H.264.
vidéo portable
Les normes de télévision mobile concurrentes DVB-H et DMB utilisent toutes deux (entre autres) H.264 pour le codage vidéo des appareils mobiles tels que les téléphones portables ou les PDA . La PlayStation Portable , l' Apple iPod de cinquième génération , l'iPhone et le lecteur Zune uniquement aux États-Unis peuvent également lire la vidéo H.264.
multimédia
Apple livre son framework multimédia QuickTime à partir de la version 7 avec un codec H.264.
technologie de visioconférence
Les systèmes d'extrémité de visioconférence avec codecs H.264 sont disponibles pour les utilisateurs depuis 2005. Par exemple, plusieurs visioconférences sont possibles dans iChat AV 3.x pour la première fois.
vidéo/caméras numériques
Un certain nombre d' appareils photo numériques et de caméras vidéo prennent en charge la compression H.264 pour l'enregistrement vidéo.

Procédures connexes

Lors de la spécification de H.264, plusieurs voies de développement commercial se sont scindées, qui s'appuient plus ou moins directement sur H.264, mais représentent finalement une entité partiellement incompatible :

  • Sorenson Video 3 , un codec très courant dans le contexte de QuickTime et dans le contexte du format de fichier *.mov, qui ne diffère du H.264 que par des détails.
  • Microsoft Windows Media Video 9 (*.wmv, FourCC : WMV9/wvc1) est un codec vidéo de Microsoft, qui utilise également le filtrage en boucle. La variante VC-1 (FourCC : wvc1) (anciennement VC-9 après WMV9) est également l'un des codecs utilisés en HD DVD et Blu-ray Disc .
  • VP8 , est un codec vidéo développé par la société Google On2 Technologies. Il est basé sur la série de développements TrueMotion .

avancées

Détails techniques

H.264 est largement basé sur ses prédécesseurs MPEG-1, MPEG-2, MPEG-4 et la famille H.261, mais montre des changements et des extensions significatifs (voir aussi [3] ) :

  • Au lieu d'une transformation en cosinus discrète (DCT) avec des blocs de 8 × 8 pixels, une transformation entière sur des blocs de 4 × 4 pixels (jusqu'à 8 × 8 pixels peuvent également être sélectionnés dans le profil haut) est utilisée.
  • Le codage d'entropie a été ajusté à la transformation modifiée. En plus des codes VLC classiques de type Huffman ( CAVLC , Context Adaptive Variable Length Coding ), H.264 prend également en charge un codage arithmétique plus puissant ( Context-Adaptive Binary Arithmetic Coding (CABAC)).
  • Partitionnement des macroblocs : Les macroblocs de 16 × 16 pixels peuvent être partitionnés en sous-blocs jusqu'à 4 × 4 pixels. Etant donné qu'un vecteur de mouvement séparé est stocké pour chaque bloc , des mouvements spatialement définis de manière précise et, surtout, complexes peuvent être mieux codés.
  • La compensation de mouvement est toujours précise au 1/4 de pixel (avec H.263 , c'est-à-dire MPEG-4/ASP, c'était une option). La compensation de mouvement pour les demi-pixels n'est plus effectuée avec un filtre à deux coefficients (moyenne : +1/2, +1/2), mais avec un filtre plus complexe à six coefficients (+1/32, -5/32, + 20/32, +20/32, -5/32, +1/32). Des quarts de pixels sont calculés à partir des données d'un demi-pixel par une autre moyenne.
  • Prédiction intra : une forme de prédiction d'image est également utilisée dans les images I. Les valeurs de pixels d'un bloc sont estimées à partir des pixels environnants qui ont déjà été décodés, puis seule la différence avec le contenu réel de l'image est codée. Pour les images de plus petite taille, cette méthode est généralement plus efficace que JPEG 2000 .
  • Prédiction à long terme : les trames P et B peuvent non seulement contenir des références à la dernière trame I ou P, mais aussi à un maximum de 16 trames précédentes, théoriquement n'importe quel nombre de trames dans le passé, afin d'assurer un codage plus efficace des trames périodiques. les mouvements permettent.
  • Prédiction pondérée : si le contenu d'image de plusieurs cadres de référence est mélangé, les sources peuvent être pondérées comme vous le souhaitez dans le mélange. De cette manière, les fondus et les fondus enchaînés peuvent être codés très efficacement.
  • Filtre de déblocage : alors que les codecs MPEG précédents reposent exclusivement sur un post-traitement/filtrage externe facultatif, un filtre de déblocage fait partie intégrante du H.264 (comme pour le H.263 dans l'annexe J). Les références aux trames déjà décodées font également référence aux images déjà filtrées. Cela permet d'obtenir une qualité d'image perçue très élevée. Surtout lorsqu'il est combiné avec la taille de transformation réduite de 4 × 4, il y a de grandes améliorations subjectives (et dans une moindre mesure objectives).
  • Commutation des tranches : permet une transition transparente entre différents flux vidéo sans avoir à utiliser des images I « coûteuses » (parce que volumineuses).
  • Ordre flexible des macroblocs : les macroblocs d'une trame ou d'une tranche peuvent être spécifiés dans un ordre relativement libre. Cela peut par ex. B. pour la dissimulation d'erreurs en cas de perte de canal (vidéo mobile). Cependant, FMO n'est pas pris en charge par la plupart des encodeurs et décodeurs, et ne fait pas non plus partie des profils Main et High .

profils

Les profils et les niveaux sont destinés à favoriser la coopération des différentes implémentations des constructeurs. Les profils résument certaines fonctionnalités qui doivent être prises en charge. Un niveau impose des restrictions sur les variables d'un flux de données, telles que la résolution maximale ou le débit binaire.

niveaux

Comme dans MPEG-2, H.264 définit différents niveaux. Celles-ci sont d'autant plus élevées que le débit de la vidéo est élevé.

Les valeurs limites admissibles des profils individuels sont indiquées dans le tableau suivant : [4]

implémentations

  • Norme multimédia AVCHD pour les caméras vidéo numériques haute résolution grand public et prosommateur .
  • Implémentation AVC-Intra de Panasonic pour les productions vidéo professionnelles
  • Logiciel de référence JM de l'équipe vidéo conjointe [5]
  • x264 est un encodeur H.264 sous licence GPL .
  • La bibliothèque libavcodec gratuite sous licence LGPL comprend un décodeur et un encodeur H.264.
  • Apple a intégré H.264 dans macOS à partir de la version 10.4 (Tiger) et dans QuickTime version 7.
  • Nero Digital inclut un encodeur H.264 développé par Nero AG et Ateme .
  • Sorenson propose une implémentation de H.264.
  • Main Concept propose l'encodeur H.264 dans le logiciel, l'encodeur OpenCL et CUDA.
  • Elecard H.264
  • Lead Technologies dispose d'un codec vidéo H.264.
  • CoreAVC est un décodeur logiciel H.264
  • Pixeltools Expert H264
  • Adobe Flash Player 9+
  • DivX H.264
  • Intel Ivy Bridge QuickSync (encodeur GPU)
  • Photon discret
  • nanocosmos propose des codecs H.264 pour Windows et MacOS
  • Citrix utilise la méthode de compression pour son protocole HDX (anciennement ICA) dans les produits XenApp 6.5 et XenDesktop 7 pour transmettre des images animées. [6]

Essai

Dans certains tests du MSU Graphics & Media Lab (Video Group), le codec x264 s'est imposé comme le leader. [7] [8] [9] [10] [11] [12] [13] Comparé au DivX, il n'a besoin que de 2/3 du flux de données pour le même résultat. [14] En raison d'un développement continu, le codec a été considérablement amélioré ces dernières années pour un flux de données inférieur avec la qualité d'image souhaitée. Ceci est très important, en particulier pour les transmissions par satellite et Internet avec une capacité limitée, par exemple.

Comparé à H.265 et H.264, le codec frère x265 a un flux de données inférieur de 20 % avec la même qualité d'image et est donc 25 % meilleur. [15]

brevets

De nombreuses techniques utilisées dans H.264 sont protégées par des brevets . Comme pour MPEG-2 , MPEG-4 exige des frais de la part des fabricants et des fournisseurs de services qui souhaitent utiliser cette norme. Afin que vous n'ayez pas à demander l'autorisation à chaque titulaire de brevet individuellement, ils confient généralement leurs brevets à une communauté de brevets pour administration, qui s'occupe de la répartition des revenus individuels. Cependant, comme il s'agit d'une mesure volontaire, deux pools de brevets se sont formés pour H.264, auxquels tous les titulaires de brevets n'ont pas encore adhéré. D'une part, il y a l' administration des licences MPEGMPEG Licensing Administration », « MPEG LA » en abrégé), [16]qui gère déjà les pools de brevets pour MPEG-2, et d'autre part un pool de brevets de Via Licensing, une filiale de Dolby Laboratories .

La période de licence initiale (« Durée initiale de la licence ») – du codec vidéo « H.264/AVC » de MPEG LA – courait jusqu'au 31 décembre 2010. [17]

Selon une déclaration de MPEG LA, les développeurs peuvent l'utiliser gratuitement pendant encore cinq ans (au cours de la deuxième période de licence du 1er janvier 2011 au 31 décembre 2015), tant que le streaming vidéo reste gratuit pour les utilisateurs. [18] MPEG LA a entre-temps annoncé qu'il ne facturera définitivement aucun droit de licence pour l'utilisation des offres de streaming gratuites. [19] [20]

Fin 2019, environ 15 % des brevets avaient expiré. [21]

Lecture sur PC

Avec l'aide de ffdshow , les vidéos encodées en H.264 peuvent être lues avec des lecteurs vidéo basés sur DirectShow tels que Windows Media Player ou Media Player Classic .

Une alternative aux lecteurs basés sur DirectShow est par ex. B. fourni avec le MPlayer ou le lecteur multimédia VLC . Les deux maîtrisent le décodage du H.264 et peuvent lire tous les conteneurs pertinents. De plus, les deux programmes sont disponibles gratuitement. Le filtre ffdshow, MPlayer et le lecteur VLC utilisent la bibliothèque libavcodec pour le décodage H.264, qui prend en charge les matrices de quantification définies par l'utilisateur.

De plus, QuickTime d' Apple à partir de la version 7 est capable de lire le H.264. QuickTime est disponible pour les versions actuelles de macOS et Windows . Cependant, QuickTime 7 ne lit aucun contenu produit par l'encodeur ffdshow H.264 mais affiche une image noire. L'extension Perian propose ici de l'aide .

L' iPod d'Apple lit H.264 dans les conteneurs MP4 et .mov . La création d'une vidéo H.264 compatible iPod peut être effectuée avec l'encodeur Quicktime H.264 ou le x264 . Pour des raisons techniques, les possibilités qualitatives de l'encodeur iPod sont plus restreintes que ne le permet la norme H.264. Dans la génération 6, cependant, l'iPod prend toujours en charge une version à faible complexité du profil de base H.264 avec une résolution allant jusqu'à 640 × 480 pixels à 30 images par seconde et un débit de données maximal de 2,5 Mbit/s niveau 3.0.

Étant donné que H.264 n'est pas lié à un format de conteneur spécifique, les vidéos peuvent être disponibles sous forme de fichiers MP4, AVI , Matroska ou Ogg Media . Il est même possible d'enregistrer des vidéos H.264 en tant que données brutes (.264). Ces données brutes peuvent alors z. B. avec MP4Box (GPAC) ou mkvmerge dans un conteneur approprié. En plus d'un décodeur, vous avez également besoin d'un séparateur (démultiplexeur) prenant en charge le format de conteneur utilisé. Sous Windows, le Haali Media Splitter est adapté à cela, un filtre source pour DirectShow qui peut gérer presque tous les formats de conteneurs pertinents.

La lecture via le décodage logiciel nécessitait beaucoup de puissance CPU au moment de sa sortie. Un soulagement pour le CPU est possible avec un matériel approprié, qui est intégré dans de nombreuses cartes graphiques, en relation avec le logiciel de décodage qui est basé sur celui-ci, par ex. B. au moyen de DXVA ou VDPAU . [22]

liens web

les détails

  1. Département de la presse et de l'information : Un autre prix pour le codage vidéo. Prof. Dr. Thomas Wiegand reçoit le IEEE Masaru Ibuka Consumer Electronics Award à Las Vegas . Technische Universität Berlin, 16 janvier 2012, récupéré le 18 janvier 2012 : « Thomas Wiegand est honoré avec le Dr. Gisle Bjontegaard de Cisco et Dr. Gary Sullivan de Microsoft pour le développement et la mise en place de la norme internationale de codage vidéo H.264/MPEG4-AVC."
  2. ↑ La TVHD a été introduite avec MPEG-2 (1920x1080 @30), chaîne Euro1080 diffusée en MPEG-2 jusqu'au 6 janvier 2007. Incidemment, le premier téléviseur HD était analogique et réussi (Japon, MUSE , fonctionnement régulier 1991-2007 avec 1035 lignes visibles/total 1125)
  3. Strutz : Compression des données d'images. Springer Vieweg, 2009
  4. Page de publication UIT-T : H.264 : Codage vidéo avancé pour les services audiovisuels génériques UIT-T, janvier 2012.
  5. Logiciel de référence H.264/AVC JM – Page sur HHI ; Au 22 avril 2010
  6. http://blogs.citrix.com/2012/10/17/reinventing-hdx-adaptive-display-for-mobile-workers/
  7. 1ère comparaison MPEG4-AVC/H.264. Consulté le 22 avril 2016 .
  8. 2ème comparaison MPEG4-AVC/H.264. Consulté le 22 avril 2016 .
  9. 3ème comparaison MPEG4-AVC/H.264. Consulté le 22 avril 2016 .
  10. 4e comparaison des codecs vidéo MPEG-4 AVC/H.264. Consulté le 22 avril 2016 .
  11. 5e comparaison des codecs vidéo MPEG-4 AVC/H.264. Consulté le 22 avril 2016 .
  12. 6e comparaison des codecs vidéo MPEG-4 AVC/H.264. Consulté le 22 avril 2016 .
  13. 7e comparaison des codecs vidéo MPEG-4 AVC/H.264. Consulté le 22 avril 2016 .
  14. 8e comparaison des codecs vidéo MPEG-4 AVC/H.264. Consulté le 22 avril 2016 .
  15. Comparaison des codecs HEVC - 2015 ! Consulté le 22 avril 2016 .
  16. MPEG LA (anglais) - site officiel ; Au 28 août 2009
  17. Conditions de licence pour le codec vidéo H.264/AVC publiées – article sur heise online , du 18 novembre 2003.
  18. ^ Média (anglais) - Page sur MPEG LA ; État : 5 février 2010.
  19. La licence AVC de MPEG LA ne facturera pas de redevances pour la vidéo Internet gratuite pour les utilisateurs finaux pendant toute la durée de la licence - article Business Wire , 26 août 2010.
  20. MPEG LA : Aucun coût de licence permanent pour le streaming Internet gratuit de MPEG-4 AVC (H.264) - article sur heise online , du 26 août 2010.
  21. https://www.mpegla.com/wp-content/uploads/avc-att1.pdf
  22. Ajustement pour la haute définition .