Quantité de données

Un article de Wikipédia, l'encyclopédie libre
(Redirigé depuis Volume de données )
Aller à la navigation Aller à la recherche

L'ensemble de données est une mesure de la quantité de données . L'unité de base des données est le bit .

Les données sont utilisées pour stocker et transmettre des informations , il convient de noter que le contenu informatif d' un message n'est pas égal à la quantité de données, même si le mot information est souvent utilisé dans ce contexte lorsqu'il s'agit de données. Contrairement à la quantité de données, le contenu de l'information ne peut pas être lu directement et il existe différentes approches pour le déterminer. La quantité de données stockées dans un fichier est appelée la taille du fichier . Dans le cas des supports de données , la quantité de données est utilisée pour indiquer le volume de données libre et maximum stockable ( capacité de stockage) utilisé.

La quantité de données nécessaire pour stocker une information donnée dépend de la complexité de l'information d'une part et de la méthode de codage d'autre part . Pour de grandes quantités de données , il existe des méthodes de compression qui réduisent la quantité de données mais stockent les mêmes informations. Une méthode de codage appropriée est utilisée pour augmenter le contenu informatif des caractères individuels ou pour réduire l' entropie du message (voir aussi codage entropique ).

Les données ne doivent pas nécessairement être explicitement codées sous forme de bits ou stockées dans un ordinateur. Les données sont partout dans la nature et dans notre monde quotidien. Les plus grandes quantités de données se trouvent dans notre cerveau , dans nos bibliothèques , livres , films , images et ordinateurs , dans le matériel génétique et les structures moléculaires de la nature vivante, dans les lois de la nature inanimée et vivante , dans la structure de l' univers entier. et le maximum d'informations concevables dans l'histoire de tout l'espace.

unité de base

La plus petite unité de données pouvant être représentée est le bit . Bit est l'abréviation de chiffre binaire . Une mémoire de données d'une capacité de stockage d'un bit n'a qu'un seul emplacement mémoire avec 2 possibilités : par exemple "occupé ou vide", "on ou off", "notch ou no notch". La quantité de données contenues dans une seule décision oui/non est donc exactement de 1 bit. Pour quatre valeurs possibles (par exemple rouge, jaune, vert, bleu), deux bits sont nécessaires, qui peuvent être combinés de quatre manières différentes (00, 01, 10, 11).

Formellement, cela signifie que la quantité de données requise (nombre de bits) est le résultat arrondi du logarithme de base 2 du nombre de valeurs possibles.

ou inversement : Le nombre de valeurs possibles est de 2 à la puissance du nombre de bits :

Ainsi par exemple

  • 0 bit Z = 1 si D = 0 puisque 2 0 = 1
  • 1 bit Z = 2 si D = 1 puisque 2 1 = 2
  • 2 bits Z = 4 si D = 2 puisque 2 2 = 4
  • 7 bits Z = 128 si D = 7 puisque 2 7 = 128

La sommation des bits de 0 à 7 (correspondant à 1 octet) 2 8 -1 peut donc couvrir une plage de valeurs décimales de 0 à 255.

  • 8 bits Z = 256 si D = 8 puisque 2 8 = 256

...

  • 63 bits Z = 9223372036854775808 si D = 63 puisque 2 63 = 9223372036854775808

Pour D = 1 KiB le nombre Z de valeurs possibles est très grand : 2 1024 ≈ 1,8 · 10 308 .

Plus d'unités

Outre le bit, l'unité de données la plus courante est l' octet (ou octet ), composé de 8 bits. Il y a des raisons historiques à cela : de nombreux appareils ont été conçus de manière à pouvoir traiter 8 bits en même temps (aujourd'hui, il s'agit principalement de 32 ou 64 bits - voir mot de données ), de sorte que l' unité de traitement considérait 8 bits comme un nombre . . De plus, la plupart des jeux de caractères , en particulier ISO 8859 , représentent les lettres sur un octet.

Dans l'histoire des ordinateurs , il y a aussi eu des systèmes qui combinaient seulement 5 bits en un octet, et il y avait aussi des systèmes qui combinaient 13 bits en un octet.

Pour désigner de plus grandes quantités de données, les symboles d'unité bit pour bit et B pour octet sont pourvus des préfixes habituels pour les unités de mesure , c'est-à- dire kilo (kbit/ko), méga (Mbit/Mo), giga (Gbit/Go), tera (Tbit/TB) et ainsi de suite. Il existe des préfixes binaires spéciaux pour les quantités de données basées sur des puissances de deux, telles que celles trouvées dans les mémoires à semi -conducteurs .

Exemples d'ensembles de données

bit

  • 1 bit – (2 1 = 2 états possibles), par ex. B. 0 ou 1 ou faux ou vrai
  • 5 bits - (2 5 = 32 états possibles), par ex. Par exemple, le jeu de lettres majuscules de l' alphabet latin peut être mappé avec lui
  • 7 bits - (2 7 = 128 états possibles), par ex. B. un caractère du jeu de caractères ASCII

Quartet ou demi-octet

  • 1 quartet – (2 4 = 16 états possibles), par ex. par exemple 015
  • 2 quartet – (2 8 = 256 états possibles), donc 1 octet

octet ou octet (8 bits)

  • 1 octet - (2 8 = 256 états possibles), par ex. B. un caractère du codage ANSI ( alphabet latin étendu )
  • 2 octets – (2 16 = 65 536 états possibles)
  • 4 octets - (2 32 = environ 4,3 milliards d'états possibles), par ex. B. un caractère au format UTF-32

Préfixes pertinents

Les préfixes des unités de mesure grecques et italiennes précèdent généralement les bits et les octets . Dans ce qui suit, les préfixes SI (k, M, T, G, ...) sont utilisés dans leur sens décimal. Dans la pratique informatique, les préfixes SI sont généralement utilisés comme préfixes binaires (1 Ko = 1024 octets, ...) pour les volumes de données. L'acceptation des préfixes binaires CEI fournis à cet effet (Ki, Mi, Gi, ...) est faible dans l'industrie informatique, et la conversion de 1024 octets est généralement implicite même avec les noms normaux.

Kilo et Kibi

Kilooctet (ko) (10 3  octets = 1000 octets),
Kibioctet (KiB) (2 10  octets = 1024 octets), mais généralement KB est écrit pour le distinguer de ko car il est plus courant.

Méga et Mebi

Mégaoctet (Mo) (10 6  octets = 1 000 000 octets),
Mebibyte (MiB) (2 20  octets = 1 048 576 octets)

giga et gibi

Gigaoctet (Go) (10 9  octets = 1 000 000 000 octets),
Gibioctet (Gio) (2 30 octets = 1 073 741 824 octets)

  • environ 4,38 Gio soit environ 4,7 Go : un DVD±R
  • environ 5 Go : un long métrage compressé en qualité DVD (avec compression MPEG-2 )

Téra et Tébi

Téraoctet (To) (10 12  octets = 1000 Go),
Tebibyte (TiB) (2 40  octets = 1 099 511 627 776 octets)

  • Une base de données couvrant 10 milliards de personnes avec des enregistrements de 1 Ko chacun nécessite 10 To de stockage.

Peta et Pebi

Pétaoctet (PB) (10 15  octets = 1 000 000 Go),
Pébioctet (PiB) (2 50  octets = 1 125 899 906 842 624 octets)

  • Fin 2002, les capacités de stockage des plus grands centres de données du monde variaient de 1 Po à 10 Po
  • En 1986, la capacité mondiale effective d'échanger des informations (comprimées de manière optimale) via des réseaux de télécommunications (bidirectionnels) était de 281 pétaoctets [2] .

Exa et Exbi

Exabyte (EB) (10 18  octets),
Exbibyte (EiB) (2 60  octets = 1 152 921 504 606 846 976 octets)

  • Le total de tous les ouvrages imprimés est estimé à 0,2 EB
  • La capacité effective mondiale d'échanger des informations via des réseaux de télécommunications (bidirectionnels) était de 65 exaoctets (compressés de manière optimale) en 2007, et la capacité technologique mondiale de stockage d'informations était estimée à 295 exaoctets (compressés de manière optimale) en 2007. [2]

Zetta et Zébi

Zettabyte (ZB) (10 21  octets),
Zebibyte (ZiB) (2 70  octets = 1 180 591 620 717 411 303 424 octets)

Yotta et Yobi

Yottabyte (YB) (10 24  octets),
Yobibyte (YiB) (2 80  octets = 1 208 925 819 614 629 174 706 176 octets)

  • 1 YB correspond à peu près à autant d'octets qu'il y a d'atomes dans 1,67 gramme d' hydrogène , ce qui équivaut à 0,83 mole de H 2 .

Voir également

Sources

  1. http://history.nasa.gov/alsj/a11/a11.1201-pa.html
  2. ^ un bc "La capacité technologique du monde à stocker, communiquer et calculer des informations" , Martin Hilbert et Priscila López (2011), Science , 332 (6025), 60–65 ; un accès gratuit à l'article est disponible depuis cette page : martinhilbert.net/WorldInfoCapacity.html
  3. Animation vidéo sur la capacité technologique mondiale à stocker, communiquer et calculer des informations de 1986 à 2010

liens web