Archives Internet

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

L' Internet Archive à San Francisco est un projet à but non lucratif fondé par Brewster Kahle en 1996 et a le statut de bibliothèque officielle depuis 2007. Il a été lancé comme une archive Web pure , où vous pouvez afficher des sites Web archivés à l'aide de la soi-disant Wayback Machine . À partir de 1999, d'autres archives ont été ajoutées, de sorte qu'il s'agit désormais d'une bibliothèque numérique comprenant d'importantes collections de textes et de livres, de fichiers audio, de vidéos, d'images et de logiciels. Internet Archive dispose d'un archivage à long termedonnées numériques sous une forme librement accessible et attache une grande importance aux options d'accès pour les utilisateurs aveugles ou autrement restreints.

Outre sa fonction d'archive, Internet Archive se considère également comme un militant pour un Internet ouvert et libre et pour la préservation et la diffusion des œuvres du domaine public . [1]

origine et histoire

Brewster Kahle , fondateur d' Alexa Internet et d'Internet Archive (2015)
Serveur miroir avec les données de San Francisco dans la Bibliotheca Alexandrina égyptienne

Brewster Kahle a fondé Internet Archive en mai 1996 en tant qu'organisation à but non lucratif 501 ( c)(3) . Il a reçu une grande quantité de données d' Alexa Internet dès le début . Dans le cadre de l'archivage Web , il stocke ce que l'on appelle des souvenirs , c'est-à-dire. H Instantanés de sites Web et contributions Usenet . [2]

À partir de 1999, l'objectif a été élargi pour inclure une bibliothèque complète et librement accessible grâce à l'inclusion des archives Prelinger et plus tard d'autres collections. Début 2021, Internet Archive comprend une collection de plus de 28 millions de livres et de textes, six millions de vidéos et de films, 14 millions de fichiers audio, 580 000 programmes informatiques et 3,5 millions de fichiers images. L' archive Web Wayback Machine contient désormais plus de 475 milliards de pages Web. [2]

Pour 2014, le projet a signalé que les données étaient stockées sur 20 000 disques durs dans quatre centres de données . Un serveur miroir des données de San Francisco est situé entre autres dans la Bibliotheca Alexandrina égyptienne . Début 2021, la collection atteignait plus de 45 pétaoctets . [3]

Les archives sont officiellement reconnues comme bibliothèque par l'État américain de Californie depuis mai 2007. [4]

Depuis l' élection du 8 novembre 2016 , Internet Archive envisage de déposer une copie mise à jour en permanence au Canada , selon son site Internet . [5]

prestations de service

audios

Les archives audio contiennent plus de trois millions d'enregistrements sonores depuis 2017 . Celles-ci vont des émissions de radio et des reportages radio aux livres audio , aux lectures de poésie , aux enregistrements de concerts en direct et à la musique téléchargée par les utilisateurs. L'archive peut également être utilisée pour publier des podcasts . [6]

des photos

Plus d'1¼ million de fichiers d'images sont déjà disponibles dans les archives d'images. Ce sont des images d' œuvres d' art , comme une collection d'images du Metropolitan Museum of Art avec plus de 100 000 entrées, des images de cartes historiques, des images astronomiques de la NASA , des pochettes de disques et aussi des images librement disponibles auprès de particuliers .

Logiciel

La Bibliothèque du Congrès a accordé six exceptions au Digital Millennium Copyright Act en décembre 2006. [7] L'Internet Archive peut ainsi stocker des logiciels ou des jeux informatiques qui sont devenus des abandonwares [8] avec l'intention de les conserver lorsque le matériel, les formats ou la technologie d'origine sont obsolètes. En 2013, Internet Archive a commencé à proposer des jeux classiques sous forme de streaming de navigateur Web jouable via l'émulation MESS [9] , par ex. B. le jeu vidéo Atari 2600 ET l'extra-terrestre. [10] À partir du 23 décembre 2014, des milliers de jeux informatiques DOS classiques seront présentés dans le navigateur à des fins d'enseignement et de recherche [11] en utilisant l' émulation DOSBox . [12] [13] [14] [15]

Archives Internet à San Francisco (1996–2009)
Nouveau siège d'Internet Archive depuis novembre 2009 dans une ancienne église de la Science Chrétienne
Archives Internet à la Bibliotheca Alexandrina . Derrière les vitres se trouvent les racks avec les ordinateurs d'archives.
Vidéo d'une démonstration de la technique de numérisation d'Internet Archive par Brewster Kahle, 29 mars 2013

Paroles

Le Million Book Project numérise et met à disposition pour téléchargement , via Internet Archive, les livres qui sont entrés dans le domaine public suite à l'expiration du droit d'auteur (loi américaine sur le droit d'auteur ) ou pour d'autres raisons . Les copies numériques font partie de l ' Open Library . Entre-temps, plus de dix millions de livres et de textes ont été archivés.

Plusieurs centres de numérisation (douze au total en 2009) sont maintenus, par exemple à Richmond . La numérisation est par commande, dix cents américains sont facturés par page (à partir de 2009). Les clients, principalement des bibliothèques, reçoivent la copie numérique , un fichier texte généré par OCR , une adresse Internet persistante et la possibilité de stocker la copie numérique sur les serveurs de l'association. [16] Il existe également des accords de coopération avec des bibliothèques autonumérisées pour des services individuels tels que l'OCR et l'hébergement redondant.

Livres

Afin d'améliorer la crédibilité des citations référencées de livres dans Wikipédia , une coopération existe entre Wikipédia et Internet Archive depuis 2019 . Un début a été fait pour ajouter des scans numériques des livres cités aux références dans les articles de Wikipédia. [17] Le passage en question est présenté sur deux pages chacun. Un exemple de ceci est la citation numéro 163 [18] (en date du 26 avril 2022) dans l'article en anglais sur Martin Luther King .

Ouvrages en libre accès

En septembre 2020, Internet Archive a présenté une initiative d'archivage et de mise à disposition de publications en libre accès sous le nom "Internet Archive Scholar" [19] .

films

Dans la section "Films", Internet Archive propose plus de 85 000 films (en février 2022), dont de nombreux vieux classiques. Bandes-annonces et courts métrages font également partie de l'offre, ainsi que divers films de propagande de l'époque de la Seconde Guerre mondiale . [20]

Parmi les plus de 3 500 films muets, on compte 437 films dans la catégorie "Silent Hall of Fame" avec des œuvres de jeunesse de Charlie Chaplin ou Buster Keaton , mais aussi de réalisateurs allemands comme Robert Wiene (représenté par Das Cabinet des Dr Caligari à partir de 1920, parmi les autres). La gamme de longs métrages est complétée par des documentaires anciens, par ex. B. montrant l'arrivée en 1909 d'immigrants européens à Ellis Island (par Billy Bitzer ). [21] Les classiques du genre bien connus de Georges Méliès sont bien sûr représentés dans la collection répertoriée séparément , comme le film muet de 16 minutes Journey to the Moonà partir de 1902. [22]

En plus des films expérimentaux de réalisateurs bien connus comme Ingmar Bergman (par exemple Persona , 1966), il y a aussi des classiques du grand maître Alfred Hitchcock . est représenté avec In the Shadow of Doubt (1946). L' Espagnol Segundo de Chomón a aussi sa propre rubrique, tout comme le cinéaste expérimental allemand Lutz Mommartz et l'Autrichien Johann Schwarzer . Différents genres sont servis, il y a à la fois historique et une section avec près de 300 comédies cinématographiques [23] et plus de 450 films de science-fiction et d'horreur, tel que B. Nosferatu - Une symphonie d'horreur de Friedrich Wilhelm Murnau (1922). [24] En plus de rares films de grindhouse et d'exploitation [25] comme Sex Madness (1938) ou Begotten ( E. Elias Merhige , 1989) et des œuvres cyberpunk comme Tetsuo : The Iron Man du Japonais Shin'ya Tsukamoto .

Le film noir est représenté avec 700 titres à la demande, dont Temptation Street de Fritz Lang (1946) et The Third Man de Carol Reed (1949). [26]

Il existe également plus de 7 000 films et vidéos sur le thème du sport [27] , des films d'animation et des courts métrages [28] , ainsi que plus de 16 000 contenus sur le thème de l'art et de la musique [29] et plus de 100 000 articles visuels sur la religion et la spiritualité . [30]

jeux vidéos

En 2013, Internet Archive a commencé à proposer des jeux classiques sous forme de streaming de navigateur Web jouable via l'émulation MESS . [9]

des sites

Logo WaybackMachine

La Wayback Machine ("Take Me Back") est un service en ligne qui vous permet de récupérer différentes versions de pages Web enregistrées. Les pages à enregistrer sont sélectionnées via le service Internet Alexa . Toutes les URL qui y sont stockées sont appelées et archivées régulièrement. Vous pouvez également enregistrer manuellement une ressource Internet non enregistrée en recherchant la page, puis en confirmant l'enregistrement (le contenu du fichier, par exemple les images JPG , est enregistré sans demande préalable). Le volume total était d'environ 150 milliards de pages en novembre 2009 et est passé à plus de 625 milliards de pages en mars 2020.

Un autre service d'archivage Web pour l'archivage Web individuel a été mis à disposition en 2006 avec Archive-It . Les institutions et les particuliers ont la possibilité de créer des sauvegardes numériques de leurs collections et de déterminer eux-mêmes la diffusion des données. Archive-It compte plus de 400 partenaires de 16 pays à travers le monde, composés principalement d'universités, d'archives d'État, de musées et de bibliothèques d'art, de bibliothèques publiques et d'autres institutions publiques et d' ONG . Archive-It offre aux partenaires participants une recherche en texte intégral sur leur contenu, mais aussi la possibilité d'exporter des ensembles de données structurées enrichies de métadonnées pour les chercheurs. [31]

L'inclusion des archives Prelinger [32] en 1999 a été la première extension des archives Internet au-delà de l'archivage Web. Il contient aujourd'hui un bon trois millions de vidéos et de films qui sont sous licences libres ou domaine public. Une archive des programmes de télévision est également en cours d'élaboration ici .

financement

Internet Archive est financé par des dons et des subventions de diverses fondations, instituts et associations dans les domaines de l'éducation, de la recherche, de la science, etc. En avril 2019, Internet Archive a indiqué les donateurs suivants : Andrew W. Mellon Foundation , Council on Library and Ressources d'information , Fonds des Nations Unies pour la démocratie Commission fédérale des communications Programme de service universel pour les écoles et les bibliothèques (E-Rate) Institut des services de musées et de bibliothèques (IMLS) Fondation Knight Fondation Laura et John Arnold National Endowment for the Humanities ( Office of Digital Humanities), Fondation nationale des sciences , Fondation Peter et Carmen Lucia Buck , Fondation de Philadelphie , Fondation Rita Allen . [2]

Voir également

Littérature

  • Alexis Rossi : Diversité fédérale – Connectivité mondiale : Stratégies des États pour le patrimoine culturel dans le monde numérique . Éditeur : Hamburg University Press, maison d'édition de la Bibliothèque d'État et universitaire de Hambourg Carl von Ossietzky (=  patrimoine culturel dans le monde numérique ). 1ère édition. Hambourg 2016, ISBN 978-3-943423-34-1 , Internet Archive, p. 224-237 ( oapen.org ).

liens web

Commons : Internet Archive  - Collection d'images, de vidéos et de fichiers audio

les détails

  1. Internet Archive, Prelinger Archives et Project Gutenberg Literary Archive Foundation. Dans : harvard.edu. Consulté le 27 février 2021 (anglais).
  2. a b c À propos des archives Internet. Dans : archive.org. Consulté le 10 février 2021 (anglais).
  3. Pétabox. Dans : archive.org. Consulté le 27 février 2021 (anglais).
  4. Internet Archive officiellement une bibliothèque. Forum des archives Internet. Dans : archive.org. 2007 juin 25, consulté 2021 (anglais).
  5. Brewster Kahle : Aidez-nous à garder les archives gratuites, accessibles et privées. Blogs d'archives Internet. Dans : archive.org. 29 novembre 2016, récupéré le 21 avril 2017 (anglais).
  6. Comment héberger un podcast MP3 sur Archive.org . Dans : TurboFuture . ( turbofuture.com [consulté le 4 août 2017]).
  7. Internet Archive obtient un sursis de droit d'auteur. Dans : theregister.co.uk. The Register, 1er décembre 2006, consulté le 23 mars 2021 .
  8. Ross Miller : Le Bureau américain du droit d'auteur accorde les droits d'abandonware Dans : joystiq.com . Consulté le 7 février 2013.
  9. a b Tilman Baumgärtel : Timothy Leary, le développeur de jeux . Dans : zeit.de . temps en ligne . 14 novembre 2013. Récupéré le 14 novembre 2013 : "Comment obtenir des jeux informatiques historiques ? L'Internet Archive diffuse des dizaines de classiques, à New York, les jeux de Timothy Leary sont traités pour la recherche - parce que l'Internet Archive "diffuse" les jeux, c'est-à-dire que vous ne les chargez pas sur votre propre ordinateur, vous ne violez pas le droit d'auteur si vous utilise les programmes.
  10. Adi Robertson : The Internet Archive place les jeux Atari et les logiciels obsolètes directement dans votre navigateur ( en anglais ) In : The Verge . 25 octobre 2013. Consulté le 29 octobre 2013.
  11. Conditions d'utilisation, politique de confidentialité et politique de droit d'auteur d' Internet Archive archive.org . 31 décembre 2014. Récupéré le 8 janvier 2015 : "L'accès aux collections des archives vous est fourni gratuitement et est accordé à des fins d'érudition et de recherche uniquement."
  12. Abby Ohlheiser : Vous pouvez désormais jouer à près de 2 400 jeux vidéo MS-DOS dans votre navigateur ( en anglais ) In : The Washington Post . 5 janvier 2015. Consulté le 8 janvier 2015.
  13. Chaque nouvelle botte est un miracle par Jason Scott (23 décembre 2014)
  14. collection:softwarelibrary_msdos sur Internet Archive (29 décembre 2014)
  15. Kris Graft : La sauvegarde de l'historique des jeux vidéo commence dès maintenant . Gamasutra. 5 mars 2015. Récupéré le 5 mars 2015.
  16. Christoph Drösser : L'Alexandrie numérique. Dans : Die Zeit 2008, n° 4. 17 janvier 2008, récupéré le 23 mars 2021 .
  17. Süddeutsche Zeitung : preuves photographiques. Consulté le 14 novembre 2019 .
  18. Drew Hansen, Le rêve : Martin Luther King Jr. et le discours qui a inspiré une nation . HarperCollins, 2005, ISBN 978-0-06-008477-6p98 .
  19. Internet Archive : Comment Internet Archive assure un accès permanent aux articles de revues en libre accès. 15 septembre 2020, récupéré le 24 octobre 2020 (anglais).
  20. Movies Internet Archive, consulté le 21 février 2022
  21. Silent Hall of Fame Internet Archive, consulté le 21 février 2022
  22. The Georges Méliès Collection Internet Archive, consulté le 21 février 2022
  23. Comedy Films Internet Archive, consulté le 21 février 2022
  24. Sci-Fi / Horror Internet Archive, consulté le 21 février 2022
  25. Picfixer Feature Film Collection Internet Archive consulté le 21 février 2022
  26. Film Noir Internet Archive, consulté le 21 février 2022
  27. Sports Videos Internet Archive, consulté le 21 février 2022
  28. Animation & Cartoons Internet Archive consulté le 21 février 2022
  29. Arts & Music Internet Archive, consulté le 21 février 2022
  30. Spirituality & Religion Internet Archive, consulté le 21 février 2022
  31. À propos d'Archive-It. Dans : archive-it.org. Consulté le 23 mars 2021 (anglais).
  32. Tim Brookes : Archives Prelinger : Des milliers de vieux films à regarder, remixer et utiliser dans vos propres projets (Trucs à regarder). Dans : makeuseof.com. 30 juillet 2012, récupéré le 29 octobre 2016 (anglais).

Coordonnées : 37° 46′ 56.3″  N , 122° 28′ 17.6″  O