Internetové archivy

z Wikipedie, otevřené encyklopedie
Přejít na navigaci Přejít na hledání

Internetový archiv v San Franciscu je neziskový projekt založený Brewsterem Kahlem v roce 1996 a od roku 2007 má status oficiální knihovny. Začalo to jako čistě webový archiv , kde si můžete prohlížet archivované weby pomocí tzv. Wayback Machine . Od roku 1999 byly přidány další archivy, takže je nyní digitální knihovnou obsahující důležité sbírky textů a knih, zvukových souborů, videí, obrázků a softwaru. Internetový archiv má dlouhodobou archivacidigitálních dat ve volně přístupné podobě a přikládá velký význam možnostem přístupu pro nevidomé nebo jinak omezené uživatele.

Internetový archiv se kromě své funkce archivu chápe také jako aktivista za otevřený a svobodný internet a za uchovávání a šíření děl ve veřejné doméně . [1]

původ a historie

Brewster Kahle , zakladatel Alexa Internet and the Internet Archive (2015)
Zrcadlový server s daty ze San Francisca v egyptské Bibliotheca Alexandrina

Brewster Kahle založil Internet Archive v květnu 1996 jako 501 ( c)(3) neziskovou organizaci . Hned na začátku obdržela velkou dodávku dat od Alexa Internet . V rámci archivace webu ukládá tzv. upomínky , tzn. H. Snímky webových stránek a příspěvků Usenetu . [2]

Od roku 1999 byl cíl rozšířen o ucelenou, volně přístupnou knihovnu začleněním Prelingerova archivu a později dalších fondů. Na začátku roku 2021 obsahuje internetový archiv sbírku více než 28 milionů knih a textů, šest milionů videí a filmů, 14 milionů zvukových souborů, 580 000 počítačových programů a 3,5 milionu obrazových souborů. Webový archiv Wayback Machine nyní obsahuje více než 475 miliard webových stránek. [2]

Za rok 2014 projekt uvedl, že data byla uložena na 20 000 pevných discích ve čtyřech datových centrech . Zrcadlový server dat ze San Francisca je umístěn mimo jiné v egyptské Bibliotheca Alexandrina . Na začátku roku 2021 dosáhla sbírka velikosti přes 45 petabajtů . [3]

Archiv je oficiálně uznán jako knihovna americkým státem Kalifornie od května 2007. [4]

Od voleb 8. listopadu 2016 plánuje Internet Archive uložit trvale aktualizovanou kopii v Kanadě , uvádí na svých webových stránkách . [5]

služby

audia

Audioarchiv obsahuje od roku 2017 přes tři miliony zvukových nahrávek . Ty sahají od rozhlasových pořadů a rozhlasových funkcí až po zvukové knihy , čtení poezie , nahrávky živých koncertů a hudbu nahranou uživateli. Archiv lze také použít k publikování podcastů . [6]

obrázky

V archivu obrázků je již k dispozici více než 1¼ milionu obrazových souborů. Jedná se o snímky uměleckých děl , jako je sbírka snímků z Metropolitního muzea umění s více než 100 000 záznamy, snímky historických map, astronomické snímky z NASA , obaly desek a také volně dostupné snímky od soukromých osob .

software

Knihovna Kongresu udělila v prosinci 2006 šest výjimek ze zákona Digital Millennium Copyright Act . [7] Internetový archiv tak může uchovávat počítačový software nebo hry , které se staly abandonwarem [8] , se záměrem jejich uchování, když je původní hardware, formáty nebo technologie zastaralé. V roce 2013 začal Internet Archive nabízet klasické hry jako hratelné streamování webového prohlížeče přes emulaci MESS [9] , kupř. B. videohra Atari 2600 ET the Extra-Terrestrial. [10] Od 23. prosince 2014 budou v prohlížeči prezentovány tisíce klasických DOSových počítačových her pro výukové a výzkumné účely [11] pomocí emulace DOSBox . [12] [13] [14] [15]

Internetové archivy v San Franciscu (1996–2009)
Nové sídlo internetového archivu od listopadu 2009 v bývalém kostele Christian Science
Internetové archivy v Bibliotheca Alexandrina . Za skleněnými tabulemi jsou regály s archivními počítači.
Video ukázky techniky digitalizace internetového archivu Brewster Kahle, 29. března 2013

text

The Million Book Project digitalizuje a zpřístupňuje ke stažení prostřednictvím internetového archivu knihy, které se staly veřejnou doménou vypršením platnosti autorských práv (americký zákon o autorských právech ) nebo z jiných důvodů . Digitální kopie jsou součástí Otevřené knihovny . Mezitím bylo archivováno více než deset milionů knih a textů.

Je udržováno několik skenovacích center (v roce 2009 celkem dvanáct), například v Richmondu . Skenování probíhá na objednávku, za stránku se účtuje deset amerických centů (stav 2009). Klienti, většinou knihovny, obdrží digitální kopii , textový soubor vygenerovaný OCR , trvalou internetovou adresu a možnost uložení digitální kopie na serverech sdružení. [16] Existují také smlouvy o spolupráci se samodigitalizujícími knihovnami pro jednotlivé služby, jako je OCR a redundantní hosting.

knihy

Za účelem zvýšení důvěryhodnosti citací z knih na Wikipedii existuje od roku 2019 spolupráce mezi Wikipedií a Internetovým archivem . Bylo zahájeno přidávání digitálních skenů citovaných knih k odkazům v článcích Wikipedie. [17] Dotyčná pasáž je uvedena na dvou stranách. Příkladem toho je citace číslo 163 [18] (k 26. dubnu 2022) v anglicky psaném článku o Martinu Lutheru Kingovi .

Publikace s otevřeným přístupem

V září 2020 představil Internet Archive iniciativu pro archivaci a zpřístupnění publikací s otevřeným přístupem pod názvem „Internet Archive Scholar“ [19] .

filmy

V sekci „Filmy“ nabízí internetový archiv více než 85 000 filmů (stav k únoru 2022), včetně mnoha starých klasik. Součástí nabídky jsou i upoutávky a krátké filmy, stejně jako různé propagandistické filmy z doby druhé světové války . [20]

Více než 3500 němých filmů zahrnuje 437 filmů v kategorii „Tichá síň slávy“ s ranými díly Charlieho Chaplina nebo Bustera Keatona , ale také německých režisérů, jako je Robert Wiene (zastoupený Das Cabinet des Dr. Caligari z roku 1920, mj. ostatní). Paletu hraných filmů doplňují rané dokumenty, kupř. B. ukazující příchod evropských imigrantů na Ellis Island v roce 1909 ( Billy Bitzer ). [21] Známé žánrové klasiky Georgese Mélièse jsou samozřejmě zastoupeny v samostatně uvedené sbírce , jako je 16minutový němý film Cesta na Měsícz roku 1902. [22]

Kromě experimentálních filmů známých režisérů, jako je Ingmar Bergman (např. Persona , 1966), nechybí ani klasiky velmistra Alfreda Hitchcocka . je zastoupena s In the Shadow of Doubt (1946). Španěl Segundo de Chomón má také svou vlastní rubriku, stejně jako německý experimentální filmař Lutz Mommartz a Rakušan Johann Schwarzer . Podávají se různé žánry, je zde jak historická, tak sekce s téměř 300 filmovými komediemi [23] a více než 450 sci-fi a hororovými filmy, jako B. Nosferatu - Symfonie hrůzy Friedricha Wilhelma Murnaua ( 1922). [24] Kromě vzácných grindhouseových a exploitation filmů [25] jako Sex Madness (1938) nebo Begotten ( E. Elias Merhige , 1989) a kyberpunkových děl jako Tetsuo: The Iron Man Japonce Shin'ya Tsukamota .

Film noir je zastoupen 700 položkami na vyžádání, včetně Temptation Street od Fritze Langa (1946) a The Third Man od Carol Reed (1949). [26]

Existuje také více než 7 000 filmů a videí se sportovní tematikou [27] , animovaných filmů a krátkých filmů [28] , stejně jako více než 16 000 obsahu s tématikou umění a hudby [29] a více než 100 000 vizuálních článků o náboženství a spiritualitě . [30]

videohry

V roce 2013 Internet Archive začal nabízet klasické hry jako hratelné streamování webového prohlížeče prostřednictvím emulace MESS . [9]

stránky

Logo Wayback Machine

The Wayback Machine („Take Me Back“) je online služba , která vám umožňuje načíst různé verze uložených webových stránek. Stránky k uložení se vybírají prostřednictvím internetové služby Alexa . Všechny zde uložené adresy URL se pravidelně vyvolávají a archivují. Neuložený internetový zdroj můžete také nahrát ručně vyhledáním stránky a potvrzením záznamu (obsah souboru, např. obrázky JPG , se uloží bez předchozí výzvy). Celkový objem byl v listopadu 2009 asi 150 miliard stránek a do března 2020 vzrostl na více než 625 miliard stránek.

Další služba webového archivu pro individuální archivaci webu byla zpřístupněna v roce 2006 pomocí Archive-It . Instituce a jednotlivci mají možnost vytvářet digitální zálohy svých sbírek a sami určovat vydání dat. Archive-It má více než 400 partnerů z 16 zemí celého světa, sestávajících především z univerzit, státních archivů, muzeí a uměleckých knihoven, veřejných knihoven a dalších veřejných institucí a nevládních organizací . Archive-It nabízí zúčastněným partnerům fulltextové vyhledávání jejich obsahu, ale také možnost exportovat strukturované datové sady obohacené o metadata pro výzkumníky. [31]

Zahrnutí Prelinger Archives [32] v roce 1999 bylo prvním rozšířením internetového archivu nad rámec webové archivace. Dnes obsahuje dobré tři miliony videí a filmů , které jsou pod svobodnými licencemi nebo jsou veřejnou doménou. Pracuje se zde i na archivu televizních pořadů .

financování

Internetový archiv je financován z darů a grantů různých nadací, institutů a sdružení v oblasti vzdělávání, výzkumu, vědy atd. V dubnu 2019 Internetový archiv uvedl tyto dárce: Andrew W. Mellon Foundation , Council on Library and Informační zdroje , Demokratický fond Organizace spojených národů Federální komise pro komunikaci Program univerzální služby pro školy a knihovny (E-Rate) Institut muzejních a knihovnických služeb (IMLS) Knight Foundation Nadace Laury a Johna Arnolda National Endowment for the Humanities ( Office of Digital Humanities), National Science Foundation , The Peter and Carmen Lucia Buck Foundation , The Philadelphia Foundation , Rita Allen Foundation . [2]

Viz také

literatura

  • Alexis Rossi: Federální rozmanitost – Globální konektivita: Státní strategie pro kulturní dědictví v digitálním světě . Vydavatel: Hamburg University Press, nakladatelství Hamburkské státní a univerzitní knihovny Carl von Ossietzky (=  kulturní dědictví v digitálním světě ). 1. vydání. Hamburg 2016, ISBN 978-3-943423-34-1 , Internetový archiv, s. 224–237 ( oapen.org ).

webové odkazy

Commons : Internet Archive  - Sbírka obrázků, videí a zvukových souborů

položky

  1. Internetový archiv, Prelingerovy archivy a Nadace literárního archivu projektu Gutenberg. Na: harvard.edu. Staženo 27. února 2021 (anglicky).
  2. a b c O internetovém archivu. In: archive.org. Staženo 10. února 2021 (anglicky).
  3. Petabox. In: archive.org. Staženo 27. února 2021 (anglicky).
  4. Internetový archiv oficiálně knihovna. Fórum internetového archivu. In: archive.org. 2007 25. června, přístup 2021 (anglicky).
  5. Brewster Kahle: Pomozte nám zachovat archiv zdarma, přístupný a pro čtenáře soukromý. Internetové archivní blogy. In: archive.org. 29. listopadu 2016, vyhledáno 21. dubna 2017 (anglicky).
  6. Jak hostovat podcast MP3 na Archive.org . In: TurboFuture . ( turbofuture.com [přístup 4. srpna 2017]).
  7. Internetový archiv získává odklad autorských práv. Na: theregister.co.uk. Registr, 1. prosince 2006, přístupný 23. března 2021 .
  8. Ross Miller: US Copyright Office uděluje práva na abandonware In : joystiq.com . Staženo 7. února 2013.
  9. a b Tilman Baumgärtel: Timothy Leary, vývojář her . In : zeit.de. čas online . 14. listopadu 2013. Získáno 14. listopadu 2013: „Jak získat historické počítačové hry? Internetový archiv streamuje desítky klasik, v New Yorku se pro výzkum zpracovávají hry Timothyho Learyho – protože Internetový archiv hry „streamuje“, tj. nenahrajete si je do vlastního počítače, neporušíte autorská práva, pokud používá programy."
  10. Adi Robertson: The Internet Archive umístí hry Atari a zastaralý software přímo do vašeho prohlížeče ( anglicky ) In: The Verge . 25. října 2013. Staženo 29. října 2013.
  11. Podmínky použití, Zásady ochrany osobních údajů a Zásady autorských práv archive.org . 31. prosince 2014. Získáno 8. ledna 2015: "Přístup do sbírek Archivu je poskytován zdarma a je poskytován pouze pro stipendijní a výzkumné účely."
  12. Abby Ohlheiser: Nyní můžete ve svém prohlížeči hrát téměř 2 400 videoher pro systém MS-DOS ( v angličtině ) In: The Washington Post . 5. ledna 2015. Staženo 8. ledna 2015.
  13. Každá nová bota je zázrak od Jasona Scotta (23. prosince 2014)
  14. collection:softwarelibrary_msdos v internetovém archivu (29. prosince 2014)
  15. Kris Graft: Ukládání historie videoher začíná právě teď . Gamasutra. 5. března 2015. Načteno 5. března 2015.
  16. Christoph Drösser: Digitální Alexandrie. In: Die Zeit 2008, č. 4. 17. ledna 2008, vyhledáno 23. března 2021 .
  17. Süddeutsche Zeitung: Fotodůkaz. Staženo 14. listopadu 2019 .
  18. Drew Hansen, Sen: Martin Luther King Jr. a řeč, která inspirovala národ . HarperCollins, 2005, ISBN 978-0-06-008477-6str . 98 .
  19. Internetový archiv: Jak internetový archiv zajišťuje trvalý přístup k článkům deníku s otevřeným přístupem. 15. září 2020, staženo 24. října 2020 (anglicky).
  20. ↑ Internetový archiv filmů , přístup 21. února 2022
  21. ↑ Internetový archiv Silent Hall of Fame , přístupný 21. února 2022
  22. ↑ Internetový archiv sbírky Georgese Mélièse , přístupný 21. února 2022
  23. ↑ Internetový archiv Comedy Films , přístupný 21. února 2022
  24. Sci-Fi / Hororový internetový archiv, přístup 21. února 2022
  25. ↑ Internetový archiv Picfixer Feature Film Collection zpřístupněn 21. února 2022
  26. ↑ Internetový archiv Film Noir , přístupný 21. února 2022
  27. ↑ Internetový archiv sportovních videí , přístup 21. února 2022
  28. ↑ Internetový archiv animací a kreslených filmů zpřístupněn 21. února 2022
  29. ↑ Internetový archiv umění a hudby , přístup 21. února 2022
  30. ↑ Internetový archiv Spirituality & Religion , přístupný 21. února 2022
  31. O Archive-It. In: archive-it.org. Staženo 23. března 2021 (anglicky).
  32. Tim Brookes: Prelinger Archives: Tisíce starých filmů ke shlédnutí, remixování a použití ve vlastních projektech (Stuff to Watch). Na: makeuseof.com. 30. července 2012, vyhledáno 29. října 2016 (anglicky).

Souřadnice: 37° 46′ 56,3″  N , 122° 28′ 17,6″  Z