Common Authority File

z Wikipedie, otevřené encyklopedie
Přejít na navigaci Přejít na hledání

Common Authority File ( GND ) je soubor autorit pro osoby , korporace , kongresy , geografické materiály , předmětová hesla a názvy prací , který se primárně používá ke katalogizaci literatury v knihovnách, ale stále více jej využívají také archivy, muzea, projekty a webové aplikace . Spravuje ji Německá národní knihovna (DNB), všechny německy mluvící knihovnické spolky , databáze časopisů(ZDB) a mnoha dalších institucí. Autoritní data usnadňují katalogizaci, nabízejí přehledné vyhledávací přístupové body a možnost propojení různých informačních zdrojů.

Dne 19. dubna 2012 GND nahradilo dříve samostatné soubory autorit Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) a soubor jednotného názvu předmětu německého hudebního archivu (DMA-EST soubor). Od července 2014 jsou autoritní data zaznamenávána podle pravidel RDA , která mimo jiné používá i Kongresová knihovna . [1]

základy

Příklad osobních údajů (snímek obrazovky, květen 2012)

Soubor společných autorit byl vyvíjen v letech 2009 až 2012 ve společném projektu Německé národní knihovny, sítí německy psaných knihoven a databáze časopisů. Cílem projektu bylo sloučit dříve samostatně spravované autoritní soubory GKD, PND a SWD a soubor DMA-EST. Měl by být zaveden společný datový formát a měly by být harmonizovány stávající rozdíly v předpisech.

Vytváření autoritních záznamů bývalo založeno na různých souborech pravidel. Jednalo se o „ Pravidla pro abecední katalogizaci “ (RAK-WB a RAK-Musik) pro formální indexování a „ Pravidla pro katalogizaci klíčových slov “ (RSWK) pro indexování obsahu .. Nejednotná pravidla pro vytvoření preferovaného označení pro formální a obsahovou indexaci vedla k nadbytečným datovým souborům v GKD a SWD, zejména v oblasti korporací, kongresů a geografických materiálů. Proto byla pro GND vypracována přechodná pravidla pro případy, kdy se pravidla formální a obsahové indexace od sebe odchylují, což umožňuje společné používání autoritních datových záznamů. Přechodná pravidla již v co největší míře zohledňují předpisy RDA ( Resource Description and Access ) .

Datové formáty autoritních souborů, jak interní, tak výměnné formáty, se také v některých případech značně lišily. Formát výměny GND je založen na MARC 21 Authority. Sloučením všech záznamů autoritních dat v GND by mohly být překonány dříve existující rozdíly ve formátu. Existující paralelní datové sady z různých souborů oprávnění však lze sloučit pouze v průběhu času.

V projektu Virtual International Authority File (VIAF) je GND virtuálně kombinován s jinými soubory autorit a tvoří tak soubor mezinárodních autorit.

obsah

Data se skládají z entit a prohlášení o nich. Každá entita má typ entity a alespoň jeden identifikátor.

Vlastnosti záznamu

Každý záznam popisuje entitu.

typy entit

Zde uvedené typy entit odpovídají tzv. typům záznamů ( typ datového záznamu ) v knihovnách .

Ve společném autoritním souboru jedinečné identifikační číslo (IDN nebo PPN; základ pro Uniform Resource Identifier v produkčním systému), standardizovaný preferovaný termín (dříve také: autorizovaná forma ), různé formy jmen (synonyma) a různé popisné atributy jsou zaznamenány pro každý popis entity . Pokud je to možné, jsou atributy uloženy jako vztahy k jiným záznamům autoritních dat, přičemž typ vztahu je v každém případě zakódován. [2]Příklady souvisejících atributů jsou místa narození a úmrtí lidí a jejich povolání. Pro korporace, např. Jsou specifikovány vztahy předchůdce a nástupce, ale i správní nadřízení. V případě předmětových termínů jsou obecné termíny a související termíny propojeny. To znamená, že literaturu k souvisejícím tématům lze nalézt i při vyhledávání v katalogu knihovny. Bohaté a přesné sémantické a tematické (v závislosti na předmětu také: dogmaticky orientované) vzájemné zpracování záznamů GND prospívá kvalitě vyhledávání .

Tímto způsobem je vytvořena sémantická síť souvisejících datových sad ( linkovaná data ), která je vhodná zejména pro použití na webu, umožňuje navigaci v rámci souboru autorit a zlepšuje tak možnosti vyhledávání pro uživatele.

Na konci srpna 2019 bylo ukončeno používání Tn vět pro osobní jména. [3] O rok později, k 19. červnu 2020, byly vazby mezi záznamy Tn v bibliografických údajích zpětně vymazány. Důvodem byla převážně špatná kvalita Tn vět. Mnohé byly pouze na velmi nízké úrovni katalogizace. Často nebylo jasné, které osobě lze soubor dat přiřadit, takže údaje nebyly jednoznačné. Byly zde duplikáty a nesprávné odkazy na bibliografické údaje. Místo odkazů jsou nyní v bibliografických údajích pouze textové řetězce. Od července 2020 již nejsou záznamy jmen součástí společného souboru autorit. [4]

podtypy entit

Kromě osobních jmen lze každý typ záznamu dále odlišit zadáním kódu entity [5] . Geografickou entitou může být například stát nebo budova. K dispozici je celkem šest typů entit, které jsou rozděleny do přibližně 50 podtypů.

kódování entity

identifikátor entity

Každou entitu lze jednoznačně identifikovat alespoň jedním identifikátorem (GND-ID). Každý identifikátor se skládá ze znaků 0 až 9, X a pomlčky. Identifikátor entity typu p se skládá z 9 nebo 10 znaků, vždy začíná 1 následovanou 8 nebo 9 číslicemi a končí kontrolním znakem 0-9 nebo X.

úroveň katalogizace

Každý záznam je spojen s úrovní katalogizace mezi 1 a 6. Čím nižší číslo, tím vyšší úroveň zadání GND a tím lépe zpracovaný soubor dat. Standardem při vytváření nového záznamu osobních údajů je zpočátku úroveň 3 (Tp3).

Aplikace předmětových termínů

Preferované označení je vždy založeno na dílech uvedených v „ Seznamu technických referenčních děl pro soubor Common Authority File “. [7] Preferované pojmenování předmětových termínů v GND se řídí obecným zvykem, jak se používá v encyklopediích ( Brockhaus , Meyer , případně také Wikipedie) je zjistitelný; ve výjimečných případech se používají termíny z odborného žargonu. Synonyma mohou být v heslech obsažena jako varianty nebo tzv. kvazi-synonyma. Dokud není k tématu dostatek názvů, nejprve se pokusíme vyjádřit nová fakta kombinací několika již dostupných předmětových termínů v posloupnosti klíčových slov, aby se pokud možno předešlo novým záznamům (tzv. kontrola rozkladu). Tím je zachována kontinuita s heslem tématu ve starší literatuře, takže lze vytvořit odkaz na starší tituly. Teprve když literatura k tématu dosáhne určitého rozsahu, zavádí se nový odborný termín. Pokud se používání jazyka změní, preferovaný termín lze upravit.

Rozsah

Množství lze nalézt ve výročních zprávách DNB a výpisech dat GND [8] .

Počet entit podle typu entity v průběhu času

Soubor Common Authority File obsahuje přibližně 8,9 milionu záznamů (k 13. červnu 2021) následujících typů entit :

Identifikátory a směrovací záznamy

K 13. červnu 2021 je na open.dnb.de/opendata publikováno 465 790 záznamů vychýlení ve formátu RDF (JSON-LD). To znamená, že na některé datové záznamy lze odkazovat pomocí několika GND identifikátorů.

trojnásobný

K 13. červnu 2021 13:20 UTC obsahují soubory „authorities_lds“ 163 131 042 trojic v 8 920 450 záznamech. [21]

Použití a rozhraní

Společná složka autority je uložena v Německé národní knihovně. Sítě knihoven jednou importovaly základní fond GND do svých síťových systémů a od té doby získaly aktualizace souboru autorit prostřednictvím procesu OAI . GND je editován a rozšiřován nejen knihovnami, ale také archivy (zatím především vědeckými a literárními), muzei a editory referenčních prací. Spolupráce probíhá buď prostřednictvím knihovnických spolků nebo po konzultaci s Německou národní knihovnou. Využívání státními a městskými archivy je teprve na začátku (stav 2015).

Data autority GND jsou zdarma k dispozici na webu DNB ve formátech MARC 21 Authority, MARC21-xml a RDFxml pod licencí CC0 1.0 .

Meziinstitucionální integrace autoritních dat

Kombinace různých zdrojů o Franzi Beckenbauerovi pomocí formátu BEACON

V prosinci 2012 byl zahájen projekt spolupráce mezi Německou národní knihovnou (DNB) a Německým filmovým institutem (DIF) pod názvem Cross- Institutional Integration of Norm Data (IN2N). Cílem projektu financovaného Německou výzkumnou nadací (DFG) je podpořit neknihovnické instituce ve využívání GND a zapojit je do indexace. [22] V rámci projektu byly mimo jiné porovnány soubory dat z filmportal.de s osobními články z Wikipedie . [23]

Na konci roku 2014 byla do GND importována standardní data z DIF. V předchozích měsících již byla do GND převedena mimo jiné data z Ibero-amerického institutu (Berlín) a Výzkumného centra pro východní Evropu na univerzitě v Brémách. Od 6. května 2016 mohou wikipedisté, kteří se zúčastnili příslušného školení, vytvářet autoritní data pro jednotlivce pomocí „webového formuláře GND“. Odpovídající identifikátor knihovny je Wikimedia Germany (DE-B1592).

literatura

  • Renate Behrens-Neumann: Soubor společných autorit (GND). Projekt končí. In: Dialog s knihovnami. Ročník 24, číslo 1, 2012, ISSN  0936-1138 , s. 25–28, ( PDF; 130 kB ).
  • Eva-Maria Gulder: Soubor společné autority (GND). Bavorská státní knihovna Mnichov (standardní úprava dat), září 2011, ( PDF; 2,84 MB ).
  • Thekla Kluttig: Společný soubor autorit a archivy – jaký to má smysl? In: Clemens Rehm, Monika Storm, Andrea Wettmann (eds.): Statky - Nové způsoby tradice v síti. Společná jarní konference FG 1 a FG 6 pro všechny odborné skupiny ve VdA. 7. května 2013, Státní archiv Chemnitz (= publikace Saského státního archivu. Řada A: archivní adresáře, edice a odborné články. 17). Mitteldeutscher Verlag, Halle (Saale) 2014, ISBN 978-3-95462-388-4 , s. 85–88.
  • Barbara Pfeifer: Od projektu k akci. Soubor společných autorit (GND). In: Klaus-Rainer Brintzinger, Ulrich Hohoff (eds.): Knihovny: Brány do světa vědění. 101. den německých knihovníků v Hamburku 2012. Olms, Hildesheim a další. 2013, ISBN 978-3-487-14888-5 , s. 80–91.
  • Fabian Steeg, Adrian Pohl, Pascal Christoph: lobid-gnd – rozhraní ke společnému souboru autorit pro člověka a stroj . In: Informační praxe . páska 5 , č. 1 , 2019, ISSN  2297-3249 , doi : 10.11588/ip.2019.1.52673 ( uni-heidelberg.de ).
  • Brigitte Wiechmann: Soubor společných autorit (GND). Zpětný pohled a výhled. In: Dialog s knihovnami. Ročník 24, číslo 2, 2012, s. 20–22, ( PDF; 465 kB ).

webové odkazy

položky

  1. Renate Behrens, Christine Frodl: První milníky v projektu RDA. In: Dialog s knihovnami. Ročník 26, číslo 1, 2014, s. 25–31, zde s. 28, ( PDF; 310 kB ).
  2. GND: Seznam kódování v podpoli $4 - abecedně podle kódu ( Memento z 23. září 2015 v internetovém archivu ).
  3. Zkratka „Tn“ znamená název tezauru a označuje neindividualizované datové sady jmen. Označeno jako „nerozlišené“ ve VIAF .
  4. "Zrušení autoritních dat Tn v GND s účinností na titulní data DNB" , 28. května 2020. Datum přístupu: 14. července 2020.
  5. Pokyny pro přidělování kódování entit GND ( memento z 23. září 2015 v internetovém archivu ) (k 21. červnu 2013).
  6. „Kódování entit – Pokyny pro udělování“ (k 15. listopadu 2018)
  7. ^ „Seznam odborných referenčních prací pro soubor Common Authority File (GND)“ ( DNB 1037142683 ).
  8. https://data.dnb.de/opendata/
  9. Německá národní knihovna – Výroční zpráva 2015 , s. 49. Staženo 3. 6. 2016.
  10. Německá národní knihovna – Výroční zpráva 2016 , s. 51. Staženo 13. dubna 2019.
  11. Německá národní knihovna – Výroční zpráva 2017 , s. 51. Staženo 13. dubna 2019.
  12. Německá národní knihovna – Výroční zpráva 2018 , s. 49. Staženo 27. 1. 2020.
  13. Německá národní knihovna – Výroční zpráva 2019 , s. 49. Staženo 24. června 2020.
  14. data.dnb.de , od 13. února 2020. Datum přístupu: 2. července 2020.
  15. data.dnb.de , stav: 22. června 2020. Datum přístupu: 15. července 2020.
  16. data.dnb.de , k 13. říjnu 2020 12:20 UTC. Datum přístupu: 20. února 2021.
  17. Německá národní knihovna – Výroční zpráva 2020 , s. 49. Staženo 3. července 2021.
  18. data.dnb.de , k 13. únoru 2021 13:20 UTC. Datum přístupu: 5. března 2021.
  19. data.dnb.de , stav: 13. června 2021 12:20 UTC. Datum přístupu: 3. července 2021.
  20. data.dnb.de , k 13. říjnu 2021 12:20 UTC. Publikováno 23. 11. 2021 12:57--13:08. Datum přístupu: 3. prosince 2021.
  21. https://data.dnb.de/opendata/
  22. IN2N ( Memento z 12. srpna 2015 v internetovém archivu ), Deutsches Filminstitut , Datum dotazu: 21. listopadu 2013.
  23. Alexander Haffner: Meziinstitucionální integrace autoritních dat (IN2N). In: Dialog s knihovnami. Ročník 25, číslo 2, 2013, s. 42–45, ( PDF; 54 kB ).