Felles autoritetsfil

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk

Common Authority File ( GND ) er en autoritetsfil for personer , selskaper , kongresser , geografisk materiale , emneoverskrifter og arbeidstitler , som først og fremst brukes til å katalogisere litteratur i biblioteker, men også i økende grad brukes av arkiver, museer, prosjekter og i webapplikasjoner . Det administreres av det tyske nasjonalbiblioteket (DNB), alle tyskspråklige bibliotekforeninger , journaldatabasen(ZDB) og en rekke andre institusjoner. Myndighetsdata letter katalogisering, gir oversiktlige søketilgangspunkter og mulighet for å koble sammen ulike informasjonsressurser.

Den 19. april 2012 erstattet GND de tidligere separate autoritetsfilene Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) og det tyske musikkarkivets enhetlige emnetittelfil (DMA-EST) fil). Siden juli 2014 har myndighetsdata blitt registrert i henhold til RDA - reglene, som også brukes av blant annet Library of Congress . [1]

grunnleggende

Eksempel på personopplysninger (skjermdump, mai 2012)

Fellesmyndighetsfilen ble utviklet fra 2009 til 2012 i et fellesprosjekt av det tyske nasjonalbiblioteket, de tyskspråklige biblioteknettverkene og journaldatabasen. Målet med prosjektet var å slå sammen de tidligere separat administrerte GKD-, PND- og SWD-autoritetsfilene og DMA-EST-filen. Et felles dataformat bør implementeres og de eksisterende forskjellene i regelverket bør harmoniseres.

Opprettelsen av myndighetsposter pleide å være basert på forskjellige sett med regler. Dette var " Regler for alfabetisk katalogisering " (RAK-WB og RAK-Musik) for formell indeksering og " Regler for søkeordkatalogisering " (RSWK) for indeksering av innholdet. De inkonsekvente reglene for å lage den foretrukne betegnelsen for den formelle indekseringen og innholdsindekseringen førte til overflødige datasett i GKD og SWD, spesielt innen selskapsorganer, kongresser og geografisk materiale. Derfor ble det utviklet overgangsregler for GND for tilfeller der reglene for formell indeksering og innholdsindeksering avviker fra hverandre, som muliggjør felles bruk av myndighetsdatapostene. Overgangsreglene tar allerede så langt det er mulig hensyn til forskriftene til RDA ( Resource Description and Access ) .

Myndighetsfilenes dataformater, både de interne formatene og utvekslingsformatene, skilte seg også betydelig i enkelte tilfeller. GND-utvekslingsformatet er basert på MARC 21 Authority. Ved å slå sammen alle myndighetsdataposter i GND, kan de tidligere eksisterende formatforskjellene overvinnes. Eksisterende parallelle datasett fra de forskjellige autorisasjonsfilene kan imidlertid bare slås sammen over tid.

I prosjektet Virtual International Authority File (VIAF) er GND praktisk talt kombinert med andre autoritetsfiler for å danne en internasjonal autoritetsfil.

innhold

Dataene består av enheter og utsagn om dem. Hver enhet har en enhetstype og minst én identifikator.

Egenskaper til en post

Hver post beskriver en enhet.

enhetstyper

Enhetstypene som er listet opp her, tilsvarer såkalte posttyper ( dataposttype ) i biblioteker .

I fellesmyndighetsmappen et unikt identifikasjonsnummer (IDN eller PPN; grunnlag for Uniform Resource Identifier i produksjonssystemet), en standardisert foretrukket term (tidligere også: autorisert form ), ulike former for navn (synonymer) og ulike beskrivende attributter registreres for hver enhetsbeskrivelse . Hvis mulig, lagres attributtene som relasjoner til andre autoritetsdataposter, med relasjonstypen kodet i hvert tilfelle. [2]Eksempler på relaterte attributter er fødesteder og dødssteder for mennesker og deres yrker. For selskaper, f.eks. Forgjenger- og etterfølgerforhold, men også administrative overordnede er spesifisert. Når det gjelder fagtermer, er generiske termer og relaterte termer knyttet sammen. Dette betyr at litteratur om relaterte emner også kan finnes ved søk i en bibliotekskatalog. En rik og nøyaktig semantisk og tematisk (avhengig av emnet også: dogmatisk orientert) behandling av GND-oppføringene til hverandre gagner kvaliteten på gjenfinningen .

På denne måten skapes et semantisk nettverk av relaterte datasett ( linked data ), som er spesielt egnet for bruk på nettet, muliggjør navigering innenfor autorisasjonsfilen og dermed forbedrer søkemulighetene for brukerne.

I slutten av august 2019 ble bruken av Tn-setninger for personnavn avviklet. [3] Ett år senere, fra og med 19. juni 2020, ble koblingene mellom Tn-postene i de bibliografiske dataene slettet i ettertid. Årsaken til dette var den overveiende dårlige kvaliteten på Tn-setningene. Mange var bare på et svært lavt nivå av katalogisering. Det var ofte uklart hvilken person et datasett kunne tilskrives, så dataene ble ikke disambiguerte. Det var duplikater og feil lenker til bibliografiske data. I stedet for lenker er det nå bare tekststrenger i de bibliografiske dataene. Siden juli 2020 er ikke navnepostene lenger en del av den felles myndighetsmappen. [4]

enhetsundertyper

Bortsett fra personnavn, kan hver posttype differensieres ytterligere ved å spesifisere en enhetskode [5] . En geografisk enhet kan for eksempel være en stat eller en bygning. Totalt seks enhetstyper er tilgjengelige, som er delt inn i rundt 50 undertyper.

enhetskoding

enhetsidentifikator

Hver enhet kan tydelig identifiseres med minst én identifikator (GND-ID). Hver identifikator består av tegnene 0 til 9, X og en bindestrek. En identifikator for en enhet av enhetstype p består av 9 eller 10 tegn, den starter alltid med en 1 etterfulgt av 8 eller 9 sifre og slutter med et haketegn 0-9 eller X.

katalogiseringsnivå

Hver post er knyttet til et katalogiseringsnivå mellom 1 og 6. Jo lavere tall, jo høyere nivå på GND-oppføringen og jo bedre behandlet er datasettet. Standarden ved opprettelse av ny personopplysningspost er i utgangspunktet nivå 3 (Tp3).

Anvendelse av fagvilkår

Den foretrukne betegnelsen er alltid basert på verkene som er oppført i " Liste over tekniske referanseverk for Common Authority File ". [7] Den foretrukne navngivningen av emneord i GND følger generell bruk slik den brukes i leksikon ( Brockhaus , Meyer , alternativt også Wikipedia) er påviselig; unntaksvis benyttes termer fra fagsjargong. Synonymer kan inkluderes i oppføringene som varianter eller såkalte kvasi-synonymer. Så lenge det ikke er nok titler til et emne, forsøkes det først å uttrykke nye fakta ved å kombinere flere allerede tilgjengelige emneord i en nøkkelordrekkefølge for å unngå nye oppføringer så langt som mulig (såkalt dekomponeringskontroll). Dette opprettholder kontinuiteten med nøkkelording av et emne i eldre litteratur, slik at en referanse til eldre titler kan etableres. Først når litteraturen om et tema har nådd et visst omfang, introduseres et nytt fagbegrep. Hvis språkbruken endres, kan den foretrukne termen justeres.

omfang

Mengder finnes i årsrapportene til DNB og datautdragene til GND [8] .

Antall enheter etter enhetstype over tid

Common Authority File inneholder rundt 8,9 millioner poster (per 13. juni 2021) av følgende enhetstyper :

Identifikatorer og rutingposter

Per 13. juni 2021 er det 465 790 avbøyningsposter publisert i RDF (JSON-LD)-format på open.dnb.de/opendata. Dette betyr at noen dataposter kan refereres via flere GND-identifikatorer.

trippel

Per 13. juni 2021 kl. 13.20 UTC inneholder «authorities_lds»-filene 163.131.042 trippel i 8.920.450 poster. [21]

Bruk og grensesnitt

Fellesmyndighetsmappen oppbevares på det tyske nasjonalbiblioteket. Biblioteknettverkene importerte GND-grunnlaget inn i nettverkssystemene sine én gang og har siden fått oppdateringene til autorisasjonsfilen via OAI - prosessen. GND er ikke bare redigert og utvidet av biblioteker, men også av arkiver (så langt primært av vitenskapelige og litterære arkiver), museer og redaktører av oppslagsverk. Samarbeid skjer enten gjennom bibliotekforeninger eller etter samråd med det tyske nasjonalbiblioteket. Bruken av statlige og kommunale arkiver er bare så vidt i gang (fra og med 2015).

GND-myndighetsdataene er tilgjengelige gratis på DNBs nettsider i formatene MARC 21 Authority, MARC21-xml og RDFxml under lisens CC0 1.0 .

Tversinstitusjonell integrering av myndighetsdata

Kombinasjon av ulike kilder om Franz Beckenbauer ved bruk av BEACON-formatet

I desember 2012 ble et samarbeidsprosjekt mellom det tyske nasjonalbiblioteket (DNB) og det tyske filminstituttet (DIF) startet under navnet Cross- Institutional Integration of Norm Data (IN2N). Målet med prosjektet, finansiert av den tyske forskningsstiftelsen (DFG), er å støtte ikke-bibliotekariske institusjoner i å bruke GND og å involvere dem i indeksering. [22] Blant annet som en del av prosjektet ble datasettene fra filmportal.de sammenlignet med de personlige artiklene fra Wikipedia . [23]

På slutten av 2014 ble standarddataene fra DIF importert til GND. I månedene før var data fra blant annet Ibero-American Institute (Berlin) og Research Centre for Eastern Europe ved Universitetet i Bremen allerede overført til GND. Siden 6. mai 2016 har Wikipedianere som har deltatt i passende opplæring vært i stand til å lage autoritetsdata for enkeltpersoner ved å bruke "GND-nettskjemaet". Den tilsvarende biblioteksidentifikatoren er Wikimedia Tyskland (DE-B1592).

litteratur

  • Renate Behrens-Neumann: The Common Authority File (GND). Et prosjekt går mot slutten. I: Dialog med biblioteker. Bind 24, utgave 1, 2012, ISSN  0936-1138 , s. 25–28, ( PDF; 130 kB ).
  • Eva-Maria Gulder: The Common Authority File (GND). Bavarian State Library München (standard dataredigering), september 2011, ( PDF; 2,84 MB ).
  • Thekla Kluttig: Felles myndighetsmappe og arkiv – hva er vitsen? I: Clemens Rehm, Monika Storm, Andrea Wettmann (red.): Estates - New ways of tradition in the network. Felles vårkonferanse FG 1 og FG 6 for alle faggruppene i VdA. 7. mai 2013, Statsarkiv Chemnitz (= publikasjoner av Saksisk statsarkiv. Serie A: arkivfortegnelser, utgaver og fagartikler. 17). Mitteldeutscher Verlag, Halle (Saale) 2014, ISBN 978-3-95462-388-4 , s. 85–88.
  • Barbara Pfeifer: Fra prosjekt til handling. Common Authority File (GND). I: Klaus-Rainer Brintzinger, Ulrich Hohoff (red.): Biblioteker: Porter til kunnskapens verden. 101. tyske bibliotekardag i Hamburg 2012. Olms, Hildesheim m.fl. 2013, ISBN 978-3-487-14888-5 , s. 80–91.
  • Fabian Steeg, Adrian Pohl, Pascal Christoph: lobid-gnd - Et grensesnitt til den felles autoritetsfilen for mann og maskin . I: Informasjonspraksis . teip 5 , nei. 1 , 2019, ISSN  2297-3249 , doi : 10.11588/ip.2019.1.52673 ( uni-heidelberg.de ).
  • Brigitte Wiechmann: The Common Authority File (GND). Tilbakeblikk og prospekt. I: Dialog med biblioteker. Bind 24, utgave 2, 2012, s. 20–22, ( PDF; 465 kB ).

weblenker

spesifikasjoner

  1. Renate Behrens, Christine Frodl: Første milepæler i RDA-prosjektet. I: Dialog med biblioteker. Bind 26, utgave 1, 2014, s. 25–31, her s. 28, ( PDF; 310 kB ).
  2. GND: Liste over kodinger i underfelt $4 - alfabetisk etter kode ( Memento av 23. september 2015 på Internet Archive ).
  3. Forkortelsen "Tn" står for Thesaurus Name og angir ikke-individualiserte navnedatasett. Merket som "udifferensiert" i VIAF .
  4. "Abolisjon av Tn-myndighetsdata i GND med virkning på titteldataene til DNB" 28. mai 2020. Tilgangsdato: 14. juli 2020.
  5. GND Entity Encoding Allocation Guidelines ( memento 23. september 2015 på Internet Archive ) (fra 21. juni 2013).
  6. "Entity Coding - Award Guidelines" (fra 15. november 2018)
  7. ^ "Liste over spesialistreferanseverk for Common Authority File (GND)" ( DNB 1037142683 ).
  8. https://data.dnb.de/opendata/
  9. German National Library – Annual Report 2015 , s. 49. Hentet 3. juni 2016.
  10. German National Library – Annual Report 2016 , s. 51. Hentet 13. april 2019.
  11. German National Library – Annual Report 2017 , s. 51. Hentet 13. april 2019.
  12. German National Library – Annual Report 2018 , s. 49. Hentet 27. januar 2020.
  13. German National Library – Annual Report 2019 , s. 49. Hentet 24. juni 2020.
  14. data.dnb.de , per 13. februar 2020. Tilgangsdato: 2. juli 2020.
  15. data.dnb.de , per: 22. juni 2020. Tilgangsdato: 15. juli 2020.
  16. data.dnb.de , per 13. oktober 2020 kl. 12:20 UTC. Tilgangsdato: 20. februar 2021.
  17. German National Library – Annual Report 2020 , s. 49. Hentet 3. juli 2021.
  18. data.dnb.de , per 13. februar 2021 13:20 UTC. Tilgangsdato: 5. mars 2021.
  19. data.dnb.de , status: 13. juni 2021 12:20 UTC. Tilgangsdato: 3. juli 2021.
  20. data.dnb.de , per 13. oktober 2021 12:20 UTC. Publisert 2021-11-23 12:57--13:08. Tilgangsdato: 3. desember 2021.
  21. https://data.dnb.de/opendata/
  22. IN2N ( Memento av 12. august 2015 i Internet Archive ), Deutsches Filminstitut , Spørringsdato: 21. november 2013.
  23. Alexander Haffner: Tversinstitusjonell integrering av myndighetsdata (IN2N). I: Dialog med biblioteker. Bind 25, utgave 2, 2013, s. 42–45, ( PDF; 54 kB ).