Fichier d'autorité commun
Fichier d'autorité commun | |
---|---|
| |
fondateur | 2012 |
Durée | 8 920 450 |
emplacement | Francfort-sur-le-Main |
EIIL | FR-588 |
opérateur | Bibliothèque nationale allemande et autres |
placer | https://gnd.network |
Le fichier d'autorité commun ( GND ) est un fichier d'autorité pour les personnes , les sociétés , les congrès , les géographies , les vedettes- matière et les titres de travail , qui est principalement utilisé pour cataloguer la littérature dans les bibliothèques, mais est également de plus en plus utilisé par les archives, les musées, les projets et dans applications Web . Il est géré par la Bibliothèque nationale allemande (DNB), toutes les associations de bibliothèques de langue allemande , la base de données des revues(ZDB) et de nombreuses autres institutions. Les données d'autorité facilitent le catalogage, offrent des points d'accès de recherche clairs et la possibilité de relier différentes ressources d'information.
Le 19 avril 2012, le GND a remplacé les fichiers d'autorité précédemment séparés Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) et le fichier de titres de sujet uniforme des archives musicales allemandes (DMA-EST dossier). Depuis juillet 2014, les données d'autorité sont enregistrées selon les règles RDA , qui sont également utilisées par la Bibliothèque du Congrès , entre autres . [1]
bases
Le fichier d'autorité commun a été développé de 2009 à 2012 dans le cadre d'un projet conjoint de la Bibliothèque nationale allemande, des réseaux de bibliothèques de langue allemande et de la base de données des revues. L'objectif du projet était de fusionner les fichiers d'autorité GKD, PND et SWD précédemment gérés séparément et le fichier DMA-EST. Un format de données commun devrait être mis en œuvre et les différences existantes dans les réglementations devraient être harmonisées.
La création de notices d'autorité était autrefois basée sur différents ensembles de règles. Il s'agissait des « Rules for Alphabetical Cataloging » (RAK-WB et RAK-Musik) pour l'indexation formelle et des « Rules for Keyword Cataloging » (RSWK) pour l'indexation du contenu.. Les règles incohérentes de création de la désignation préférée pour l'indexation formelle et de contenu ont conduit à des ensembles de données redondants dans le GKD et le SWD, en particulier dans le domaine des collectivités, des congrès et des matériaux géographiques. Par conséquent, des règles transitoires ont été élaborées pour le GND pour les cas où les règles d'indexation formelle et de contenu s'écartent l'une de l'autre, ce qui permet l'utilisation conjointe des enregistrements de données d'autorité. Les règles transitoires tiennent déjà compte autant que possible des réglementations de la RDA ( Ressource Description and Access ) .
Les formats de données des fichiers d'autorité, tant les formats internes que les formats d'échange, différaient également considérablement dans certains cas. Le format d'échange GND est basé sur MARC 21 Authority. En fusionnant tous les enregistrements de données d'autorité dans le GND, les différences de format existantes pourraient être surmontées. Cependant, les ensembles de données parallèles existants provenant des différents fichiers d'autorité ne peuvent être fusionnés qu'au fil du temps.
Dans le projet Virtual International Authority File (VIAF), le GND est virtuellement combiné avec d'autres fichiers d'autorité pour former un fichier d'autorité international.
Contenu
Les données sont constituées d'entités et de déclarations à leur sujet. Chaque entité a un type d'entité et au moins un identifiant.
Propriétés d'un enregistrement
Chaque enregistrement décrit une entité.
type d'entité
Les types d'entités répertoriés ici correspondent à ce que l'on appelle des types d'enregistrement ( type d'enregistrement de données ) dans les bibliothèques .
Dans le fichier d'autorité commun, un numéro d'identification unique (IDN ou PPN ; base de l' Uniform Resource Identifier dans le système de production), un terme préféré normalisé (anciennement également : forme autorisée ), différentes formes de noms (synonymes) et divers attributs descriptifs sont enregistrées pour chaque description d'entité . Si possible, les attributs sont stockés sous forme de relations avec d'autres enregistrements de données d'autorité, le type de relation étant codé dans chaque cas. [2]Des exemples d'attributs connexes sont les lieux de naissance et de décès des personnes et leurs professions. Pour les entreprises, par ex. Les relations de prédécesseur et de successeur, mais aussi les superordonnés administratifs sont spécifiés. Dans le cas des termes de sujet, les termes génériques et les termes apparentés sont liés. Cela signifie que la littérature sur des sujets connexes peut également être trouvée lors d'une recherche dans un catalogue de bibliothèque. Un traitement sémantique et thématique riche et précis (selon le sujet aussi : orienté dogmatiquement ) des entrées GND les unes par rapport aux autres profite à la qualité de la recherche .
De cette manière, un réseau sémantique d'ensembles de données connexes ( données liées ) est créé, qui est particulièrement adapté à une utilisation sur le Web, permet la navigation dans le fichier d'autorité et améliore ainsi les options de recherche pour les utilisateurs.
Fin août 2019, l'utilisation des phrases Tn pour les noms personnels a été abandonnée. [3] Un an plus tard, à compter du 19 juin 2020, les liens entre les notices Tn dans les données bibliographiques ont été rétrospectivement supprimés. La raison en était la qualité généralement médiocre des phrases Tn. Beaucoup n'étaient qu'à un très bas niveau de catalogage. Il était souvent difficile de savoir à quelle personne un ensemble de données pouvait être attribué, de sorte que les données n'étaient pas désambiguïsées. Il y avait des doublons et des liens incorrects vers des données bibliographiques. Au lieu de liens, il n'y a plus que des chaînes de texte dans les données bibliographiques. Depuis juillet 2020, les notices nominatives ne font plus partie du fichier d'autorité commun. [4]
sous-types d'entité
Outre les noms personnels, chaque type d'enregistrement peut être davantage différencié en spécifiant un code d'entité [5] . Par exemple, une entité géographique peut être un état ou un bâtiment. Un total de six types d'entités sont disponibles, qui sont divisés en environ 50 sous-types.
codage d'entité
code | définition [6] |
---|---|
g | géographie |
donner | Bâtiments et ensembles de bâtiments, sculptures monumentales, monuments, tombes, etc. selon RSWK §730.1 |
GIF ; gik | États membres (ils sont toujours codés en double avec "gik") |
gik | collectivités locales et unités administratives |
gil; gik | Pays, états (indépendants) (ils sont toujours codés en double avec "gik") |
Gin | Unités géographiques naturelles, unités biogéographiques et paléographiques, noms de sous-unités géographiques avec des points cardinaux ou avec d'autres expressions selon RSWK § 205, 1 et 2 |
gio | Géographie à petite échelle dans un lieu, à l'exception des bâtiments et des ensembles de bâtiments |
gir ; gik | Principautés impériales spirituelles (jusqu'en 1803), unités administratives de l'Église d'Orient (elles sont toujours codées en double avec "gik") |
donner; gik | Unités administratives qui, selon EH-G-03, reçoivent un terme générique instantané à partir du terme générique de l'unité administrative (elles sont toujours codées en double avec "gik") |
donner | Bordures, chemins, lignes |
gix | estraterrestre |
gadget | Tous les noms géographiques qui ne peuvent être attribués à aucun des autres sous-types d'entités, régions et zones selon RSWK § 204a, y compris les environs des villes et municipalités individuelles |
gxz | Lieux fictifs |
k | sociétés |
kif | Entreprises (à partir de janvier 2016) |
Kim | Corps musicaux (à partir de janvier 2016) |
kio | organes des collectivités locales |
kip | Projets et plans et programmes assimilables à des projets |
kiv; kir | Unités administratives religieuses (par exemple, les diocèses de l'Église catholique ; exception : les unités administratives de l'Église orientale, les unités administratives de l'Église orientale sont encodées avec « gir » et « gik ») (elles sont toujours codées en double avec « kir ») (depuis janvier 2016 ) |
kiz | Toutes les autres personnes morales qui n'appartiennent à aucun autre type d'entité spéciale |
kxz | Entités fictives |
p | personnes |
pif | Familles |
pique | Princes régnants, membres des maisons princières dirigeantes |
pépin | pseudonymes |
pipi | pseudonymes collectifs |
pizza | Les noms personnels qui n'appartiennent à aucun autre type d'entité spéciale |
pxg | dieux |
pixels | Figures littéraires, figures légendaires |
pixels | des fantômes |
s | termes techniques |
sab; soz | Instrumentation musicale (selon RDA 6.15) (ils sont toujours codés en double avec "saz") (à partir de janvier 2016) |
triste; soz | Supports de données (selon RDA 3.4.1.3 DA-CH) (ils sont toujours codés en double avec "saz") |
sûr; soz | Formulaire d'informations sur le type de contenu (selon RDA 7.2.1.3 DA-CH) (ils sont toujours codés en double avec "saz") |
dire; soz | Genre musical (selon RDA 6.14.2.5.2 DA-CH) (ils sont toujours codés en double avec "saz") (à partir de janvier 2016) |
sam; soz | Forme de sortie musicale (selon RDA 7.20.1.3 DA-CH) (elles sont toujours codées en double avec "saz") |
soz | termes généraux, i. H toutes les vedettes-matière qui n'appartiennent à aucun autre type d'entité spéciale |
tu | ethnographique |
sif | Moyens de transport avec des noms individuels |
voir | Événements individuels historiques |
siroter | Produits et noms de marque autres que les produits logiciels (« siw ») |
soeurette | Langues |
hé | Groupes de personnes qui ne sont pas des personnes morales |
sw | produits logiciels |
Taille | Tous les faits individuels qui sont enregistrés en tant que termes de sujet et ne peuvent être attribués à aucun des autres sous-types d'entité, par ex. B. Compétitions |
slz | Lettres, morphèmes, mots comme objets d'investigation linguistique |
snz | Nomenclature Biologie – Chimie |
sxz | Termes fictifs |
szz | Tous les cas de doute pour toutes les entités |
et | |
uiz | Non-sociétés (uniquement dans les anciennes données) |
v | conférences et événements |
vie | conférences, événements |
vif | Séquences ou séries de conférences, séquences ou séries d'événements w |
w | des usines |
encore | marques d'imprimante |
comment | expression |
femme | Version d'une œuvre musicale (abandonnée depuis juillet 2014) |
wim | oeuvres de musique |
gagner | collections |
essuyer | caractéristiques de provenance |
connaître | monuments écrits |
esprit | des usines |
identifiant d'entité
Chaque entité peut être clairement identifiée par au moins un identifiant (GND-ID). Chaque identifiant est composé des caractères 0 à 9, X et d'un trait d'union. Un identifiant pour une entité de type d'entité p se compose de 9 ou 10 caractères, il commence toujours par un 1 suivi de 8 ou 9 chiffres et se termine par un caractère de contrôle 0-9 ou X.
niveau de catalogage
Chaque notice est associée à un niveau de catalogage compris entre 1 et 6. Plus le nombre est bas, plus le niveau de l'entrée GND est élevé et mieux l'ensemble de données est traité. La norme lors de la création d'un nouveau dossier de données personnelles est initialement le niveau 3 (Tp3).
Application des termes du sujet
La désignation privilégiée est toujours basée sur les ouvrages répertoriés dans la « Liste des ouvrages techniques de référence pour le fichier d'autorité commun ». [7] La dénomination préférée des termes de sujet dans le GND suit l'usage général tel qu'il est utilisé dans les encyclopédies ( Brockhaus , Meyer , alternativement aussi Wikipedia) est détectable ; dans des cas exceptionnels, des termes issus du jargon technique sont utilisés. Les synonymes peuvent être inclus dans les entrées en tant que variantes ou quasi-synonymes. Tant qu'il n'y a pas assez de titres pour un sujet, on essaie d'abord d'exprimer de nouveaux faits en combinant plusieurs termes de sujet déjà disponibles dans une séquence de mots-clés afin d'éviter autant que possible de nouvelles entrées (ce qu'on appelle le contrôle de décomposition). Cela maintient la continuité avec le mot-clé d'un sujet dans la littérature ancienne, de sorte qu'une référence à des titres plus anciens peut être établie. Ce n'est que lorsque la littérature sur un sujet a atteint une certaine étendue qu'un nouveau terme technique est introduit. Si l'utilisation de la langue change, le terme préféré peut être ajusté.
Portée
Les quantités peuvent être trouvées dans les rapports annuels de la DNB et les extraits de données de la GND [8] .
Nombre d'entités par type d'entité au fil du temps
Le fichier d'autorité commun contient environ 8,9 millions d'enregistrements (au 13 juin 2021) des types d' entités suivants :
type d'entité / date | la source | personnes (individualisé) |
Noms personnels (non individualisés) |
Personnes et noms personnels (total) |
sociétés | conférences et événements |
géographie | termes techniques | des usines | total |
---|---|---|---|---|---|---|---|---|---|---|
code d'entité | -- | p | n | -- | k | v | g | s | w | -- |
Juin 2013 | ? | 2 882 000 | 4 628 000 | (7 510 000) | 1 172 000 | 587 000 | 293 000 | 202 000 | 193 000 | (9 957 000) |
2015 | Rapport annuel [9] | aucune information | aucune information | 8 669 790 | 1 240 852 | 619 610 | 289 449 | 205 586 | 244 480 | 11 269 767 |
2016 | Rapport annuel [10] | aucune information | aucune information | 10 546 959 | 1 498 606 | 769 067 | 295 027 | 207 149 | 287 204 | 13.604.012 |
2017 | Rapport annuel [11] | aucune information | aucune information | 11 551 274 | 1 493 823 | 786 180 | 300 138 | 209.003 | 331 310 | 14 671 728 |
2018 | Rapport annuel [12] | aucune information | aucune information | 12.032.087 | 1 487 938 | 803 612 | 305 543 | 211 339 | 367 574 | 15.208.093 |
2019 | Rapport annuel [13] | aucune information | aucune information | 12 265 826 | 1 490 830 | 826 579 | 310 860 | 212 775 | 405 899 | 15 512 769 |
Février 2020 | SDJ [14] | 5 251 171 | 7 046 133 | 12 297 304 | 1 491 072 | 829 548 | 311 357 | 212 895 | 410 736 | 15 552 912 |
Juin 2020 | SDJ [15] | 5 350 953 | abandonné | (5 350 953) | 1 491 358 | 836 410 | 313 058 | 213 257 | 425 718 | 8 630 754 |
13 octobre 2020 | SDJ [16] | 5 421 947 | abandonné | (5 421 947) | 1 490 757 | 842 725 | 314 492 | 213 528 | 442.181 | 8 725 630 |
2020 | Rapport annuel [17] | 5 467 413 | aucune information | aucune information | 1 493 057 | 846 449 | 315 389 | 213 655 | 451 414 | 8 787 377 |
13 février 2021 | SDJ [18] | 5 496 766 | abandonné | (5 496 766) | 1 495 527 | 848 846 | 315 924 | 213 779 | 456 893 | 8 827 735 |
13 juin 2021 | SDJ [19] | 5 574 687 | abandonné | (5 574 687) | 1 501 942 | 854 637 | 317 093 | 203 371 | 468 720 | 8 920 450 |
23 octobre 2021 | SDJ [20] | 5 650 830 | abandonné | (5 650 830) | 1 507 546 | 854 539 | 318 392 | 203.801 | 479 558 | 9 014 666 |
Identifiants et enregistrements de routage
Au 13 juin 2021, 465 790 enregistrements de déviation étaient publiés au format RDF (JSON-LD) sur open.dnb.de/opendata. Cela signifie que certains enregistrements de données peuvent être référencés via plusieurs identifiants GND.
Date | Numéro | annotation |
---|---|---|
13/04/2021 | 461 335 | |
13/06/2021 | 465 790 | |
13/11/2021 | 472 485 | GND, ensembles de déviation sans Tu |
tripler
Au 13 juin 2021 à 13h20 UTC, les fichiers "authorities_lds" contiennent 163 131 042 triplets dans 8 920 450 enregistrements. [21]
temps | enregistrements | tripler |
---|---|---|
13/06/2021 13:20 UTC | 8 920 450 | 163.131.042 |
2021-10-13 12 h 20 UTC | 9 014 666 | 165 639 860 |
Utilisation et interfaces
Le fichier d'autorité commun est conservé à la Bibliothèque nationale allemande. Les réseaux de bibliothèques ont importé le stock de base GND dans leurs systèmes de réseau une fois et ont depuis obtenu les mises à jour du fichier d'autorité via le processus OAI . Le GND n'est pas seulement édité et enrichi par les bibliothèques, mais aussi par les archives (jusqu'à présent principalement par les archives scientifiques et littéraires), les musées et les éditeurs d'ouvrages de référence. La collaboration s'effectue soit par le biais d'associations de bibliothèques, soit après consultation de la Bibliothèque nationale allemande. L'utilisation par les archives nationales et municipales ne fait que commencer (à partir de 2015).
Les données de l'autorité GND sont disponibles gratuitement sur le site de la DNB aux formats MARC 21 Authority, MARC21-xml et RDFxml sous licence CC0 1.0 .
Intégration interinstitutionnelle des données d'autorité
En décembre 2012, un projet de coopération entre la Bibliothèque nationale allemande (DNB) et l' Institut allemand du film (DIF) a été lancé sous le nom d'Intégration interinstitutionnelle des données normatives (IN2N). L'objectif du projet, financé par la Fondation allemande pour la recherche (DFG), est de soutenir les institutions non bibliothécaires dans l'utilisation du GND et de les impliquer dans l'indexation. [22] Entre autres choses, dans le cadre du projet, les ensembles de données de filmportal.de ont été comparés avec les articles personnels de Wikipedia . [23]
Fin 2014, les données standard du DIF ont été importées dans le GND. Dans les mois précédents, des données de l' Institut ibéro-américain (Berlin) et du Centre de recherche pour l'Europe de l'Est de l'Université de Brême, entre autres, avaient déjà été transférées au GND. Depuis le 6 mai 2016, les Wikipédiens ayant suivi une formation adaptée peuvent créer des données d'autorité pour les particuliers via le « formulaire web GND ». L'identifiant de bibliothèque correspondant est Wikimedia Germany (DE-B1592).
Littérature
- Renate Behrens-Neumann : Le fichier d'autorité commun (GND). Un projet touche à sa fin. In : Dialogue avec les bibliothèques. Volume 24, Numéro 1, 2012, ISSN 0936-1138 , p. 25–28, ( PDF; 130 ko ).
- Eva-Maria Gulder : Le fichier d'autorité commun (GND). Bibliothèque d'État de Bavière de Munich (édition standard des données), septembre 2011, ( PDF; 2,84 Mo ).
- Thekla Kluttig : Fichier d'autorité commun et archives - à quoi ça sert ? Dans : Clemens Rehm, Monika Storm, Andrea Wettmann (eds.) : Estates - Nouvelles voies de la tradition dans le réseau. Conférence de printemps commune FG 1 et FG 6 pour tous les groupes de spécialistes du VdA. 7 mai 2013, Archives d'État de Chemnitz (= publications des Archives d'État de Saxe. Série A : répertoires d'archives, éditions et articles spécialisés. 17). Mitteldeutscher Verlag, Halle (Saale) 2014, ISBN 978-3-95462-388-4 , p. 85–88.
- Barbara Pfeifer : Du projet à l'action. Le fichier d'autorité commun (GND). Dans : Klaus-Rainer Brintzinger, Ulrich Hohoff (eds.) : Bibliothèques : Portes vers le monde de la connaissance. 101e Journée des bibliothécaires allemands à Hambourg 2012. Olms, Hildesheim et autres. 2013, ISBN 978-3-487-14888-5 , p. 80–91.
- Fabian Steeg, Adrian Pohl, Pascal Christoph : lobid-gnd - Une interface vers le fichier d'autorité commun pour l'homme et la machine . Dans : Pratique de l'information . ruban 5 , non. 1 , 2019, ISSN 2297-3249 , doi : 10.11588/ip.2019.1.52673 ( uni-heidelberg.de ).
- Brigitte Wiechmann : Le fichier d'autorité commun (GND). Rétrospective et Prospective. In : Dialogue avec les bibliothèques. Volume 24, Numéro 2, 2012, p. 20–22, ( PDF; 465 ko ).
liens web
- page d'accueil
- Recherche via Online-GND (Service de la Bibliothèque Service Center Baden-Württemberg )
- Page d'information sur le fichier d'autorité commun (Bibliothèque nationale allemande)
- Intégration interinstitutionnelle des données d'autorité (IN2N, Bibliothèque nationale allemande et Institut allemand du film)
- Recherche via le portail DNB (Bibliothèque nationale allemande)
- Page d'information sur le GND dans le DNB Wiki
- Page d'information sur le GND dans le BSZ Wiki
- Sélection de bases de données GND, encyclopédies, etc. (Bernhard Ebneth, NDB)
- Wikipedia:BEACON (permet de fusionner les sources en un seul GND)
- GND Explorer (version bêta)
- lobid-gnd - interface de recherche du hbz avec interface de données ouvertes liée pour le GND
- WebGND - illustre les relations entre les entrées GND entre elles et avec le Web
- GND pour les données de culture (GND4C)
les détails
- ↑ Renate Behrens, Christine Frodl : Premiers jalons du projet RDA. In : Dialogue avec les bibliothèques. Volume 26, numéro 1, 2014, pages 25 à 31, ici page 28, ( PDF ; 310 ko ).
- ↑ GND : Liste des encodages dans la sous-zone $4 - alphabétiquement par code ( Memento du 23 septembre 2015 aux Internet Archive ).
- ↑ L'abréviation « Tn » signifie Thesaurus Name et désigne des ensembles de données de noms non individualisés. Marqué comme « indifférencié » dans VIAF .
- ↑ "Suppression des données d'autorité Tn dans le GND avec effet sur les données de titre de la DNB" , 28 mai 2020. Date d'accès : 14 juillet 2020.
- ↑ GND Entity Encoding Allocation Guidelines ( mémento du 23 septembre 2015 sur Internet Archive ) (en date du 21 juin 2013).
- ↑ "Entity Coding - Award Guidelines" (en date du 15 novembre 2018)
- ^ "Liste des ouvrages de référence spécialisés pour le fichier d'autorité commun (GND)" ( DNB 1037142683 ).
- ↑ https://data.dnb.de/opendata/
- ↑ Bibliothèque nationale allemande – Rapport annuel 2015 , p. 49. Récupéré le 3 juin 2016.
- ↑ Bibliothèque nationale allemande – Rapport annuel 2016 , page 51. Consulté le 13 avril 2019.
- ↑ Bibliothèque nationale allemande – Rapport annuel 2017 , page 51. Consulté le 13 avril 2019.
- ↑ Bibliothèque nationale allemande – Rapport annuel 2018 , p. 49. Récupéré le 27 janvier 2020.
- ↑ Bibliothèque nationale allemande – Rapport annuel 2019 , p. 49. Récupéré le 24 juin 2020.
- ↑ data.dnb.de , au 13 février 2020. Date d'accès : 2 juillet 2020.
- ↑ data.dnb.de , au : 22 juin 2020. Date d'accès : 15 juillet 2020.
- ↑ data.dnb.de , au 13 octobre 2020 à 12h20 UTC. Date d'accès : 20 février 2021.
- ↑ Bibliothèque nationale allemande – Rapport annuel 2020 , p. 49. Récupéré le 3 juillet 2021.
- ↑ data.dnb.de , au 13 février 2021 à 13h20 UTC. Date d'accès : 5 mars 2021.
- ↑ data.dnb.de , statut : 13 juin 2021 12:20 UTC. Date d'accès : 3 juillet 2021.
- ↑ data.dnb.de , au 13 octobre 2021 12:20 UTC. Publié 2021-11-23 12:57--13:08. Date d'accès : 3 décembre 2021.
- ↑ https://data.dnb.de/opendata/
- ↑ IN2N ( Memento du 12 août 2015 dans Internet Archive ), Deutsches Filminstitut , Date de la requête : 21 novembre 2013.
- ↑ Alexander Haffner : Intégration interinstitutionnelle des données d'autorité (IN2N). In : Dialogue avec les bibliothèques. Volume 25, Numéro 2, 2013, p. 42–45, ( PDF; 54 ko ).