Fichier d'autorité commun

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

Le fichier d'autorité commun ( GND ) est un fichier d'autorité pour les personnes , les sociétés , les congrès , les géographies , les vedettes- matière et les titres de travail , qui est principalement utilisé pour cataloguer la littérature dans les bibliothèques, mais est également de plus en plus utilisé par les archives, les musées, les projets et dans applications Web . Il est géré par la Bibliothèque nationale allemande (DNB), toutes les associations de bibliothèques de langue allemande , la base de données des revues(ZDB) et de nombreuses autres institutions. Les données d'autorité facilitent le catalogage, offrent des points d'accès de recherche clairs et la possibilité de relier différentes ressources d'information.

Le 19 avril 2012, le GND a remplacé les fichiers d'autorité précédemment séparés Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) et le fichier de titres de sujet uniforme des archives musicales allemandes (DMA-EST dossier). Depuis juillet 2014, les données d'autorité sont enregistrées selon les règles RDA , qui sont également utilisées par la Bibliothèque du Congrès , entre autres . [1]

bases

Exemple de données personnelles (capture d'écran, mai 2012)

Le fichier d'autorité commun a été développé de 2009 à 2012 dans le cadre d'un projet conjoint de la Bibliothèque nationale allemande, des réseaux de bibliothèques de langue allemande et de la base de données des revues. L'objectif du projet était de fusionner les fichiers d'autorité GKD, PND et SWD précédemment gérés séparément et le fichier DMA-EST. Un format de données commun devrait être mis en œuvre et les différences existantes dans les réglementations devraient être harmonisées.

La création de notices d'autorité était autrefois basée sur différents ensembles de règles. Il s'agissait des « Rules for Alphabetical Cataloging » (RAK-WB et RAK-Musik) pour l'indexation formelle et des « Rules for Keyword Cataloging » (RSWK) pour l'indexation du contenu.. Les règles incohérentes de création de la désignation préférée pour l'indexation formelle et de contenu ont conduit à des ensembles de données redondants dans le GKD et le SWD, en particulier dans le domaine des collectivités, des congrès et des matériaux géographiques. Par conséquent, des règles transitoires ont été élaborées pour le GND pour les cas où les règles d'indexation formelle et de contenu s'écartent l'une de l'autre, ce qui permet l'utilisation conjointe des enregistrements de données d'autorité. Les règles transitoires tiennent déjà compte autant que possible des réglementations de la RDA ( Ressource Description and Access ) .

Les formats de données des fichiers d'autorité, tant les formats internes que les formats d'échange, différaient également considérablement dans certains cas. Le format d'échange GND est basé sur MARC 21 Authority. En fusionnant tous les enregistrements de données d'autorité dans le GND, les différences de format existantes pourraient être surmontées. Cependant, les ensembles de données parallèles existants provenant des différents fichiers d'autorité ne peuvent être fusionnés qu'au fil du temps.

Dans le projet Virtual International Authority File (VIAF), le GND est virtuellement combiné avec d'autres fichiers d'autorité pour former un fichier d'autorité international.

Contenu

Les données sont constituées d'entités et de déclarations à leur sujet. Chaque entité a un type d'entité et au moins un identifiant.

Propriétés d'un enregistrement

Chaque enregistrement décrit une entité.

type d'entité

Les types d'entités répertoriés ici correspondent à ce que l'on appelle des types d'enregistrement ( type d'enregistrement de données ) dans les bibliothèques .

Dans le fichier d'autorité commun, un numéro d'identification unique (IDN ou PPN ; base de l' Uniform Resource Identifier dans le système de production), un terme préféré normalisé (anciennement également : forme autorisée ), différentes formes de noms (synonymes) et divers attributs descriptifs sont enregistrées pour chaque description d'entité . Si possible, les attributs sont stockés sous forme de relations avec d'autres enregistrements de données d'autorité, le type de relation étant codé dans chaque cas. [2]Des exemples d'attributs connexes sont les lieux de naissance et de décès des personnes et leurs professions. Pour les entreprises, par ex. Les relations de prédécesseur et de successeur, mais aussi les superordonnés administratifs sont spécifiés. Dans le cas des termes de sujet, les termes génériques et les termes apparentés sont liés. Cela signifie que la littérature sur des sujets connexes peut également être trouvée lors d'une recherche dans un catalogue de bibliothèque. Un traitement sémantique et thématique riche et précis (selon le sujet aussi : orienté dogmatiquement ) des entrées GND les unes par rapport aux autres profite à la qualité de la recherche .

De cette manière, un réseau sémantique d'ensembles de données connexes ( données liées ) est créé, qui est particulièrement adapté à une utilisation sur le Web, permet la navigation dans le fichier d'autorité et améliore ainsi les options de recherche pour les utilisateurs.

Fin août 2019, l'utilisation des phrases Tn pour les noms personnels a été abandonnée. [3] Un an plus tard, à compter du 19 juin 2020, les liens entre les notices Tn dans les données bibliographiques ont été rétrospectivement supprimés. La raison en était la qualité généralement médiocre des phrases Tn. Beaucoup n'étaient qu'à un très bas niveau de catalogage. Il était souvent difficile de savoir à quelle personne un ensemble de données pouvait être attribué, de sorte que les données n'étaient pas désambiguïsées. Il y avait des doublons et des liens incorrects vers des données bibliographiques. Au lieu de liens, il n'y a plus que des chaînes de texte dans les données bibliographiques. Depuis juillet 2020, les notices nominatives ne font plus partie du fichier d'autorité commun. [4]

sous-types d'entité

Outre les noms personnels, chaque type d'enregistrement peut être davantage différencié en spécifiant un code d'entité [5] . Par exemple, une entité géographique peut être un état ou un bâtiment. Un total de six types d'entités sont disponibles, qui sont divisés en environ 50 sous-types.

codage d'entité

identifiant d'entité

Chaque entité peut être clairement identifiée par au moins un identifiant (GND-ID). Chaque identifiant est composé des caractères 0 à 9, X et d'un trait d'union. Un identifiant pour une entité de type d'entité p se compose de 9 ou 10 caractères, il commence toujours par un 1 suivi de 8 ou 9 chiffres et se termine par un caractère de contrôle 0-9 ou X.

niveau de catalogage

Chaque notice est associée à un niveau de catalogage compris entre 1 et 6. Plus le nombre est bas, plus le niveau de l'entrée GND est élevé et mieux l'ensemble de données est traité. La norme lors de la création d'un nouveau dossier de données personnelles est initialement le niveau 3 (Tp3).

Application des termes du sujet

La désignation privilégiée est toujours basée sur les ouvrages répertoriés dans la « Liste des ouvrages techniques de référence pour le fichier d'autorité commun ». [7] La ​​dénomination préférée des termes de sujet dans le GND suit l'usage général tel qu'il est utilisé dans les encyclopédies ( Brockhaus , Meyer , alternativement aussi Wikipedia) est détectable ; dans des cas exceptionnels, des termes issus du jargon technique sont utilisés. Les synonymes peuvent être inclus dans les entrées en tant que variantes ou quasi-synonymes. Tant qu'il n'y a pas assez de titres pour un sujet, on essaie d'abord d'exprimer de nouveaux faits en combinant plusieurs termes de sujet déjà disponibles dans une séquence de mots-clés afin d'éviter autant que possible de nouvelles entrées (ce qu'on appelle le contrôle de décomposition). Cela maintient la continuité avec le mot-clé d'un sujet dans la littérature ancienne, de sorte qu'une référence à des titres plus anciens peut être établie. Ce n'est que lorsque la littérature sur un sujet a atteint une certaine étendue qu'un nouveau terme technique est introduit. Si l'utilisation de la langue change, le terme préféré peut être ajusté.

Portée

Les quantités peuvent être trouvées dans les rapports annuels de la DNB et les extraits de données de la GND [8] .

Nombre d'entités par type d'entité au fil du temps

Le fichier d'autorité commun contient environ 8,9 millions d'enregistrements (au 13 juin 2021) des types d' entités suivants :

Identifiants et enregistrements de routage

Au 13 juin 2021, 465 790 enregistrements de déviation étaient publiés au format RDF (JSON-LD) sur open.dnb.de/opendata. Cela signifie que certains enregistrements de données peuvent être référencés via plusieurs identifiants GND.

tripler

Au 13 juin 2021 à 13h20 UTC, les fichiers "authorities_lds" contiennent 163 131 042 triplets dans 8 920 450 enregistrements. [21]

Utilisation et interfaces

Le fichier d'autorité commun est conservé à la Bibliothèque nationale allemande. Les réseaux de bibliothèques ont importé le stock de base GND dans leurs systèmes de réseau une fois et ont depuis obtenu les mises à jour du fichier d'autorité via le processus OAI . Le GND n'est pas seulement édité et enrichi par les bibliothèques, mais aussi par les archives (jusqu'à présent principalement par les archives scientifiques et littéraires), les musées et les éditeurs d'ouvrages de référence. La collaboration s'effectue soit par le biais d'associations de bibliothèques, soit après consultation de la Bibliothèque nationale allemande. L'utilisation par les archives nationales et municipales ne fait que commencer (à partir de 2015).

Les données de l'autorité GND sont disponibles gratuitement sur le site de la DNB aux formats MARC 21 Authority, MARC21-xml et RDFxml sous licence CC0 1.0 .

Intégration interinstitutionnelle des données d'autorité

Combinaison de diverses sources sur Franz Beckenbauer en utilisant le format BEACON

En décembre 2012, un projet de coopération entre la Bibliothèque nationale allemande (DNB) et l' Institut allemand du film (DIF) a été lancé sous le nom d'Intégration interinstitutionnelle des données normatives (IN2N). L'objectif du projet, financé par la Fondation allemande pour la recherche (DFG), est de soutenir les institutions non bibliothécaires dans l'utilisation du GND et de les impliquer dans l'indexation. [22] Entre autres choses, dans le cadre du projet, les ensembles de données de filmportal.de ont été comparés avec les articles personnels de Wikipedia . [23]

Fin 2014, les données standard du DIF ont été importées dans le GND. Dans les mois précédents, des données de l' Institut ibéro-américain (Berlin) et du Centre de recherche pour l'Europe de l'Est de l'Université de Brême, entre autres, avaient déjà été transférées au GND. Depuis le 6 mai 2016, les Wikipédiens ayant suivi une formation adaptée peuvent créer des données d'autorité pour les particuliers via le « formulaire web GND ». L'identifiant de bibliothèque correspondant est Wikimedia Germany (DE-B1592).

Littérature

  • Renate Behrens-Neumann : Le fichier d'autorité commun (GND). Un projet touche à sa fin. In : Dialogue avec les bibliothèques. Volume 24, Numéro 1, 2012, ISSN  0936-1138 , p. 25–28, ( PDF; 130 ko ).
  • Eva-Maria Gulder : Le fichier d'autorité commun (GND). Bibliothèque d'État de Bavière de Munich (édition standard des données), septembre 2011, ( PDF; 2,84 Mo ).
  • Thekla Kluttig : Fichier d'autorité commun et archives - à quoi ça sert ? Dans : Clemens Rehm, Monika Storm, Andrea Wettmann (eds.) : Estates - Nouvelles voies de la tradition dans le réseau. Conférence de printemps commune FG 1 et FG 6 pour tous les groupes de spécialistes du VdA. 7 mai 2013, Archives d'État de Chemnitz (= publications des Archives d'État de Saxe. Série A : répertoires d'archives, éditions et articles spécialisés. 17). Mitteldeutscher Verlag, Halle (Saale) 2014, ISBN 978-3-95462-388-4 , p. 85–88.
  • Barbara Pfeifer : Du projet à l'action. Le fichier d'autorité commun (GND). Dans : Klaus-Rainer Brintzinger, Ulrich Hohoff (eds.) : Bibliothèques : Portes vers le monde de la connaissance. 101e Journée des bibliothécaires allemands à Hambourg 2012. Olms, Hildesheim et autres. 2013, ISBN 978-3-487-14888-5 , p. 80–91.
  • Fabian Steeg, Adrian Pohl, Pascal Christoph : lobid-gnd - Une interface vers le fichier d'autorité commun pour l'homme et la machine . Dans : Pratique de l'information . ruban 5 , non. 1 , 2019, ISSN  2297-3249 , doi : 10.11588/ip.2019.1.52673 ( uni-heidelberg.de ).
  • Brigitte Wiechmann : Le fichier d'autorité commun (GND). Rétrospective et Prospective. In : Dialogue avec les bibliothèques. Volume 24, Numéro 2, 2012, p. 20–22, ( PDF; 465 ko ).

liens web

les détails

  1. Renate Behrens, Christine Frodl : Premiers jalons du projet RDA. In : Dialogue avec les bibliothèques. Volume 26, numéro 1, 2014, pages 25 à 31, ici page 28, ( PDF ; 310 ko ).
  2. GND : Liste des encodages dans la sous-zone $4 - alphabétiquement par code ( Memento du 23 septembre 2015 aux Internet Archive ).
  3. L'abréviation « Tn » signifie Thesaurus Name et désigne des ensembles de données de noms non individualisés. Marqué comme « indifférencié » dans VIAF .
  4. "Suppression des données d'autorité Tn dans le GND avec effet sur les données de titre de la DNB" , 28 mai 2020. Date d'accès : 14 juillet 2020.
  5. GND Entity Encoding Allocation Guidelines ( mémento du 23 septembre 2015 sur Internet Archive ) (en date du 21 juin 2013).
  6. "Entity Coding - Award Guidelines" (en date du 15 novembre 2018)
  7. ^ "Liste des ouvrages de référence spécialisés pour le fichier d'autorité commun (GND)" ( DNB 1037142683 ).
  8. https://data.dnb.de/opendata/
  9. Bibliothèque nationale allemande – Rapport annuel 2015 , p. 49. Récupéré le 3 juin 2016.
  10. Bibliothèque nationale allemande – Rapport annuel 2016 , page 51. Consulté le 13 avril 2019.
  11. Bibliothèque nationale allemande – Rapport annuel 2017 , page 51. Consulté le 13 avril 2019.
  12. Bibliothèque nationale allemande – Rapport annuel 2018 , p. 49. Récupéré le 27 janvier 2020.
  13. Bibliothèque nationale allemande – Rapport annuel 2019 , p. 49. Récupéré le 24 juin 2020.
  14. data.dnb.de , au 13 février 2020. Date d'accès : 2 juillet 2020.
  15. data.dnb.de , au : 22 juin 2020. Date d'accès : 15 juillet 2020.
  16. data.dnb.de , au 13 octobre 2020 à 12h20 UTC. Date d'accès : 20 février 2021.
  17. Bibliothèque nationale allemande – Rapport annuel 2020 , p. 49. Récupéré le 3 juillet 2021.
  18. data.dnb.de , au 13 février 2021 à 13h20 UTC. Date d'accès : 5 mars 2021.
  19. data.dnb.de , statut : 13 juin 2021 12:20 UTC. Date d'accès : 3 juillet 2021.
  20. data.dnb.de , au 13 octobre 2021 12:20 UTC. Publié 2021-11-23 12:57--13:08. Date d'accès : 3 décembre 2021.
  21. https://data.dnb.de/opendata/
  22. IN2N ( Memento du 12 août 2015 dans Internet Archive ), Deutsches Filminstitut , Date de la requête : 21 novembre 2013.
  23. Alexander Haffner : Intégration interinstitutionnelle des données d'autorité (IN2N). In : Dialogue avec les bibliothèques. Volume 25, Numéro 2, 2013, p. 42–45, ( PDF; 54 ko ).