Outils pour utilisateurs

Outils du site


lectures:bring-gokb-to-life

Bringing GOKb to Life

Référence

WILSON, Kristen, 2015. Bringing GOKb to Life: Data, Integrations, and Development. In : [en ligne]. Against the Grain. 22 septembre 2015. pp. 607‑613. [Consulté le 6 janvier 2016]. ISBN 978-1-941269-03-9. Disponible à l’adresse : http://docs.lib.purdue.edu/charleston/2014/Tech/10/

PDF - Zotero

Notes

Why GOKb ?

Maintenance de la Kb prend bcp de temps. Les outils commerciaux comportent souvent des erreurs, qui apparaissent soudainement. Les fournisseurs peuvent corriger rapidement. Souvent causé par les éditeurs eux-mêmes. Lorsque ceux-ci ont été contactés, ne semble pas se préoccuper de ce problème : ils vendent du contenu (articles…) et pas des métadonnées.

Lorsqu'une bib signale les problèmes à un vendeur, rend service aux autres clients, mais pas au bib qui passent par un autre vendeur… Comment mieux mutualiser les efforts ? But premier de GOKb.

Autre but : pousser les éditeurs et les vendeurs à améliorer la qualité de leur données.

Donc : accès libre à la Kb + gestion communautaire. La Kb contient les infos nécessaires sur les ressources électroniques qui vont des éditeurs de contenu aux bibliothèques. Les bib peuvent directement influencer la qualité des données et contribuer à la Kb centrale.

Licence CC0 !

GOKb Data

Data Processing and Workflow

Utilisation d'OpenRefine, avec une extension GOKb : permet de travailler des fichiers de listes créées par les éditeurs et de les valider au moyen de règles prédéfinies (détection des erreurs, champs vides, libellés inconsistants, conflits d'ISSN, etc.) avant l'upload dans GOKb. Pour l'instant les fichiers sont téléchargés depuis les sites des éditeurs, mais devraient dans le futur être récoltées automatiquement, ou uploadés via l'outil de validation directement par les éditeurs partenaires.

Quand toutes erreurs ont étés résolues, la fonction upload est activée.

Travaille avec plusieurs formats, mais mets en avant les fichiers KBART-compliant. KBART : Knowledge Base and Related Tools, groupe qui établit des bonnes pratiques pour la gestion d'une Kb.

Puis acquisition dans GOKb. Reste éditable, via l'application Web. Après l'acquisition, il y a encore des tâches de vérification pour identifier les éventuelles erreurs.

Data Model

Amélioration des concepts existant dans le domaine.

Tous les enregistrements décrits ci-dessous sont reliés entre eux.

Description d'un titre (ex. revue), avec données administratives, éditeur, dates from to, changement de noms, identifiants, liste des éditeurs actuels et passés, liste des packages qui le contiennent.

Aussi des notices sur les packages et les plateformes. GOKb fait le lien entre titre, package et plateforme dans un enregistrement nommé TIPP pour title instance package platform = l'entité acquise et gérée par une bib.

Enregistrements d'organisations : éditeurs, fournisseurs de contenu, fournisseurs de plateforme, vendeurs, licensors. Une orga peut avoir plusieurs rôles et être associées à d'autres enregistrements.

Un travail a été fait, d'abord sur ces orga, pour formater les données en LOD et en faire le lien avec d'autres sets comme le Library of Congress Name Authority File et le Virtual International Authority File.

Integration

GOKb = une application Web, mais aussi une API → intégration dans les systèmes locaux des utilisateurs. C'est le cas de Kuali OLE et Knowledge Base + (JISC).

Fonction première : permettre aux systèmes externes d'extraire les données de GOKb. Requêtes précises. Sur la base du protocole OAI-PMH.

Les utilisateurs autorisés peuvent aussi mettre à jour les données de la GOKb va l'API.

KB+ : dev par JISC, pour aider les bib UK de gérer les acquisitions de ressources électroniques. Donne des infos sur les publications, les abonnements et les licences. Ont produit leur propre Kb avec des données propre au marché UK, mais veulent gérer cette Kb directement dans GOKb, tout en permettant à leurs bibs d'éditer les données de KB+, dans le but de mutualiser les efforts.
Intégration en cours. Mais l'user de KB+ interroge GOKb via l'API. Crée un nouveau package local dans KB+ sur la base d'un package de GOKb, ou alors de fusionner un package GOKb avec un package local. Les données mergées sont mises à jour pour suivre l'évolution de GOKb.

Kuali OLE : modèle similaire. S'intègre au module de gestion des ressources électroniques pour la création des enregistrements de bib., holdings, orga et plateformes.

Coreferencing service : possibilité de rechercher un identifiant dans GOKb, et d'obtenir la liste des autres identifiants associés. Possibilité de rechercher dans un champ précis, comme ISSN… Soit via l'interface Web, ou avec des requêtes JSON ou XML.

GOKb Development

2e financement par la fondation Andrew W. Mellon, jusqu'en décembre 2015. Améliorer le processus d'upload des données avec OpenRefine. Le logiciel sera plus simple à télécharger et installer. Aller plus loin dans l'automatisation de l'acquisition des données, afin que les data manager puissent se concentrer sur la qualité des données et moins sur l'acquisition.

Améliorer la gestion de la communauté. Un tableau de bord pour que les users puissent avoir une vision globale de la santé du système, pour identifier rapidement les nouvelles contributions qui doivent être améliorées, les endroits où les données sont manquantes ou de mauvaises qualité. Etc.

Toujours améliorer les données sur l'histoire des titres, dates de publications réelles (actives). Pouvoir identifier les erreurs, conflits et les soumettre à vérification.

Nouvelles directions de développement :

  • intégration des metadata des eBook, en collaborant avec les bibliothécaires, vendeurs et éditeurs ;
  • exposer les principales entités en LOD, pour faire des connexions avec des vocabulaires existants. LOD est projet important.
  • collecter plus de données sur les publications open access et voir comment ces données pourraient soutenir des projets OA.

Community Building

Défi : atteindre une masse critique. Donc identifier de nouveaux partenaires, contributeurs. Quelques use cases partnership :

Les bib. : les collaborateurs clés. Actuellement : les institutions Kuali OLE. D'abord obtiennent les fichiers listes des fournisseurs, éditeurs et les uploadent dans GOKb. Nettoyent les données via l'application Web. Désire plus de bib partenaires, of course.

Les bib. pourraient aussi vouloir gérer les packages des consortiums. Les consortium ont souvent des difficultés pour garder la trace des titres qui font parties de leur deals et de communiquer cette infos à leurs membres et à d'autres Kb. Elles pourraient le faire via GOKb. Plus mutualisation des efforts entre les consortiums.

Les éditeurs : sont la sources de la plus grande partie des données, au début de la chaînes des métadonnées des ressources électroniques. [Donc pas que les éditeurs commerciaux, mais aussi OA…] Ceux-ci pourraient voir dans le travails des utilisateurs de GOKb une aide pour améliorer la qualité de leurs données. Et GOKb de devenir une plateforme de diffusion de ces métadonnées (aux Kb commerciales par exemple), sorte d'outsourcing du point de vue des éditeurs.

Les fournisseurs de Kb : GOKb ne se voit pas comme concurrent, mais comme collaborateur. Les Kb commerciales peuvent intégrer les données de GOKb dans leur produit, voir utiliser les identifiants GOKb, ou encore contribuer à GOKb…

Next Steps for GOKb

L'application Web, API et service de coreferencing disponible dès début 2015, sur base de la dernière version du logiciel et d'un set restreint de données, comme illustration, démo. Puis ajout de données, via les partenaires. Important d'ouvrir le projet avant même d'avoir suffisamment de données pour être vraiment utile, notamment pour le feedback.

lectures/bring-gokb-to-life.txt · Dernière modification: 2018/07/29 09:08 (modification externe)