Un projet d'outil en JAVA pour évaluer la qualité des données enregistrées dans des collections de records MARC
Les différentes méthodes pour exposer des métadonnées de manière à ce que Zotero puisse les récupérer.
Voir plus particulièrement la partie Using an Open Standard for Exposing Metadata.
Permet d'obtenir un historique complet et correct d'une revue imprimée ou électronique. Développé pour améliorer les données lacunaires des éditeurs et fournisseurs.
via https://twitter.com/liowalter/status/846771845428887553
Un outil pour convertir du MARC vers BIBFRAME 2.0, développé par la LoC et Indexdata (FOLIO).
via https://twitter.com/OsmaSuominen/status/841590183229308928
FAQ :
Qu'est-ce que dissem.in ?
Dissemin est une plateforme web qui récolte des métadonnées à partir de différentes sources et qui détermine la disponibilité du texte intégral des publications des chercheurs. Il a été conçu pour encourager l'usage des dépôts (plutôt que les pages personnelles), et ce pour de nombreuses raisons.
Dissem.in est-il un dépôt ?
Dissemin n'est pas un dépôt, car il ne stocke pas le texte intégral des articles. Quand le texte intégral d'un article est disponible quelque part, il fournit un lien vers l'article. Les documents déposés via Dissemin sont hébergés par des dépôts tiers tels que Zenodo ou HAL.
via : https://twitter.com/ccsd_fr/status/837757546895126528
When it comes to metadata hunting, better bring your dog with!
Terrier is used to retrieve metadata of scholarly works from a variety of sources.
Les métadonnées de RERO (sauf ce qui appartient à des tiers) publiquement sur le Web, en CC-0. Chaque ressource a une URI.
Concerne :
À noter que RERO.DOC intègre des données décrites selon l'ontologie schema.org.
Un outil qui peut servir comme créateur de SIP (Submission Information Package) :
Le tutoriel officiel pour numériser un vinyle avec Audacity. On peut dire qu'il est complet. On reconnaît là la qualité d'un logiciel... :)
La documentation pour la configuration d'abcde. Il faut également fouiller la doc pour le téléchargement et l'ajout des images dans les métadonnées : http://www.andrews-corner.org/getalbumart.html.
C'est l'encodeur qui me convient le mieux, parce qu'éditer les métadonnées avec vim est vraiment un plus...
en.wikipedia : "JSON Schema specifies a JSON-based format to define the structure of JSON data for validation, documentation, and interaction control. A JSON Schema provides a contract for the JSON data required by a given application, and how that data can be modified."
Une liste intéressante de problèmes liés au format MARC, lorsqu'il s'agit de le parser.
Un plugin pour Pelican pour ajouter les microdata de schema.org
Profil de métadonnées, de type microdata, développé par un certain nombre d'acteurs, dont Google, mais pas que.
Ce sont des données qui s'intègre au contenu de page Web pour préciser la nature de certaines informations : est-ce un événement ? une date ? une personne ? quel est son job ? le titre du livre ? etc.
L'information est traitée par les moteurs de recherche.
Comment intégrer des microdata (schema.org et COinS) dans un site généré par Jekyll.
HDF5 is a data model, library, and file format for storing and managing data. It supports an unlimited variety of datatypes, and is designed for flexible and efficient I/O and for high volume and complex data. HDF5 is portable and is extensible, allowing applications to evolve in their use of HDF5. The HDF5 Technology suite includes tools and applications for managing, manipulating, viewing, and analyzing data in the HDF5 format.
EDIT : https://fr.wikipedia.org/wiki/Hierarchical_Data_Format
The RDA Metadata Standards Directory Working Group is supported by individuals and organizations involved in the development, implementation, and use of metadata for scientific data. The overriding goal is to develop a collaborative, open directory of metadata standards applicable to scientific data can help address infrastructure challenges.
Validation, conversion, display, and search of tabular data on the web requires additional metadata that describes how the data should be interpreted. This document defines a vocabulary for metadata that annotates tabular data. This can be used to provide metadata at various levels, from groups of tables and how they relate to each other down to individual cells within a table.
The metadata defined in this specification is used to provide annotations on an annotated table or group of tables, as defined in [tabular-data-model]. Annotated tables form the basis for all further processing, such as validating, converting, or displaying the tables.
Bien souvent, les modèles de communication sont tout aussi importants que leur contenu même. Par exemple, le simple fait qu'Alice téléphone chaque semaine à un terroriste connu est plus important que le détail de leurs conversations. Les Nazis ont utilisés des données d'analyse de trafic extraites de factures de téléphone françaises détaillées pour arrêter les amis de personnes déjà incarcérées.
SCHNEIER, Bruce, 2001. Secrets et mensonges: sécurité numérique dans un monde en réseau. Paris : Vuibert. ISBN 2711786846. p. 35
via http://sebsauvage.net/links/?Y2a8Dw
3 caractéristiques essentielles pour des métadonnées de qualité :
1- Il doit être possible de les parser, ce qui signifie qu'elles doivent avoir un séparateur (XML, accolade JSON, pipe, tabulation...).
2- Une bonne granularité, jamais deux données dans le même champs (nom, prénom).
3- Consistance. Les incohérences empêchent le traitement massif des données.
Articles mentionnés dans le billet :
MARC Must Die (2002) http://lj.libraryjournal.com/2002/10/ljarchives/marc-must-die/
A bibliographic metadata infrastructure for the twenty‐first century (2014) http://www.emeraldinsight.com/doi/abs/10.1108/07378830410524602
"BibJSON is a convention for representing bibliographic metadata in JSON; it makes it easy to share and use bibliographic metadata online."
Un outil pour nettoyer les métadonnées d'un certain nombre de fichiers. Il ne s'agit pas vraiment d'anonymisation, mais de nettoyage des métadonnées, ce n'est pas exactement la même chose.
via : http://www.petitetremalfaisant.eu/shaarli/?8ZfKww ← http://sebsauvage.net/links/?ySfn2Q
Depuis quelques années j'utilise deux logiciels pour gérer et écouter la collection de fichiers audio qui enfle dans mes disques durs : Gmusicbrower en local, et Subsonic pour un accès à distance, et multi-utilisateur, permettant à chacun de downloader, d'uploader, de gérer ses favoris, ses playlists...). Mon rêve serait d'avoir la puissance en terme d'organisation et de recherche de Gmusicbrowser et les possibilités de Subsonic. Et si on pouvait se passer de flash, ce serait un plus.
Je me suis mis à découvrir MPD et c'est très bien fait, très utile. Mais je n'ai pas encore réussi à vérifier si plusieurs utilisateurs pourraient écouter leurs propres choix musicaux à partir du même serveur, indépendamment les uns des autres. Et pour l'instant, les clients que j'ai pu essayer ne permettent pas des recherches aussi complexes que Gmusicbrowser (notamment le fait d'avoir plusieurs genres pour un disque/morceau).
Je ne connais pas grand chose à la programmation ou au développement de logiciels, mais il faut vraiment que je m'attelle à faire une description la plus claire possible de ce rêve.
Mais déjà, si vous connaissez des logiciels allant dans cette direction, faites-le moi savoir ! :-)
Outil d'extraction automatique de metadata, open source. Extrait les metadata de conservation et les écrit dans un fichier XML. Pour MS Word 2, MS Word 6, Word Perfect, Open Office, MS Works, MS Excel, MS PowerPoint, TIFF, JPEG, WAV, MP3, HTML, PDF, GIF, et BMP.
Une base de données collectant les metadata des données primaires de la recherche. Notamment un formulaire de soumission.
Metadata
Générateur de metadata Dublin Core, simple à utiliser.
Binary package hint: sound-juicer
Sound Juicer gets track lists from MusicBrainz (a great feature). However, if the CD matches a release in MusicBrainz that has two or more associated CDs, then Sound Juicer downloads all of the tracks, and won't rip properly. For the first CD, the tracks line up but there are an excess, which seem to get recorded repeatedly at the end. For the second and subsequent CDs, they don't line up. Sound Juicer will try to overwrite the first few tracks with the trac...