shaarliGor

GitHub - pkiraly/metadata-qa-marc: Metadata assessment for MARC records

2017-12-14T13:17:46+01:00

Un projet d'outil en JAVA pour évaluer la qualité des données enregistrées dans des collections de records MARC

— Permalink

dev:exposing_metadata [Zotero Documentation]

2017-06-17T12:34:41+02:00

Les différentes méthodes pour exposer des métadonnées de manière à ce que Zotero puisse les récupérer.

Voir plus particulièrement la partie Using an Open Standard for Exposing Metadata.

— Permalink

« Métarevues » : un outil dédié au traitement des périodiques | Punktokomo ;

2017-03-29T07:10:25+02:00

Permet d'obtenir un historique complet et correct d'une revue imprimée ou électronique. Développé pour améliorer les données lacunaires des éditeurs et fournisseurs.

via https://twitter.com/liowalter/status/846771845428887553

— Permalink

lcnetdev/marc2bibframe2: Convert MARC records to BIBFRAME2 RDF

2017-03-14T12:08:11+01:00

Un outil pour convertir du MARC vers BIBFRAME 2.0, développé par la LoC et Indexdata (FOLIO).

via https://twitter.com/OsmaSuominen/status/841590183229308928

— Permalink

dissemin

2017-03-04T08:46:47+01:00

FAQ :

Qu'est-ce que dissem.in ?

Dissemin est une plateforme web qui récolte des métadonnées à partir de différentes sources et qui détermine la disponibilité du texte intégral des publications des chercheurs. Il a été conçu pour encourager l'usage des dépôts (plutôt que les pages personnelles), et ce pour de nombreuses raisons.

Dissem.in est-il un dépôt ?

Dissemin n'est pas un dépôt, car il ne stocke pas le texte intégral des articles. Quand le texte intégral d'un article est disponible quelque part, il fournit un lien vers l'article. Les documents déposés via Dissemin sont hébergés par des dépôts tiers tels que Zenodo ou HAL.

via : https://twitter.com/ccsd_fr/status/837757546895126528

— Permalink

Authorea/terrier: Pull meta information from scholarly articles

2017-02-01T16:38:48+01:00

When it comes to metadata hunting, better bring your dog with!

Terrier is used to retrieve metadata of scholarly works from a variety of sources.

— Permalink

Les réservoirs de métadonnées de RERO

2016-12-06T09:14:52+01:00

Les métadonnées de RERO (sauf ce qui appartient à des tiers) publiquement sur le Web, en CC-0. Chaque ressource a une URI.

Concerne :

le catalogue collectif
RERO.DOC

À noter que RERO.DOC intègre des données décrites selon l'ontologie schema.org.

— Permalink

DataAccessioner

2016-06-09T09:18:15+02:00

Un outil qui peut servir comme créateur de SIP (Submission Information Package) :

checksums
metadata (FITS)
création d'un fichier XML avec les métadonnées

— Permalink

Sample workflow for LP digitization - Audacity Manual

2016-02-28T19:58:30+01:00

Le tutoriel officiel pour numériser un vinyle avec Audacity. On peut dire qu'il est complet. On reconnaît là la qualité d'un logiciel... :)

— Permalink

abcde: Command Line Music CD Ripping for Linux

2016-02-27T08:18:29+01:00

La documentation pour la configuration d'abcde. Il faut également fouiller la doc pour le téléchargement et l'ajout des images dans les métadonnées : http://www.andrews-corner.org/getalbumart.html.

C'est l'encodeur qui me convient le mieux, parce qu'éditer les métadonnées avec vim est vraiment un plus...

— Permalink

JSON Schema and Hyper-Schema

2015-12-15T09:22:49+01:00

en.wikipedia : "JSON Schema specifies a JSON-based format to define the structure of JSON data for validation, documentation, and interaction control. A JSON Schema provides a contract for the JSON data required by a given application, and how that data can be modified."

— Permalink

MARC Problems - Code4Lib

2015-12-12T06:57:21+01:00

Une liste intéressante de problèmes liés au format MARC, lorsqu'il s'agit de le parser.

— Permalink

noirbizarre/pelican-microdata

2015-11-26T08:15:41+01:00

Un plugin pour Pelican pour ajouter les microdata de schema.org

— Permalink

schema.org

2015-11-26T08:08:01+01:00

Profil de métadonnées, de type microdata, développé par un certain nombre d'acteurs, dont Google, mais pas que.

Ce sont des données qui s'intègre au contenu de page Web pour préciser la nature de certaines informations : est-ce un événement ? une date ? une personne ? quel est son job ? le titre du livre ? etc.

L'information est traitée par les moteurs de recherche.

— Permalink

Now with schema.org and COinS structured metadata | Miskatonic University Press

2015-11-26T08:05:41+01:00

Comment intégrer des microdata (schema.org et COinS) dans un site généré par Jekyll.

— Permalink

HDF Group - HDF5

2015-10-26T10:34:01+01:00

HDF5 is a data model, library, and file format for storing and managing data. It supports an unlimited variety of datatypes, and is designed for flexible and efficient I/O and for high volume and complex data. HDF5 is portable and is extensible, allowing applications to evolve in their use of HDF5. The HDF5 Technology suite includes tools and applications for managing, manipulating, viewing, and analyzing data in the HDF5 format.

EDIT : https://fr.wikipedia.org/wiki/Hierarchical_Data_Format

— Permalink

Metadata Directory

2015-10-26T10:25:55+01:00

The RDA Metadata Standards Directory Working Group is supported by individuals and organizations involved in the development, implementation, and use of metadata for scientific data. The overriding goal is to develop a collaborative, open directory of metadata standards applicable to scientific data can help address infrastructure challenges.

— Permalink

Metadata Vocabulary for Tabular Data

2015-06-04T15:17:29+02:00

Validation, conversion, display, and search of tabular data on the web requires additional metadata that describes how the data should be interpreted. This document defines a vocabulary for metadata that annotates tabular data. This can be used to provide metadata at various levels, from groups of tables and how they relate to each other down to individual cells within a table.

The metadata defined in this specification is used to provide annotations on an annotated table or group of tables, as defined in [tabular-data-model]. Annotated tables form the basis for all further processing, such as validating, converting, or displaying the tables.

— Permalink

Citation de Bruce Schneier sur l'importance des metadata en matière de surveillance.

2015-04-17T16:52:56+02:00

Bien souvent, les modèles de communication sont tout aussi importants que leur contenu même. Par exemple, le simple fait qu'Alice téléphone chaque semaine à un terroriste connu est plus important que le détail de leurs conversations. Les Nazis ont utilisés des données d'analyse de trafic extraites de factures de téléphone françaises détaillées pour arrêter les amis de personnes déjà incarcérées.

SCHNEIER, Bruce, 2001. Secrets et mensonges: sécurité numérique dans un monde en réseau. Paris : Vuibert. ISBN 2711786846. p. 35

— Permalink

Convert JSON to YAML

2015-04-07T10:45:08+02:00

via http://sebsauvage.net/links/?Y2a8Dw

— Permalink

One Format to Rule Them All - The Digital Shift

2014-12-09T06:45:00+01:00

3 caractéristiques essentielles pour des métadonnées de qualité :

1- Il doit être possible de les parser, ce qui signifie qu'elles doivent avoir un séparateur (XML, accolade JSON, pipe, tabulation...).
2- Une bonne granularité, jamais deux données dans le même champs (nom, prénom).
3- Consistance. Les incohérences empêchent le traitement massif des données.

Articles mentionnés dans le billet :
MARC Must Die (2002) http://lj.libraryjournal.com/2002/10/ljarchives/marc-must-die/
A bibliographic metadata infrastructure for the twenty‐first century (2014) http://www.emeraldinsight.com/doi/abs/10.1108/07378830410524602

— Permalink

BibJSON

2014-06-19T07:57:26+02:00

"BibJSON is a convention for representing bibliographic metadata in JSON; it makes it easy to share and use bibliographic metadata online."

— Permalink

MAT: Metadata Anonymisation Toolkit

2013-11-18T17:09:53+01:00

Un outil pour nettoyer les métadonnées d'un certain nombre de fichiers. Il ne s'agit pas vraiment d'anonymisation, mais de nettoyage des métadonnées, ce n'est pas exactement la même chose.

via : http://www.petitetremalfaisant.eu/shaarli/?8ZfKww ← http://sebsauvage.net/links/?ySfn2Q

— Permalink

Musique : le logiciel en réseau de mes rêves

2013-08-09T07:04:45+02:00

Depuis quelques années j'utilise deux logiciels pour gérer et écouter la collection de fichiers audio qui enfle dans mes disques durs : Gmusicbrower en local, et Subsonic pour un accès à distance, et multi-utilisateur, permettant à chacun de downloader, d'uploader, de gérer ses favoris, ses playlists...). Mon rêve serait d'avoir la puissance en terme d'organisation et de recherche de Gmusicbrowser et les possibilités de Subsonic. Et si on pouvait se passer de flash, ce serait un plus.
Je me suis mis à découvrir MPD et c'est très bien fait, très utile. Mais je n'ai pas encore réussi à vérifier si plusieurs utilisateurs pourraient écouter leurs propres choix musicaux à partir du même serveur, indépendamment les uns des autres. Et pour l'instant, les clients que j'ai pu essayer ne permettent pas des recherches aussi complexes que Gmusicbrowser (notamment le fait d'avoir plusieurs genres pour un disque/morceau).

Je ne connais pas grand chose à la programmation ou au développement de logiciels, mais il faut vraiment que je m'attelle à faire une description la plus claire possible de ce rêve.

Mais déjà, si vous connaissez des logiciels allant dans cette direction, faites-le moi savoir ! :-)

— Permalink

Metadata Extraction Tool — National Library of New Zealand

2012-06-22T14:36:53+02:00

Outil d'extraction automatique de metadata, open source. Extrait les metadata de conservation et les écrit dans un fichier XML. Pour MS Word 2, MS Word 6, Word Perfect, Open Office, MS Works, MS Excel, MS PowerPoint, TIFF, JPEG, WAV, MP3, HTML, PDF, GIF, et BMP.

— Permalink

BioProject and BioSample databases at NCBI: facilitating capture and organization of metadata

2012-06-09T09:15:37+02:00

Une base de données collectant les metadata des données primaires de la recherche. Notamment un formulaire de soumission.

— Permalink

PREMIS: Preservation Metadata Maintenance Activity (Library of Congress)

2012-05-30T11:05:07+02:00

Metadata

— Permalink

UKOLN: DC-dot Dublin Core metadata editor

2012-03-20T08:17:46+01:00

Générateur de metadata Dublin Core, simple à utiliser.

— Permalink

Bug #797473 in sound-juicer (Ubuntu): “Unable to rip both CDs in a set after MusicBrainz NGS update”

2012-01-10T21:08:12+01:00

Binary package hint: sound-juicer

Sound Juicer gets track lists from MusicBrainz (a great feature). However, if the CD matches a release in MusicBrainz that has two or more associated CDs, then Sound Juicer downloads all of the tracks, and won't rip properly. For the first CD, the tracks line up but there are an excess, which seem to get recorded repeatedly at the end. For the second and subsequent CDs, they don't line up. Sound Juicer will try to overwrite the first few tracks with the trac...

— Permalink