3 caractéristiques essentielles pour des métadonnées de qualité :
1- Il doit être possible de les parser, ce qui signifie qu'elles doivent avoir un séparateur (XML, accolade JSON, pipe, tabulation...).
2- Une bonne granularité, jamais deux données dans le même champs (nom, prénom).
3- Consistance. Les incohérences empêchent le traitement massif des données.
Articles mentionnés dans le billet :
MARC Must Die (2002) http://lj.libraryjournal.com/2002/10/ljarchives/marc-must-die/
A bibliographic metadata infrastructure for the twenty‐first century (2014) http://www.emeraldinsight.com/doi/abs/10.1108/07378830410524602
"BibJSON is a convention for representing bibliographic metadata in JSON; it makes it easy to share and use bibliographic metadata online."
Un outil pour nettoyer les métadonnées d'un certain nombre de fichiers. Il ne s'agit pas vraiment d'anonymisation, mais de nettoyage des métadonnées, ce n'est pas exactement la même chose.
via : http://www.petitetremalfaisant.eu/shaarli/?8ZfKww ← http://sebsauvage.net/links/?ySfn2Q
Depuis quelques années j'utilise deux logiciels pour gérer et écouter la collection de fichiers audio qui enfle dans mes disques durs : Gmusicbrower en local, et Subsonic pour un accès à distance, et multi-utilisateur, permettant à chacun de downloader, d'uploader, de gérer ses favoris, ses playlists...). Mon rêve serait d'avoir la puissance en terme d'organisation et de recherche de Gmusicbrowser et les possibilités de Subsonic. Et si on pouvait se passer de flash, ce serait un plus.
Je me suis mis à découvrir MPD et c'est très bien fait, très utile. Mais je n'ai pas encore réussi à vérifier si plusieurs utilisateurs pourraient écouter leurs propres choix musicaux à partir du même serveur, indépendamment les uns des autres. Et pour l'instant, les clients que j'ai pu essayer ne permettent pas des recherches aussi complexes que Gmusicbrowser (notamment le fait d'avoir plusieurs genres pour un disque/morceau).
Je ne connais pas grand chose à la programmation ou au développement de logiciels, mais il faut vraiment que je m'attelle à faire une description la plus claire possible de ce rêve.
Mais déjà, si vous connaissez des logiciels allant dans cette direction, faites-le moi savoir ! :-)
Outil d'extraction automatique de metadata, open source. Extrait les metadata de conservation et les écrit dans un fichier XML. Pour MS Word 2, MS Word 6, Word Perfect, Open Office, MS Works, MS Excel, MS PowerPoint, TIFF, JPEG, WAV, MP3, HTML, PDF, GIF, et BMP.
Générateur de metadata Dublin Core, simple à utiliser.
Binary package hint: sound-juicer
Sound Juicer gets track lists from MusicBrainz (a great feature). However, if the CD matches a release in MusicBrainz that has two or more associated CDs, then Sound Juicer downloads all of the tracks, and won't rip properly. For the first CD, the tracks line up but there are an excess, which seem to get recorded repeatedly at the end. For the second and subsequent CDs, they don't line up. Sound Juicer will try to overwrite the first few tracks with the trac...