Catalogue de graph réalisables avec R.
Un framework CSS pour PluXml. À tester.
3 caractéristiques essentielles pour des métadonnées de qualité :
1- Il doit être possible de les parser, ce qui signifie qu'elles doivent avoir un séparateur (XML, accolade JSON, pipe, tabulation...).
2- Une bonne granularité, jamais deux données dans le même champs (nom, prénom).
3- Consistance. Les incohérences empêchent le traitement massif des données.
Articles mentionnés dans le billet :
MARC Must Die (2002) http://lj.libraryjournal.com/2002/10/ljarchives/marc-must-die/
A bibliographic metadata infrastructure for the twenty‐first century (2014) http://www.emeraldinsight.com/doi/abs/10.1108/07378830410524602
De la doc assez complète et intéressante pour faire du text mining avec R
"Qu'est-ce que EthACK?
EthACK veut fournir des informations sur vos droits numériques, comment les protéger, qui tente de les réduire etc.
Vous allez donc trouver des articles parlant, par exemple, de la gestion de la vie privée, des meilleurs moyen de protéger vos données sur vos appareils, des liens vers des ressources utiles, etc.
Aussi, nous voulons pointer les problèmes d'éthique dans notre gouvernement, que ce soit sur Internet ou dans "la vie réelle". Nos politiciens ne font plus leur travail, la plupart d'entre eux travaillant pour des companies privées au lieu de travailler pour le Peuple. Ce n'est pas ainsi que cela devrait être.
Les contenus ne vont pas faire de miracles : il vous faudra les lire et, surtout, les comprendre de manière à trouver votre chemin dans la jungle que nous avons actuellement avec le data mining en ligne."
L'adresse IP de TPB. via Sebsauvage.
Edit : autres IPS
104.28.23.5
104.28.10.33
104.28.13.40
104.28.10.31
37.187.121.167
104.28.23.65
104.28.15.20
194.71.107.80
via ecitram
ARK (Archival Ressource Key) est un identifiant unique pour l'archivage de ressources électroniques, un peu comme le DOI, mais plus ouvert et libre.
"A free and open-source software project launched in 2011, PressForward enables teams of researchers to aggregate, filter, and disseminate relevant scholarship using the popular WordPress web publishing platform. Just about anything available on the open web is fair game: traditional journal articles, conference papers, white papers, reports, scholarly blogs, and digital projects."
Un tuto pour faire un wordcloud avec R
Edit : le package tm a changé donc on obtient une erreur, voir http://stackoverflow.com/questions/24191728/documenttermmatrix-error-on-corpus-argument
La solution est de remplacer corpus <- tm_map(corpus, tolower) par corpus <- tm_map(corpus, content_transformer(tolower))
Un plugin à ajouter à Zotero pour visualiser le contenu de ses collections bibliographiques : wordcloud, n-grams, graphs sur la base de dbpedia, etc.
De la doc sur R, avec notamment des sections par langues.
Google va indiquer sur son moteur de recherche, si la recherche est faite par un mobile, si le site donné en résultat est mobile-friendly ou non. Ce qui a un impact certain sur le désire de visite. Pour les bibliothèques aussi...
Outil d'exportation des textes contenus dans wikisource (en et fr) en ePub. Bien pratique pour lire des textes appartenant au domaine public sur sa liseuse.
code source : https://github.com/wsexport/tool
Une religion radicalement athée, dont le but est de sauver l'espèce humaine. La raison pour laquelle il faut le faire en est le mystère. Il faut le faire..., parce que c'est nous.
Procédure d'installation de Kuali OLE