Proposition d'extension du Library Carpentry (shaarlien précédent).
Un projet développé par le NYPL-Lab, dans le cadre d'un effort de transcription de documents numérisés, sur l'histoire de l'immigration.
Scribe is a highly configurable, open source framework for setting up community transcription projects around handwritten or OCR-resistant texts. Scribe is particularly geared toward digital humanities, library, and citizen science projects seeking to extract highly structured, normalizable data from a set of digitized materials (e.g. historical manuscripts, account ledgers, catalog cards, or maritime logbooks).
De la doc assez complète et intéressante pour faire du text mining avec R
Un tuto pour faire un wordcloud avec R
Edit : le package tm a changé donc on obtient une erreur, voir http://stackoverflow.com/questions/24191728/documenttermmatrix-error-on-corpus-argument
La solution est de remplacer corpus <- tm_map(corpus, tolower) par corpus <- tm_map(corpus, content_transformer(tolower))
Tu lui donnes du texte à manger et l'outil repère les mots les plus fréquents et va chercher du contenu visuel dans la Digital Public Library of America, Europeana et Flickr Commons.
Étonnant. Possibilité de le faire fouiller ta collection Zotero. Développé pas loin de la Roy Rosenzweig Center for History and New Media.
Un projet Digital Humanities...
Un point de vue sur l'utilisation de Git en sciences humaines, avec des exemples d'utilisation du versionning et des branches.
voir aussi : http://git.theologique.ch/
Les lettre de Vincent van Gogh, numérisées et éditées. Un exemple intéressant de TEI. On peut avoir en regard le facsimilé et le texte édité.
Avec une traduction anglaise des lettres.
Un service web de visualisation de texte, créé par un francophone, donc mieux adapté pour des textes de langue française.
Plus d'information là : http://hermeneuti.ca/voyeur et http://disc.library.emory.edu/lincoln/voyant/
Service web produisant des visualisations intéressantes d'un bon nombre de textes déjà intégrés.
Avec du Java dedans.
Service Web de visualisation de données, par IBM. Notamment intéressant pour visualiser des textes littéraires.
Permet entre autre de configurer les stop words.
Protégé is a free, open source ontology editor and knowledge-base framework.
The Protégé platform supports modeling ontologies via a web client or a desktop client. Protégé ontologies can be developed in a variety of formats including OWL, RDF(S), and XML Schema.
Personnes et projets utiles en digital humanities
TraMineR is a R-package for mining, describing and visualizing sequences of states or events, and more generally discrete sequential data. Its primary aim is the analysis of biographical longitudinal data in the social sciences, such as data describing careers or family trajectories.
Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. Un logiciel libre construit avec des logiciels libres.
Logiciel de visualisation de données de réseaux, conçu dans un contexte universitaire, pour un objectif de type "digital humanities"
Base de donnée de documents diplomatiques suisses, publics, numérisés, et souvent mis en contexte par un e-dossier. Utile pour la recherche en histoire, notamment.
Site qui rassemble de l'information sur les outils informatiques utiles pour les chercheurs-ses, étudiant-e-s, notamment en sciences humaines, mais pas seulement.
Un article intéressant à destination des étudiants/chercheurs en sciences humaines sur l'utilisation de l'informatique
De la documentation pour l'utilisation de LaTeX en sciences humaines, par Christophe Masutti
LaTeX pour les sciences humaines : le livre
Un guide pour la digital curation dans les digital humanities