Ce qui m'intéresse plus dans cette page, c'est la partie sous Imagine, qui contient un Parser pour PDF qui vaut la peine d'être testé !
A free, open source, powerful tool for working with messy data
Outil développé par Google (d'ailleurs il s'appelait Google Refine) qui permet d'améliorer la qualité de sets de données afin d'en améliorer le traitement.
Un regroupement très large de Cheat Sheets.
via http://bookmarks.cdetc.fr/?WnIKxA
Edit (2016-01-06) : je redécouvre via Bronco via ... et je constate que c'est vraiment très large : on y trouve aussi des choses sur Vim, Wordpress, Solr, XML, Debian, LaTeX, Markdown, ... Bon, je vois qu'il manque Pandoc par exemple :)
Un bon éditeur XML, propriétaire.
Je suis toujours à la recherche d'un bon éditeur XML libre.
Protégé is a free, open source ontology editor and knowledge-base framework.
The Protégé platform supports modeling ontologies via a web client or a desktop client. Protégé ontologies can be developed in a variety of formats including OWL, RDF(S), and XML Schema.
Outil d'extraction automatique de metadata, open source. Extrait les metadata de conservation et les écrit dans un fichier XML. Pour MS Word 2, MS Word 6, Word Perfect, Open Office, MS Works, MS Excel, MS PowerPoint, TIFF, JPEG, WAV, MP3, HTML, PDF, GIF, et BMP.
Une réflexion sur le concept et la méthode What You See Is What You Mean sur le wiki de scenari
Chaîne de production éditoriale à base de XML
Listes de quickreference XSLT - XPath - XQuery