Il y a peu, la bibliothèque numérique en texte intégral d’HathiTrust a été lancée, comme annoncé ici.
Hathi Trust s’est construit sur le fonds des livres numérisés par Google dans le cadre de son partenariat avec les bibliothèques universitaires. Une des plus importantes fonctions du projet est d’assurer la conservation à long terme des livres numériques au cas où Google ferait faillite ou se désintéresserait de la recherche de livres, et ce, en conformité avec les standards documentaires et académiques.
Hathi Trust sort de son rôle d’archivage en proposant sa propre bibliothèque numérique. Celle-ci ne sera pas la réplique de Google Books puisque que ses sources ne devraient pas se limiter aux copies de numérisations acquises dans le cadre des accords avec ce dernier. Il est prévu d’intégrer les collections numériques propres à chaque institution, en particulier les presses universitaires partenaires, ce qui est déjà fait pour la presse universitaire du Michigan et les collections d’archives institutionnelles.
Aujourd’hui, la bibliothèque numérique d’Hathi Trust donne accès à 1 milliard et demi de pages soit 4,3 millions de livres en texte intégral, un contenu qui va continuer de s’enrichir à un rythme soutenu. Basée sur la technologie open source Solr/Lucene, elle s’élabore de façon à répondre au plus près aux besoins des chercheurs (navigation à facettes, recherche avancée, outils d’analyse informatique).
Hathi Trust, composé actuellement de 22 bibliothèques de recherche américaines participantes à Google Books, est en passe de nouer de nouveaux partenariats avec l’OCLC déjà partenaire, RLG Research et l’université de New-York mais n’a pas pour l’instant de partenaires commerciaux.
De futurs développements sont à l’étude, notamment un service d’impression à la demande ou POD (500 000 livres du domaine public en POD d’ici la fin de l’année). Prochainement, va être créée une nouvelle plate-forme pour la conservation et l’accès à long terme en lien avec les bibliothèques de recherche.