1996: INTERNET ARCHIVE
[Résumé]
Fondée en avril 1996 par Brewster Kahle à San Francisco, l’Internet Archive a pour but premier de constituer, stocker, préserver et gérer une "bibliothèque" de l’internet, en archivant régulièrement la totalité du web, afin d’offrir un outil de travail aux universitaires, chercheurs et historiens, et de préserver un historique de l’internet pour les générations futures. En octobre 2001, l’Internet Archive met ses archives en accès libre sur le web grâce à la Wayback Machine, qui permet à tout un chacun de consulter l’historique d’un site web, à savoir le contenu et la présentation d’un site web à différentes dates, théoriquement tous les deux mois, à partir de 1996. L'Internet Archive constitue aussi des collections numériques spécifiques, y compris pour les livres et les documents multimédias. Toutes ces collections sont en consultation libre sur le web.
[En détail]
Fondée en avril 1996 par Brewster Kahle à San Francisco, l’Internet Archive a pour but premier de constituer, stocker, préserver et gérer une "bibliothèque" de l’internet, en archivant régulièrement la totalité du web, afin d’offrir un outil de travail aux universitaires, chercheurs et historiens, et de préserver un historique de l’internet pour les générations futures. En octobre 2001, l’Internet Archive met ses archives en accès libre sur le web grâce à la Wayback Machine, qui permet à tout un chacun de consulter l’historique d’un site web, à savoir le contenu et la présentation d’un site web à différentes dates, théoriquement tous les deux mois, à partir de 1996. Toutes ces collections sont en consultation libre sur le web. Les archives du web représentent 300 téraoctets (To) de données en 2004, avec une croissance de 12 téraoctets par mois. Ces archives représentent 30 millions de pages web en 1996, 65 milliards de pages web (provenant de 50 millions de sites web) en décembre 2006 et 85 milliards de pages web en mai 2007.
Depuis la fin 1999, l'Internet Archive constitue aussi des collections numériques spécifiques, par exemple les sites relatifs au 11 septembre 2001, les sites relatifs aux élections de 2000 (présidentielles) et 2002 (élections du Congrès et des gouverneurs des Etats), les sites des pionniers du web, le Million Book Project (10.520 livres en avril 2005), des archives de films de la période 1903-1973, des archives de concerts "live" récents, des archives de logiciels, etc. Toutes ces collections sont en consultation libre sur le web, y compris la grande bibliothèque numérique (Text Archive) en cours de constitution. A cet effet, l'Internet Archive fonde en janvier 2005 l'Open Content Alliance (OCA), une initiative visant à créer un répertoire libre et multilingue de livres numérisés et de documents multimédia pour consultation et téléchargement sur n'importe quel moteur de recherche.