El Internet Archive empieza también a constituir colecciones digitales como el Million Book Project (10.520 libros en abril de 2005), archivos de películas del periodo 1903-1973, archivos de conciertos en vivo recientes, archivos de software, etc. Todas las colecciones se pueden consultar en acceso libre en la web.
En enero de 2005, el Internet Archive se asocia con Yahoo! para elaborar la Open Content Alliance (Alianza para un Contenido Abierto), una iniciativa cuyo objetivo es crear un repertorio libre y multilingüe de libros digitales y de documentos multimedia que se puedan consultar en cualquier buscador.
La OCA, oficialmente lanzada en octubre de 2005, empieza verdaderamente en 2006. La OCA quiere inspirarse de Google Books sin repetir sus errores, a saber la digitalización de libros sometidos a derechos de autor sin la aprobación previa de los editores, y la imposibilidad de consultar y descargar los libros en otro buscador.
La OCA reúne a numerosos colaboradores: bibliotecas y universidades, por supuesto, pero también organizaciones gubernamentales, asociaciones sin ánimo de lucro, organismos culturales y sociedades informáticas (Adobe, Hewlett Packard, Microsoft, Yahoo!, Xerox, etc.).
Las primeras en colaborar son las bibliotecas de las universidades de California y de Toronto, el European Archive, los Archivos Nacionales del Reino Unido, O'Reilly Media y Prelinger Archives. Para evitar los problemas de copyright con los que se tropieza Google, sólo se digitalizan los libros que pertenecen al dominio público. Las colecciones digitales alimentan la sección Text Archive del Internet Archive.
En diciembre de 2006, la OCA alcanza la cifra de 100.000 libros digitalizados, con un ritmo de 12.000 nuevos libros al mes.
En la misma fecha, el Internet Archive recibe una subvención de un millón de USD por parte de la Sloan Foundation para digitalizar las colecciones del Metropolitan Museum of Art (la totalidad de los libros y miles de imágenes) así como algunas colecciones de la Boston Public Library (los 3.800 libros de la biblioteca personal de John Adams, segundo presidente de los Estados Unidos), del Getty Research Institute (una serie de libros de arte), de la Universidad John Hopkins (una serie de documentos vinculados con el movimiento antiesclavista) y de la Universidad de California en Berkeley (una serie de documentos relativos a la fiebre del oro).
En mayo de 2007, la OCA alcanza los 200.000 libros digitalizados. Se llega a un millón de libros digitalizados en diciembre de 2008, y a dos millones de libros en marzo de 2010.
= Otros proyectos
# Microsoft Live Search Books