La utilización del Unicode se generaliza alrededor del año 2000, por ejemplo para los archivos de texto bajo plataforma Windows (Windows NT, Windows 2000, Windows XP y siguientes versiones), que hasta entonces estaban en ASCII.
Pero el Unicode no puede solucionar todos los problemas, como lo subraya en junio de 2000 Luc Dall’Armellina, co-autor y webmaster de oVosite, un espacio de escritura hipermedia: "Los sistemas operativos se van dotando de fuentes Unicode capaces de representar todos los idiomas del mundo. Ojalá sigan el mismo rumbo todas las aplicaciones, desde el procesamiento de texto hasta el navegador web. Las dificultades son inmensas: nuestro teclado, con sus ± 250 teclas, deja ver sus insuficiencias siempre que es necesario digitalizar Katakana o Hiragana japoneses, y aún peor con el chino. La gran variedad de los sistemas de escritura por el mundo y el número de caracteres que abarcan constituyen un freno potente. Sin embargo los obstáculos culturales no son menos importantes, pues están vinculados con los códigos y modalidades de representación propios de cada cultura o etnia."
= ASCII y/o Unicode
El Proyecto Gutenberg es fundado en 1971 por Michael Hart con el objetivo de difundir bajo forma electrónica las obras literarias para ponerlas gratuitamente a la disposición de todos. Tanto los libros que fueron digitalizados hace treinta años como los de ahora se digitalizan en modo texto, mediante uso del ASCII original de siete bits. De esta manera los textos pueden ser leídos sin problema con cualquier computadora, plataforma y programa. Para los idiomas con acentos como el español, los libros tienen dos versiones: una versión en ASCII de ocho bits para tomar en cuenta los caracteres acentuados, y una versión en ASCII de siete bits, sin acentos. A excepción, claro, de las lenguas no codificables en ASCII, como el chino, que está codificado en Big-5.
El Proyecto Gutenberg ofrece libros en otros formatos, incluso en formatos populares tales como HTML, XML, RTF y Unicode. Además, cualquier formato propuesto por voluntarios es generalmente aceptado - PDF, LIT, TeX y muchos otros – siempre y cuando un archivo ASCII también esté presente.
En cuanto a idiomas, el Proyecto Gutenberg es en su mayoría de lengua inglesa, ya que está instalado en los Estados Unidos y que sirve principalmente a la comunidad de habla inglesa a nivel nacional e internacional. En octubre de 1997, Michael Hart anuncia su intención de intensificar la producción de libros en otros idiomas. A principios de 1998, el catálogo incluye algunas obras en alemán, español, francés, italiano y latín. Michael escribe en julio de 1999: "Lanzamos ahora una nueva lengua al mes, y voy a seguir con esta política durante tanto tiempo como sea posible."
A la misión original se añade un papel de puente entre idiomas y culturas diversas. El multilingüismo se convierte poco a poco en una de las prioridades del Proyecto Gutenberg, como la internacionalización, con el Proyecto Gutenberg Australia (creado en agosto de 2001), el Proyecto Gutenberg Europa (creado en enero de 2004), el Proyecto Gutenberg Canadá (creado en julio de 2007) y otros Proyectos Gutenberg por venir en varios países. El Proyecto Gutenberg original (el de los Estados Unidos) tiene libros en 25 idiomas en enero de 2004 y libros en 42 idiomas en julio de 2005.
Desde su creación en enero de 2004, el Proyecto Gutenberg Europa (PG Europa) y Distributed Proofreaders Europa (DP Europa) son sitios web multilingües que tienen en cuenta las principales lenguas europeas. El sitio de DP Europa está inspirado del sitio original de Distributed Proofreaders (el de los Estados Unidos) para gestionar la corrección de los libros digitales entre los voluntarios, que comparan las versiones digitales con las páginas escaneadas de las versiones impresas. En abril de 2004, gracias a traductores voluntarios, el sitio de DP Europa está disponible en doce idiomas. El objetivo a medio plazo es un sitio en sesenta idiomas que tenga en cuenta todas las lenguas europeas. DP Europa utiliza Unicode en lugar del ASCII, para procesar libros en muchos idiomas.
PRIMEROS PROYECTOS MULTILINGÜES
= [Cita]