Historia de los Formatos de Caracteres
Monday, June 14th, 2004 a las 01:02 por Cek
Cualquiera que haya visto una película basada en el Oeste del siglo XIX sabrá que el primer código utilizado para ser trasmitido de forma eléctrica fue el código Morse, que fue inventado para transmitir mensajes vía líneas telegráficas, no para el procesamiento digital de datos.
Seguidamente, surgió la teleimpresión patentada por Baudot en Francia en 1874. Como la telegrafía, la teleimpresión hizo trabajar a las mentes pensantes para desarrollar un nuevo código, el código Baudot de 5 bits, que fue el primer código binario para el procesamiento de datos textuales. Con estos cinco bits se conseguían codificar 32 elementos que eran suficientes para las necesidades de la época.
El censo de US de 1890 y el nacimiento del nuevo código de caracteres
Herman Hollerith estadístico e inventor fue encargado del censo de US, desarrollo la máquina tabuladora cuya funcionalidad era la de poder procesar gran cantidad de datos y ahorrar tiempo y trabajo.
Esta máquina funcionaba con unas tarjetas perforadas a las que se les aplicaba el código inventado por Hollerith que posteriormente iban a la tabuladora. Este código estuvo funcionando hasta ya avanzada la primera mitad del siglo XX, cuando IBM, ya propietaria de la patente de la tabuladora desarrollo nuevos códigos para las computadoras desarrolladas por la multinacional.
Códigos de caracteres para computadores Americanos y Europeos
Como resultado del rápido desarrollo de las nuevas máquinas emergentes, Estados Unidos en la primera mitad del siglo XX, tiene la necesidad de crear un estándar de códigos de caracteres para el intercambio de datos. La institución ASA, más tarde llamada ANSI empieza a estudiar el problema a finales de los 50, y decide que un código como el de Baudot pero de 7-bits era suficiente para cumplir las necesidades del alfabeto anglosajón.
En 1963, ASA anuncia el estándar ASCII (American National Standar for Information Interchange) que contaba con 32 caracteres de control y 96 imprimibles. Más tarde, en 1968 se amplio a ASCII de 8bits con 190 caracteres imprimibles. El código ASCII fue adoptado por todas las computadoras fabricadas en US menos por IBM, que desarrollo su propio código de caracteres del que era propietario.
Europa adoptó ASCII pero pronto se dieron cuenta de que no era suficiente para la gran diversidad de lenguas existentes en el antiguo continente. Por otra parte IBM iba evolucionando su estándar llamado EBCDIC de 8bits.
Posteriormente, la entidad pertinente ISO fue creando variantes de ASCII en las que se incluían los caracteres necesarios para cada lengua europea. A la vez, se iban creando los estándares para las lenguas orientales, en las que la variedad de símbolos es sensiblemente mayor, y la cantidad de bits necesarios para su codificación es mayor.
Actualmente, el enfoque de toda esta problemática ha cambiado, ya que no se pretende crear un estándar para cada lengua, sino que se trabaja en un estándar común para todo el mundo, con lo que se consigue evitar los problemas de compatibilidad entre distintos formatos en declive del tamaño que ocupa el conjunto de caracteres de este nuevo estándar. Este estándar revolucionario es el llamado UNICODE.
Más sobre estándares de codificación de caracteres en próximos posts….
Permalink
Almacenado en: 
Un post sencillamente genial y muy currado, enhorabuena