Representación de datos alfanuméricos

Un ordenador debe ser capaz de trabajar con información textual. El ordenador trabajará con conjuntos de caracteres para manejar datos, instrucciones, órdenes de control, etc. Entre el conjunto de caracteres que maneja habrá:

  • Letras mayúsculas, minúsculas, acentuadas, etc.
  • Dígitos.
  • Caracteres especiales, tanto signos de puntuación como órdenes de control.

Para almacenarlas se utilizan tablas de símbolos, de modo que a cada símbolo le corresponde una combinación de 0s y 1s de longitud determinada. Dependiendo del número de bits que se utilice para guardar símbolos, se podrán guardar más o menos símbolos distintos. Con 7 bits, por ejemplo, se podrán almacenar 128 símbolos distintos, y con 8, 256. Cada fabricante utilizará la tabla de símbolos que le convenga, aunque lo habitual es utilizar alguna de las estandarizadas. Las más conocidas son:

  • ASCII: Fue publicado en 1963 y utiliza 7 bits, es decir, 128 códigos distintos para dígitos, letras mayúsculas y minúsculas del alfabeto inglés, signos de puntuación y caracteres básicos de control.
  • ASCII extendido: utiliza 8 bits, por tanto, posee 256 caracteres. Los 128 primeros son los mismos que el ASCII de 7 bits, los restantes son distintos dependiendo de la región en la que se utilicen.
  • UNICODE: fueron creados en 1991 para tener códigos alfanuméricos estándar, comunes en todas las regiones, es decir, que incluya todos los caracteres de los distintos alfabetos como chino, árabe, etc. Hay diferentes versiones de representación siendo necesarios hasta 32 bits, lo que permite más de 4000 millones de combinaciones, aunque actualmente sólo están asignadas 107.361. Los 128 primeros son los caracteres ASCII.

AMPLÍA: Se pueden consultar todos los símbolos del código UNICODE en el siguiente enlace eligiendo en el desplegable el conjunto que se desea conocer:
http://www.ltool.net/characters_to_unicode_charts_in_spanish.php?unicode=0

Deja un comentario