FIJANDO CONCEPTOS: Voy a utilizar un lenguaje coloquial, por lo tanto sacrificaré terminología académica en aras de la comprensión generalizada. No obstante será imprescindible el uso de ciertos tecnicismos, que intentaré explicar de forma sencilla para los noveles y con otras exposiciones más técnicas para doctos.                                                                                                  Antonio J. Nevado (01.11.2006)            

 

SERVIDOR EN INTERNET:

Es un ordenador que tiene instalado un "software (programa) servidor" que por ejemplo, hace posible alojar las páginas web, entre otros programas, utilidades y aplicaciones. El servidor también almacena los correos electrónicos para descargarlos cuando así lo solicitemos desde nuestro ordenador, bien sea el doméstico o el del trabajo. Por supuesto ese "ordenador servidor" también devuelve las páginas web que tiene alojadas y que le son solicitadas desde los diferentes equipos, sea nuestro PC casero o cualquier otro, y así poder verlas en los monitores o pantallas, si el PC es portátil.

 

DOMINIO EN INTERNET:

Estos ordenadores servidores, comúnmente llamadas "las máquinas", se reconocen en la red con un número llamado "IP" (Internet Protocol numbers). Una dirección IP se forma con cuatro combinaciones de números del 0 al 225 separadas entre sí por un punto, por ejemplo, 217.76.142.29 - No hay dos direcciones IP iguales para distintas máquinas. Cada una tiene la suya propia para que no haya errores de identificación (es decir como los números de teléfono). El problema es que esta numeración no es demasiado práctica para recordarla. Para ello se le asigna un nombre que es más sencillo de recordar: antonionevado.info, al que le corresponde la IP nº 217.76.142.29 - Ha nacido el dominio en internet "antonionevado.info".

Cuando un nombre de dominio se aloja en un servidor (como explicamos más adelante), su asignación a una IP se hace automáticamente mediante el sistema DNS (Domain Name System), cuya base de datos también se haya alojada en servidores de internet y que relaciona los números IP con su nombre de dominio correspondiente.

Para poder alojarlo, como es obvio, hay que adquirirlo previamente en propiedad a través de un Registrador de dominios.

 

REGISTRADOR DE DOMINIOS:

ICANN (Internet Corporation for Assigned Names and Numbers, Corporación de Internet para la Asignación de Nombres y Números) es una organización sin ánimo de lucro creada en 1998 para asumir algunas competencias de la IANA (Internet Assigned Numbers Authority, Agencia de Asignación de Números de Internet), que actualmente ha quedado relegada a una función generalista como es la de "dedicarse a preservar las funciones coordinadoras centrales del Internet global para su buen uso púbico". La ICANN fue directamente encargada por el gobierno de los EE.UU. (Departamenteo de Comercio), para la asignación de las IP y los nombres de dominio de primer nivel o nivel superior (tratados más adelante), entre otras tareas. Sólo registradores acreditados por la ICANN están autorizados para registrar dominios en internet. Estos a su vez pueden convertirse en mayoristas y revender sus dominios a empresas, que finalmente los venden al consumidor final, o hacerlo ellos mismos directamente. Voy a citar dos casos como anecdóticos, ilustrativos y opuestos:

La casualidad hizo que en 1974 la normativa ISO 3166 (los ISO son unos estándares reconocidos mundialmente) asignara a Tuvalu (las llamadas anteriormente Islas Ellice) el sufijo internacional "Tv", lo que obligó a la IANA/ICANN a reservarle el dominio ".Tv" - Las autoridades del país cedieron los derechos de explotación a una empresa privada por 4 millones de dólares al año, durante diez años. El precio de estos registros puede llegar hasta cantidades millonarias según el nombre solicitado bajo ese sufijo. En el extremo opuesto se encuentra el dominio de las Islas Tokelau ".tk" (dependientes de Nueva Zelanda) que es gratuito.

 

EL ALOJAMIENTO DE LOS DOMINIOS:

El tener un dominio no quiere decir que ya se pueda ver en internet nuestra página web. Hay que alojarla en un servidor bajo ese dominio. Para ello debemos alquilar los servicios de cualquier empresa ISP (Internet Service Provider, Proveedor de Servicios de Internet) o montar un servidor en tu casa u oficina. Esto último es bastante complicado ya que hay que tener conocimientost técnicos, el software servidor ya mencionado al principio y una conexión de banda ancha, además de medidas de seguridad, mantenimiento y vigilancia que no están al alcance de cualquiera. Hay que tener en cuenta que un servidor de Internet tiene que estar 24 horas al día los 365 días del año continuamente encendido y en funcionamiento.

Ya hemos alquilado los servicios del alojamiento de nuestro dominio. Ahora para publicar nuestra página web hemos de disponer de una cuenta y un programa FTP (File Transfer Protocol, Protocolo de Transferencia de Ficheros). Las cuentas de FTP son el medio estándar para acceder al servidor con el fin de crear directorios, enviar archivos, borrarlos, etc. Cada dominio tiene asignada una o más cuentas cuentas (las que pueda necesitar el cliente) y se identifican mediante una localización de la "máquina" (host name) donde se encuentra alojado el dominio, un nombre de usuario y una contraseña.

Un programa FTP es un software (programa, aplicación informática) mediante el cual podemos subir al servidor los archivos que dan configuración a la página web, utilizando la cuenta FTP. Una vez se encuentren en el servidor dichos archivos, la página web ya es visible en todo el mundo por internet, escribiendo su dirección URL (Uniform Resource Locator, Localizador Uniforme de Recursos), vamos... http://www.antonionevado.info, para entendernos. Esta se escribe en la barra de direcciones del navegador que se utilice (Mozilla Firefox, Opera, Internet Explorer, Navigator, etc. etc.).

 

"DOMINIOS - 1º, 2º Y 3er. NIVEL Y SUS CATEGORIAS (referido al 01.11.2006):

Ya sabemos como obtener un dominio en internet y como alojar nuestra página web bajo ese dominio. Pero como soy hispano-parlante me gustaría tener un dominio en el que figurase la letra "eñe" y también los acentos. Aquí es donde pueden surgir los problemas.

Hay varias extensiones de dominios (las letras que aparecen después del punto): ".com" - ".net" - ".org" - ".info" - ".es" - "tv" etc. etc. Todos los dominios que existen en el mundo están distribuidos en niveles. Los dominios de primer nivel TDL (Top Domain Level). Los dominios de 2º nivel son los que se utilizan bajo los dominios de 1er. nivel: "antonionevado.info" - Por último los de 3er. nivel son subdominios de la forma "LoQueSea.com.es", por ejemplo.

A su vez los dominios de 1er. nivel comprenden tres categorías: Los de 1er. nivel genéricos (gTDL). Los de 1er. nivel por código de país (ccTDL), más comúnmente llamados territoriales. El dominio territorial español por código de país tiene asignada la extensión ".es". Y por último el especial 1er. nivel Address and Routing Parameter Area (.arpa TDL) para usos propios de infraestructuras y que lo administra el ICANN junto con la comunidad técnica de Internet, bajo la orientación de Internet Architecture Board. Por esta razón no es un dominio comercial.

No paran ahí las subdivisiones pues dentro de 1er. nivel genéricos (gTDL) hay establecidas, hasta la fecha, dos divisiones más: Los Patrocinados, sponsored (sTLDs) y los NO Patrocinados, unsponsored (uTLDs) . Ver lista

Los No Patrocinados son: ".biz" Business. Negocios, como alternativa aliviadora al .com - ".com" En principio se designó para actividades comerciales. En la acutalidad es la antonomasia de los dominios - ".info" para las páginas web informativas - ".int" reservados para organizaciones con tratados internacionales y organizaciones no gubernamentales - ".name" Para personas físicas - ".net" en principio para entidades relacionadas con redes y en internet. En la actualidad se utiliza generalmente como 2ª alternativa a los .com - ".org" Para organismos e instituciones - ".Pro" Para profesionales, abogados, médicos ect. Es necesario una certificación oficial para poder registrarse bajo este dominio.

Los Patrocinados son: ".Aero" Para la industria del transporte - ".Cat" Para la comunidad cultural y lingüista catalana ".Cop" Para sociedades cooperativas - ".Edu" Para las instituciones estadounidenses relacionadas con el sector de la educación - ".Gov" Para el Gobierno de EE.UU. - ".Jobs" Para la comunidad internacional de recursos humanos - ".Mil" Para el sector militar de los EE.UU. - ".Mobi" Para contenidos de la comunidad de usuarios y proveedores de móviles - "Museum" Para el sector de los museos - ".Tel" Sin definir aún por el ICANN - y ".Travel" Para la comunidad de agencias de viaje y turismo.

Esta aceptación de "comunidad cultural" por parte del ICANN para el dominio ".cat" << para servir a las necesidades de la comunidad lingüística y cultural catalanohablante>> podría dar lugar por sí misma, a una lista los dominios patrocinados interminable si cunde el ejemplo, cuya trascendencia superaría el aspecto tecnológico de internet, trasladándolo incluso al plano político. Quizá internet lograse una "CiberIndependencia" o "CiberAutonomía", a ciertas regiones o provincias que ahora no la tienen en el aspecto político-territorial, y que no obstante la añoran o demandan. Esto podría producir un efecto simpatía de consecuencias imprevisibles, ni siquiera por la ICANN, ¿o sí?, cuando admitió el ".cat". Evidentemente, no sólo me refiero a España.

 

DOMINIOS DE LA CLASE IDN (International Domain Names) o DOMINIOS MULTILINGÜES:

Por otro lado están los llamados dominios multilingües o IDN (Internacional Domain Names). Estos dominios no se encuadran en ninguna división de las anteriores, puesto que pueden acoplarse a cualquiera ya que su particularidad estriba en que incorporan el estándar llamado también IDN. Este estándar es el que hace posible ver representados los caracteres propios del idioma de cada país. En el caso del alfabeto español se encuentran la "ñ", la diéresis sobre la u, "ü" y el acento agudo sobre las 5 vocales " ´ ".

Están disponibles desde el 26 de Febrero de 2001 como fecha oficial, pero dados los inconvenientes que surgieron en los servidores de DNS, los navegadores y los teclados, quedaron en el olvido y un tanto apartados del circuito comercial. De momento (al 01.11.2006) sólo se puede disponer de la "ñ", con garantía, en los dominios gTDL ".com", ".net" y en el ccTDL ".cl", dominio territorial de Chile. En otros dominios tanto genéricos como territoriales se están incorporando recientemente, pero pueden dar problemas de alojamiento en el servidor (de hecho, hoy en día los hay incluso con los ".com" y ".net", mucho más rodados).

Es una lástima que no se logre aún en el dominio español. Desde esta web promovemos una campaña que iniciaremos en Noviembre para conseguirlo. En mi opinión no sería muy complicado, pues técnicamente bastaría con aplicar un ACE (ASCII-Compatible Encoding) como punycode, en los servidores de DNS, modificando el BIND (archivo named.conf), en el primario y secundario del IDN. Esto es lo que ha hecho NicChile y funciona perfectamente, pues se puede comprobar en este enlace: http://www.españa.cl - En la campaña incorporaremos objetivos, como habilitar servidores para alojar los dominios sin problemas de hosting, porque los ISPs (Proveedores de Servicios de Internet) no están muy por la labor. La "ñ" puede verse en el IExplorer gracias al "plug-in" i-Nav de VerSign, ya mencionado en la página de inicio. Otros navegadores como Mozilla Firefox u Opera ya llevan su propia ACE (ASCII-Compatible Encoding) incorporada de serie y no hay que instalar ningún "parche" como en el Explorer de Microsoft.

 

ConEÑEyConACENTO.COM y .NET:

Estos dominios los he adquirido recientemente para ponerlos como ejemplo. El proceso de compra es muy sencillo. Lo que se complica un poco más es su alojamiento y publicación en la red.

Para ello deberemos utilizar el código "Punycode" cuya definición podría ser: PUNYCODE es una codificación simple y eficiente de ACE (ASCII-Compatible Encoding) diseñada para el uso con IDN (dominios multilingües). Transforma una secuencia de Unicode en una cadena de caracteres permitidos en las etiquetas del hostname (ASCII-letras, dígitos, y guiones). Su descripción técnica se encuentra en RFC 3492. Los RFC (Request For Comments), son tratados técnicos y organizativas donde se describen los estándares o recomendaciones para su uso general en informática e Internet. Garantizan la compatibilidad entre todos los sistemas. Si esto no se entiende no importa demasiado, en la práctica se opera de la siguiente forma:

1 - Vamos a la página de VeriSign e introducimos "coneñeyconacento" para obtener la traducción a Punycode.

2 - Que resulta ser: "xn--coneeyconacento-1qb". Pues bien esta traducción literal es la que tendremos que utilizar para configurar la cuenta FTP y dar de alta el dominio en el alojamiento en el servidor.

3 - Por último tendremos que descargar e instalar el "plug-in" i-Nav en nuestro equipo para para ver traducido el código Punycode:"xn--coneeyconacento-1qb" a Unicode UTF-8: "coneñeyconacento". Si aún no lo tiene instalado, pinche sobre la bandera (banner) cedido por VeriSign (lo he retocado para que salga en español):

Pulsar aquí para descargar i-Nav
Banner cedido por VeriSign y retocado por mi para que salga en español.

Si prefiere descargar el "plug-in" EchIDNA v1.1 del proyecto open source IDN-OSS, Pulse aquí. En outlook express dará problemas teniendo configurada alguna cuenta de correo en código punicode, cosa que no sucede si utiliza Thunderbird.

Ya está hecha la operación. La evidencia de que esto es real y posible, es el hecho de que Vd. pueda estar visitando y navegando por esta página. La limitación puede estar en que en la dirección (URL) de algunos navegadores aparezca la codificación punycode en vez de el texto Unicode UFT-8 (más adelante explicado), que la representa en español.

Esto, en lo que se referente a los nombres de dominio. Otra cosa distinta es que en el texto contenido en las páginas web, se reconozcan también los caracteres españoles.

 

CONTENIDO ESCRITO EN EN LAS WEB - TEXTO EN ESPAÑOL:

Es decir el texto escrito que se lee en las web. Esto, evidentemente, es diferente al texto en el nombre del dominio. Para los escritos en idiomas como el español, inglés o alemán por ejemplo, basta con incluir entre las etiquetas de cabecera <head> y </head> de la página, la siguiente etiqueta:

<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">

y el navegador reconocerá, en general, los caracteres escritos en idiomas de los paises de Europa occidental. Para otras zonas del mundo hay que cambiar en el charset (juego de caracteres), el valor del estándar ISO correspondiente. Los diferentes valores de ISO según la zona, pueden verse (algunos) en la siguiente imagen, que sirve de guía para ver como hay que operar para descubrir el resto (casi todos los existentes) en un navegador:

Antes de continuar voy a detallar lo que son dos acrónimos utilizados con frecuencia:

- ASCII (American Standard Code for Internation lnterchange, Código Estándar Americano para Intercambio de Información). Se reconoce por caracteres ASCII a un juegoo tabla de 256 caracteres (2 bytes) donde los 128 primeros (0 al 127) son estándar para todo el mundo (US-ASCII o puro de 1 byte), mientras que en los restantes (128 al 255), otro byte más, se escuentran los llamados extendidos o ASCII Extendido , están representados los caracteres propios de cada país (+info+técnica). Ejemplo: Nuestra "Ñ" es el número 165; para verla en un procesador de texto (el bloc de notas, sin ir más lejos) hay que pulsar la tecla "alt" y manteniéndola pulsada escribir "165", al soltar la tecla "alt" se ve escrita la "Ñ". Para ver la letra beta griega, operar de la misma forma escribiendo "225" etc. etc. Esto en el leguaje HTML (el de las webs) se logra con las "Entidades de caracter numéricas y nominales" que son caracteres reservados de este lenguaje informático para las webs en internet. De tal forma que para que la "Ñ" en una página web sea reconocida en cualquier navegador se escribiría "&Ntilde", que es la secuencia de escape que le corresponde (el "alt" 165 anterior, para entendernos.)

En la tabla ASCII, del 0 al 31 se encuentran los caracteres de control. Del 32 al 127 son los caracteres del teclado. Del 128 al 255 están los caracteres extendidos a los que he aludido anteriormente, ver la tabla con el orden numérico (1ª columna) y el carácter correspondiente (2ª columna). Por ejemplo el carácter "ñ" minúscula es el 164.

- ASCII a su vez es miembro de la ISO (International Standards Organization - Organización Internacional de Estandarización), que fundada en 1946 agrupa a 89 países, y es responsable de los estándares mundiales en varios sectores, entre ellos el de la informática. Construyendo estándares ISO se fueron incorporando ISOs con carácteres propios de cada país. El problema surgió con la "Babel de ISOs" que se pusieron en circulación, de tal forma que las webs solo reconocían los caracteres del estándar ISO especificados en las mismas. Por ejemplo con el Latin-1 (ISO-8859-1), mencionado antes, no pueden verse caracteres del japonés. Una solución sería escribir los caracteres con la secuencia de escape que le corresponda, pero esto en la práctica sería muy farragoso.

A partir de aquí no me queda más remedio que expresarme con algunos tecnicismos, aunque trataré de hacerlo de la forma más sencilla posible. No obstante para entender lo que viene a continuación, hay que tener un mínimo de conocimientos del entorno informático e Internet. Si no es así, en el ejemplo se puede probar directamente como un texto queda representado en varios idiomas a la vez, utlizando UTF-8. Para que un neófito me pueda entender, UTF-8 sería como un único ISO del charset que valiera para casi todos los idiomas.

Para la implementción técnica basta con añadir la siguiente etiqueta, en el cuerpo de cabecera del documento HTML o XHTML las de apertura y cierre <head> y </head>:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

XHTML (Lenguaje de Marcado de Hipertexto Extensible) es otro lenguaje de marcas, en el que se intenta combinar HTML (diseñado para mostrar datos) y XML (diseñado para describir los datos). Las limitaciones del primero en las herramientas o aplicaciones basadas en XML, se ven parcialmente solucionadas XHTML V1.0. Una forma de transición en tre uno y otro es el HTML 4.0 transacional el cual es aceptado por todos los navegadores, aun conteniendo sintaxis XML, que la ignora sin provocar errores en cuanto a mostrar el documento (página web) en la pantalla. Hay un analizador de errores o cambios que proponen para que un documento HTM quede con una sintaxis perfecta. Se encuentra en http://validator.w3.org,.

En documentos XML se utiliza el seudo atributo de codificación en la declaración de XML al principio del documento:

<?xml version="1.0" encoding="UTF-8" ?>

También es importante indicar en un documento web el lenguaje en el que está construido.
<meta http-equiv="Content-Language" content="es">

Y si indicamos un enlace a otra web externa hacerlo también en el mismo, como por ejemplo el que nos lleva hasta la web oficial de Linux que está en inglés, se inidicaría en la etiqueta así: <http://www.linux.org" hreflang="en">

Cada Sistema Operativo utiliza diferentes juegos de caracteres para el mismo país. Por ejemplo, en español, MSDOS usa el juego de caracteres 850 y Windows el estándar ISO-8859-1 (antes indicado y también conocido como “latin-1”), por lo tanto no se tenía uniformidad. Para conseguirla se desarrolla la norma Unicode por la iniciativa privada The Unicode Consortium, cuyos Full Members son Adobe, Apple, Denic eG, Google, Hewlett-Packard, IBM, Justsystem, Microsofft, Oracle, Sap AG, Sun, Sybase y Yahoo.

"Unicode proporciona un número único para cada carácter, sin importar la plataforma, sin importar el programa, sin importar el idioma". Eso es lo que dice la web oficial. Una explicación más concreta es que ha estandarizado cada símbolo que se usa como letra o carácter en cualquier lugar del mundo, en la tabla o norma llamada Unicode. Esta tabla usa 2 bytes para cada símbolo, con lo que puede representar un total de 65536 distintos. El problema surge porque no es compatible con las tablas ASCII y que gasta el doble de memoria.

Los servidores envían documentos HTML a agentes de usuario como cadenas de bits (ceros y unos) que estos agentes las interpretan como otra cadena, en este caso como secuencia de caracteres. El método de conversión va desde una sencilla transformación, hasta algoritmos u esquemas complejos. Para solucionar los problemas de codificación, Unicode ha sacado una solución compatible con ASCII llamada UTF-8 (8-bit Universal Transformation Format), que gastando solamente 1 byte por símbolo permite representar todos los símbolos Unicode. De esta forma devuelve las páginas en un conjunto de caracteres de longitud variable, que utiliza grupos de bits para representar el estándar Unicode en el alfabeto de varios idiomas.

La novedad que aportaron Rob Pike y Ken Thompson, creadores del UTF-8 y al que definieron en un principio como FSS-UTF (File System Safe Universal Character Set Transformation Format), fue usar los 128 caracteres primeros (0 al 127) para todo los idiomas (es decir, 0xxx xxxx), los cuales son iguales en todas las tablas ASCII, incluida Unicode, y los demás símbolos se representan con 2 o 3 bytes, pero siempre el primero de ellos es de la forma (1xxx xxxx), que marca el principio de un carácter extendido (128 al 255), que son propios de cada país como he dicho antes. A primera vista parece no ser práctico representar caracteres Unicode con hasta 4 bytes, pero UTF-8 permite a sistemas de herencia transmitir caracteres a superconjuntos como el ISO 10646 Universal Character Set (UCS), con un espacio de códigos de hasta 31 bits.

Como la inmensa mayoría de los caracteres que se suelen usar son bajos (0 al 127) y UTF-8 es compatible con ASCII, UTF-8 puede representar los caracteres de una muy amplia variedad de idiomas (prácticamente todos los que más se utilizan internacionalmente, español, inglés, árabe, hebreo, ruso, griego, húngaro, japonés...). Los navegadores devuelven los datos en el mismo codificado que la página que contiene la información.

Los codificados UFT más comunes son:

 

ESPECIFICACIONES MÁS COMPLETAS SOBRE ASCII - ANSI - PÁGINA DE CÓDIGOS:

Los textos en informática son configurados por los juegos de caracteres (Character set). Esto se indica así cuando se refiere siempre a la norma de relacionar una secuencia de octetos con una secuencia de glifos (carácteres) que corresponden a letras, símbolos, cifras o ideogramas del sistema de escritura de una lengua. El ordenador internamente crea una tabla, la página de códigos, en donde se relacionan los glifos con los octetos. Esta página de códigos se refiere generalmente a un idioma, pero quizá no contenga todos los caracteres y signos de es idioma, incluso pueden ser diseñadas por el propio usuario. Por ejemplo la página de códigos ANSI 1252 puede ser utilizada por los lenguajes Inglés, Español y Francés porque contiene todos los caracteres propios de esos idiomas. No obstante las utilizadas más frecuentemente están estandarizadas, existiendo dos tipos:

ACP (ANSI Code Pages) creadas por el Instituto de Estándares Americano. La ANSI 1252 es la tiene correspondencia con el Inglés Americano y la mayoría de lenguas de Europa occidental.

OCP (OEM Code Pages - Original Equipment Manufacturer Code Pages). Etas son las que proponen Organizaciones No Oficiales (OEM).

El Sistema Operativo MSDOS utilizó página de código propias para extenderlo a otros entornos distintos del Inglés Americano.

437 Inglés americano
737 Griego
862 Hebreo
863 Franco-Canadiense
850 Multi-Lingual (Latín-1)
865 Nórdico
860 Portugués
852 Eslavo (Latín-2)

Estas a su vez son distintas que las utlizadas por Windows, por lo que se gereran confusiones al trabajar con Sistemas Operativos diferentes, como indico más adelante.


Los juegos de caracteres o página de códigos se han estandarizado para los distintos idiomas clasificándose según los mismos, de la siguiente forma:

Europeos:
Griego, Romano, Armenio, Cirílico y Georgiano.
Índicos del norte:
Bengalí, Devanagari, Gujarati, Gurmukhi y Oriya.
Índicos de sur:
Kannada, Malayo, Singalés, Tamil y Telugu.
Ïndicos del sureste:
Burmese, Khmer, Laosiano y Thai.
Índicos del Asia central:
Tibetano
Medio Oriente:
Árabe, Hebreo
Asia oriental:
Han, Bopomofo, Kana y Hangul
Otros asiáticos:
Lanna Thai, Mangyan, Mongolian, Naxi, Pollard, Pahawh, Mong, Tai L, Tai Na y el Yi
Africanos:
Ethíope, Osmanya, Tifinagh y Vai
Americanos nativos: Cree
De lenguas artificiales:
Químico, Matemáticos e Iconos publicitarios e IPA ("International Phonetic Alphabet")

En la actualidad en el mundo utilizan alrededor de 30 juegos de caracteres distintos. Entre ellos algunos sirven a más de un idioma. Por ejemplo el romano se usa en Europa occidental y también en otras zonas del planeta.

Los juegos de caracteres pueden ser alfabéticos e ideográficos. En los alfabéticos se encuadran los idiomas o lenguas en las que las palabras están representadas por caracteres del alfabeto, es decir, las letras como tal, los símbolos de puntuación o las cifras. Los ideográficos corresponden a lenguas en las que una idea o los objetos se representan con glifos o ideogramas.

"El código ASCII:
ASCII tiene el antecedente en el instituto ANSI
(American National Standards Institute). Es un grupo de 128 caracteres numerados del 0 al 127, debido a que emplea 7 bits (2 elevado a 7 == 128), suficientes en la época en la cual se propuso. Algunos piensan que el código ASCII se compone de 256 caracteres (del 0 al 255), es decir un byte, pero ciertamente el US-ASCII (ANSI X3.4-1968) se compone de sólo 7 bits que abarcan 128 caracteres El primero es "null" con el número 0 y el último es el 127.

En los 128 caracteres del código ASCII original se encuentran las letras del alfabeto inglés (incluidas las mayúsculas y minúsculas), los números, y algunos otros signos (dólar, espacio en blanco, paréntesis, suma, resta, retorno de carro etc. etc.). Ocupan los 32 primeros números siendo los llamados caracteres de control. Algunos como no son imprimibles se designan mediante nemónicos.

El ASCII extendido:
Los 128 caracteres del US-ASCII o "ASCII puro" no fueron suficientes para representar los signos de otros idiomas tales como la "Ñ" y el acento, por lo cual se amplió a 2 bytes (256 caracteres) lo que se llamó ASCII extendido. Los primeros 128 números continuan reresentando el US-ASCII, y los 128 caracteres incorporados añadieron todas las letras y signos que son especificos del idioma de cada país.

Algunas páginas de código que tienen 256 caracteres anchos son muy grandes (64 K entradas), y no suelen cargarse completas, sólo lo hacen los primeros 256 caracteres junto con otros rangos que necesitará el programa para corre en la máquina. Es una barbaridad cargar el conjunto Japonés de caracteres Kanji que ocupa 5.316 MB, si sólo vamos a emplear idiomas Europeos que con el juego de caracteres Latino básico es suficiente, ocupando nada más que 126 KB.

Como suele suceder las empresas no se atuvieron a una homogeneización creando sus propias variaciones sobre ASCII, configurando páginas de código distintas con los consiguientes problemas que esto ocasiona.

Los juegos de caracteres del ASCII extendido es distinto en los sistemas operativos MSDOS, Windows, Macintosh y Unix. No obstante algunas de estas versiones se han estandarizado como el ISO 8859, que conforman 15 páginas de código.

ISO 8859-1 (Latin-1) Europa occidental
ISO 8859-2 (Latin-2) Europa oriental (países eslavos)
ISO 8859-3 (Latin-3) Europa suroriental
ISO 8859-4 (Latin-4) Europa septentrional

ISO 8859-5 Cirílico
ISO 8859-6 Árabe
ISO 8859-7 Griego
ISO 8859-8 Hebreo
ISO 8859-9 (Latin-5) Europa oriental + Turquía

ISO 8859-10 (Latin-6)

ISO 8859-11 Latin/Thai

ISO 8859-13 (Latin-7)

ISO 8859-14 (Latin-8) Celta

ISO 8859-15 (Latin-9)

ISO 8859-16 (Latin-10)

UTF-8 está actualmente estandarizado como RFC 3629, siendo una transformación de formato de ISO 10646 y sustituye a la RFC 2279.

DIFERENTES SISTEMAS OPERATIVOS - (S.O.) - En inglés Operating Systems:
Apple Mac OS 9.2, Mac OS X 10.1, Mac OS X Server, ATSUI
Bell Labs Plan 9 - Proyecto de 1995, totalmente funcional, y que implementa la idea de un sistema operativo distribuido puro, creación de Ken Thompson, el padre del sistema operativo UNIX. Su entorno gráfico es totalmente espartano, pero su utilidad es altísima en proyectos en los que se tenga que trabajar con máquinas muy dispares y distantes entre sí. Contiene un sistema de programación dialecto de C, una shell simplificada y un emulador POSIX que admite código UNIX.
Compaq's Tru64 UNIX, Open VMS
GNU/Linux
IBM AIX, AS/400, OS/2
Inferno by Vita Nuova
Java platform
Microsoft Windows (varios)
Sun Solaris


 

Si después de toda esta explicación, aún tiene dudas o no comprende algo, me ofrezco para cualquier información complementaria. Para ello basta con enviar un correo electrónico anevado@antonionevado.info y atenderé su petición lo antes posible.

Dado que soy ISPV, puedo realizar la compra de cualquier dominio en internet; pero como no se trata de hacer negocio sino de promocionar la "Ñ" y el acento en internet, ofrezco gratuitamente para la CAMPAÑA "PRO - Con EÑE y Con ACENTO en Internet" a cualquier particular un nombre bajo el dominio "DeEspaña.net" de la siguiente forma: NombreElegido.DeEspaña.net - Como por ejemplo http://www.CitaConPilar.RadioNacional.DeEspaña.net, http://www.PilarSocorroEnRadioNacional.DeEspaña.net o http://www.PilarSocorro.DeEspaña.net y para las empresas su resgitro gratuito en el portal Empresas.DeEspaña.net

Ir a la página de ñññ.eñeros.com

 

 

 

con EÑE y con ACENTO (en internet)