URL Localizador de Recursos HTML

Una URL es otra forma con letras (o palabras) para una dirección web. Una URL puede ser compuesta por palabras com exasoluciones.com; o una dirección IP (Internet Protocol) como 192.168.1.4. Es más fácil recordar las palabras que los números, por eso más común utlizar las URL's.

Los navegadores web solicitan páginas de los servidores web mediante el uso de una URL. Un Localizador uniforme de recursos (URL) se utiliza para abordar un documento (u otros datos) en la web

Una dirección web, como https://www.exasoluciones.com/html/default.php, sigue estas reglas de sintaxis:

scheme://prefix.domain:port/path/filename

Explicación:

  • scheme: define el tipo de Servicio de Internet (como http o https).
  • prefix: define el prefijo del dominio (como www).
  • domain: define el nombre del dominio (como exasoluciones.com)
  • port: define el número de puerto de un host (por defecto para http es 80).
  • path: define una ruta para el servidor (si se omite: el directorio raiz del sitio).
  • filename: define el nombre de un documento o recurso.

Esquemas comunes de URL

La siguiente tabla lista algunas schemes comunes:

schema Descripción Usado para
http Protocolo de Transferencia de Hipertexto Páginas Web comunes. No encriptada.
https Protocolo Seguro de Transferencia de Hipertexto Páginas Web seguras. Encriptada.
ftp Protocolo de Transferencia de Archivos Descarga y Subida de Archivos

Codificación URL

Las URLs solo pueden enviarse a través de Internet utilizando con el conjunto de caracteres ASCII. Si una URL contiene caracteres fuera del conjunto ASCII, la URL debe convertirse.

La codificación URL convierte caracteres que no son ASCII en un formato que se puede transmitir a través de Internet.

La codificación URL reemplaza los caracteres que no son ASCII con un "%" seguido de dígitos hexadecimales.

Las URL no pueden contener espacios. La codificación URL normalmente reemplaza un espacio con un signo más (+), o %20. 

Ejemplos de codificación ASCII

El Navegador codificará la entrada, de acuerdo con el juego de caracteres utilizado en la página.

El conjunto de caracteres predeterminado en HTML5 es UTF-8.

Caracter Windows-1252 UTF-8
%80 %E2%82%AC
£ %A3 %C2%A3
© %A9 %C2%A9
® %AE %C2%AE
À %C0 %C3%80
Á %C1 %C3%81
 %C2 %C3%82
à %C3 %C3%83
Ä %C4 %C3%84
Å %C5 %C3%85