Inicio Sistemas Sobre las URL (Uniform Resource Location)

Sobre las URL (Uniform Resource Location)

16 minutos de lectura
0
0
2,196

¿Qué es una URL?

Una URL (Uniform Resource Location) es la dirección concreta de un recurso (una página web, una imagen, un vídeo, un directorio,…) en Internet. Cualquier elemento almacenable existente en Internet, posee una URL.

Cada URL es única, con lo que es un identificador absoluto para un determinado recurso. Si la URL es correcta sólo habrá un solo recurso posible al que se puede referir.

Formación de una URL

La sintaxis completa de una URL es la siguiente:

protocolo://usuario:contraseña@dominio:puerto/ruta?busqueda#fragmento

Se detalla el significado de todos los elementos

  • El protocolo o esquema de red. Hace referencia al nombre de protocolo de red necesario para poder alcanzar el recurso al que hace referencia la URL. Protocolos habituales son:
    • http:// (para recursos de la web)
    • https:// (para recursos de la web contenidos en un servidor seguro)
    • ftp:// (recursos contenidos en un servidor de ficheros)
    • ftps:// (recursos contenidos en un servidor de ficheros seguro)
    • mailto: (dirección de correo electrónico)
    • tel: (teléfono)
    • file:/// (recurso dentro de nuestra propia computadora)

    Tras el protocolo se indican dos puntos, tras los cuales normalmente se indican dos barras para indicar la máquina. Pero los protocolos que no hacen referencia a archivos, no usan barras (como mailto o news) y también ocurre que file usa tres barras si la ruta al recurso es local.

  • Usuario y contraseña. Opcional. Se utiliza sólo para acceder a recursos que lo requieren. La contraseña es opcional, se puede indicar el usuario y no la contraseña (normalmente el servicio de destino de la URl nos solicitará la contraseña).

    Tras el usuario (y contraseña) obligatoriamente se debe indicar el símbolo de la arroba @

  • Nombre de dominio. Nombre completo en Internet de la máquina (o la red) que posee el recurso en forma de nombre de dominio.

    Por ejemplo: ftp.rediris.eswww.nasa.gov, o www.diego.si o google.com

    Actualmente los nombres de dominio (desde que se actualizó para ello el protocolo DNS) no distinguen entre mayúsculas y minúsculas.

  • Puerto. Opcional. Puerto por el que se debe conectar con el servidor para obtener el recurso. Si no se indica (que es lo habitual) se toma el puerto por defecto. Por ejemplo en http el puerto por defecto es el 80. Si queremos usar uno en particular se indica tras el servidor poniendo dos puntos y el puerto. Por ejemplo http://www.midb.com:1521
  • Ruta. Opcional. Indica el recorrido dentro de la máquina que hay que hacer a través de los directorios para llegar al recurso que queremos. Se pone después del servidor. Ejemplos:
    • /index.html Accede a la página index.html situada en el directorio raíz.
    • /imagenes/paisajes/foto001.jpg Accede a la imagen foto001.jpg dentro del directorio paisajes dentro, a su vez, del directorio paisajes
  • Cadena de búsqueda. Opcional. Sólo aparece tras direcciones a páginas web que admitan recibir parámetros (como las páginas PHP, ASP o JSP por ejemplo).

    Ejemplo ?pagina=5&idioma=es, pasará los parámetros pagina y lenguaje usando los valores 5 y es respectivamente.

  • Localizador interno. Opcional. Va detrás del símbolo # y sirve para indicar un identificador (que puede ser más o menos complejos) que permita localizar o seleccionar una parte concreta del recurso destino de la URL.

Ejemplos de URL:

  • http://diego.si

    Serviría para obtener la página web principal del sitio web del profesor Diego Córdova. Puesto que no se indica ningún puerto, se usará el puerto por defecto del protocolo http (será el 80).

  • ftp://ftp.microserver.net

    Accede, sin indicar usuario ni contraseña, a la raíz del sitio FTP
    microserver.net.

  • ftp://diego:xxxxx@ftp.microserver.net

    Accede con el usuario diego y la contraseña xxxxx a la raíz del sitio ftp indicado

  • ftp://diego:xxxxx@ftp.microserver.net:12345/linux/clave.txt

    Accede con el usuario diego y la contraseña xxxxx al documento clave.txt que está en el directorio Linux del servidor ftp indicado. Usa el puerto 12345

  • http://www.misitio.com/noticias/noticia1.html

    Accede, usando el protocolo http de la web, a la página web noticia1.html que se encuentra en el directorio noticias que, a su vez, cuelga de la raíz del servidor web www.misitio.com

  • http://www.misitio.com:12345/noticias/noticia1.html

    Accede al mismo recurso, pero utilizando el puerto 12345

  • http://www.misitio.com/servicios/busqda/avanzada.jsp?texto=diego

    Accede al recurso avanzada.jsp y usa una cadena de búsqueda para enviar la variable textocon el valor Jorge.

  • http://www.misitio.com/informacion.html#Palencia

    Accede a la página web información.html y se coloca en la posición llamada Palencia

  • http://www.misitio.com/cpyright.txt#line=5,10

    Accede al documento de texto cpyright.txt y selecciona las líneas de la 5 a la 10.

  • mailto:contacto@diego.si

    Hace referencia al buzón de correo electrónico contacto@diego.si

  • mailto:Contacto<contacto@diego.si>

    Hace lo mismo que el anterior, pero además rellena el nombre de la persona poseedora del correo. En los programas de correo si se indica un texto entre los símbolos < y (entidades &lt; &gt;) se entiende que esa es la dirección de correo y el texto que queda fuera se entiende que el es el nombre personal del destinatario del correo.

  • mailto:contacto@diego.si,info@diego.si

    Envía el correo a esos dos buzones.

  • mailto:contacto@diego.si?subject=hola&body=saludo

    Envía un correo al buzón indicado y rellena el apartado del asunto del correo con el texto hola y el contenido del mismo que será el texto saludo.

  • tel:900999999

    Llama al teléfono indicado.

    URL con caracteres no permitidos

El texto de una URL no puede utilizar cualquier carácter. Tenemos el sempiterno problema de no poder utilizar símbolos más allá de las letras y números de la tabla ASCII original y de no poder utilizar más que un número reducido de caracteres para separar palabras.

Los caracteres permitidos en una URL son:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 0 - _ ~ .

Cualquier otro no es válido. Sí se pueden utilizar una serie de caracteres reservados, que sirven para indicar en una URL situaciones especiales (envío de parámetros al servidor, direcciones de puerto, usuarios, contraseñas,…).

Es decir, no pueden formar parte del nombre de un directorio, servidor o archivo pero sí pueden aparecer en una URL utilizados correctamente en el apartado correspondiente. Estos caracteres son:

! # $ % & ‘ ( ) * + , / : ; = ? @ [ ]

Si necesitamos codificar en la URL símbolos fuera de los caracteres permitidos entonces debemos codificarlos usando una notación que comienza con el símbolo % y le sigue el código hexadecimal correspondiente en el código ASCII extendido europeo (ISO 8859-1). Así, si una URL contiene un código reservado tendríamos que codificarlo mediante:

!

#

$

%

&

(

)

*

%20

%21

%23

%24

%25

%26

%27

%28

%29

%2A

+

,

/

:

;

=

?

@

[

]

%2B

%2C

%2F

%3A

%3B

%3D

%3F

%40

%5B

%5D

La lista completa de símbolos que se pueden codificar es:

espacio

<

>

\

^

`

{

|

}

%20

%22

%3C

%3E

%5C

%5E

%60

%7B

%7C

%7D

Š

Œ

Ž

%8A

%8B

%8C

%8E

%91

%92

%93

%94

%95

%96

¢

£

¥

|

§

¨

©

ª

«

¬

%A2

%A3

%A5

%A6

%A7

%A8

%A9

%AA

%AB

%AC

·

¸

¹

º

»

¼

½

¾

¿

%B6

%B7

%B8

%B9

%BA

%BB

%BC

%BD

%BE

%BF

É

Ê

Ë

Ì

Í

Î

Ï

Ð

Ñ

Ò

%C9

%CA

%CB

%CC

%CD

%CE

%CF

%D0

%D1

%D2

Ý

Þ

ß

à

á

â

ã

ä

å

æ

%DD

%DE

%DF

%E0

%E1

%E2

%E3

%E4

%E5

%E6

ð

ñ

ò

ó

ô

õ

ö

÷

ø

ù

%F0

%F1

%F2

%F3

%F4

%F5

%F6

%F7

%F8

%F9

ƒ

ˆ

%80

%82

%83

%84

%85

%86

%87

%88

%89

˜

š

œ

ž

Ÿ

¡

%97

%98

%99

%9A

%9B

%9C

%9E

%9F

%A1

¯

®

¯

°

±

²

³

´

µ

%AD

%AE

%AF

%B0

%B1

%B2

%B3

%B4

%B5

À

Á

Â

Ã

Ä

Å

Æ

Ç

È

%C0

%C1

%C2

%C3

%C4

%C5

%C6

%C7

%C8

Ó

Ô

Õ

Ö

Ø

Ù

Ú

Û

Ü

%D3

%D4

%D5

%D6

%D8

%D9

%DA

%DB

%DC

ç

è

é

ê

ë

ì

í

î

ï

%E7

%E8

%E9

%EA

%EB

%EC

%ED

%EE

%EF

ú

û

ü

ý

þ

ÿ

Salto de línea

%FA

%FB

%FC

%FD

%FE

%FF

%0A ó 

%0D ó 

%0D%0A

Por aclarar mejor la cuestión, vamos a explicar una situación. Supongamos que tenemos a nuestra disposición un servidor accesible mediante la URL http://www.miservidor.com, y en él creamos una página accesible desde Internet llamada mi pagina.html, esta página web la hemos alojado en el directorio pruebas que cuelga de la raíz del servidor. Entonces un usuario que quiera acceder a esa página en teoría lo intentaría hacer mediante la URL:

http://www.miservidor.com/pruebas/mi pagina.html

Pero, el nombre de la página web tiene un espacio en blanco y eso no es válido. La URL correcta sería (%20 es el código hexadecimal ASCII del espacio en blanco):

http://www.miservidor.com/pruebas/mi%20pagina.html

  • Protegido: jelv240227

    No hay extracto porque es una entrada protegida. …
  • Protegido: ggcm240227

    No hay extracto porque es una entrada protegida. …
  • Práctica básica 1 – Tarea 1 y 2

    Elaborar un resumen en word respetando la normatividad APA de las lecturas   1.- Chan…
Cargar más artículos relacionados.
  • Protegido: jelv240227

    No hay extracto porque es una entrada protegida. …
  • Protegido: ggcm240227

    No hay extracto porque es una entrada protegida. …
  • Práctica básica 1 – Tarea 1 y 2

    Elaborar un resumen en word respetando la normatividad APA de las lecturas   1.- Chan…
Cargar más de Diego
Cargar más en Sistemas

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Mira también

Protegido: jelv240227

No hay extracto porque es una entrada protegida. …