Tema 8. Internet: arquitectura de red.19 min read

TEMA 8 – Internet:
Arquitectura de red.
Origen, evolución y estado actual.
Principales servicios. Protocolos HTTP, HTTPS y TLS.
Configuración de navegadores web.
Privacidad y seguridad de navegadores web.

 

1. INTRODUCCIÓN
La nueva sociedad es el resultado de la rápida implantación y difusión de las nuevas
tecnologías, y en especial de Internet, que en la actualidad constituye la mayor fuente de información del mundo. Uno de sus servicios por excelencia, la World Wide Web, ha sido clave para el éxito y democratización de esta potente herramienta comunicativa, hasta tal punto que es habitual confundir ambos términos.

 

Tal y como reconoció la IFLA (Federación Internacional de Asociaciones de Bibliotecarios y Bibliotecas) en su manifiesto sobre Internet de 2002, internet favorece la igualdad de acceso a la información de todas las personas y comunidades en favor de su desarrollo personal, educativo y económico.

Las bibliotecas, para las que la información es la materia prima de su actividad, deben ser portales de referencia para conocer el contenido de internet, ya que, a través de ellas, pueden superarse las barreras derivadas de las diferencias en recursos, tecnología y formación.

 

2. INTERNET: ORIGEN Y EVOLUCIÓN HASTA NUESTROS DÍAS
Internet es hoy un conjunto descentralizado de redes de comunicación interconectadas, que funciona como una red lógica única de alcance mundial.

Aunque su gran difusión se produjo durante los años 90, lo cierto es que data de los años 60. En concreto, sus orígenes se remontan a 1969, cuando el Departamento de Defensa de los EE.UU. desarrolló ARPANET, una red de comunicación creada durante la Guerra Fría con el objetivo de resistir a entornos bélicos, incluidos posibles ataques nucleares.

En sus inicios, este proyecto militar, basado en las valiosas investigaciones del MIT (Masachusetts Institute of Technology), contó sólo con cuatro nodos, entendiendo por nodo el punto donde se unen dos o más redes.

A comienzos de los 70 no sólo poseía cerca de 50 nodos, sino que ya había establecido las primeras conexiones internacionales con Inglaterra y Noruega.

Cuando, hacia los años 80, esta red dejó de tener interés para el sector militar, pasó a manos de otras agencias gubernamentales estadounidenses. A partir de ahí, su evolución fue imparable.

Introdujo la primera aplicación de correo electrónico y se convirtió en precursora del
tipo de actividad que se observa actualmente en la Web.

ARPANET fue así la red experimental sobre la que se probaron las teorías y el software en el que hoy está basado Internet, la red de redes.

Una de esas tecnologías clave experimentadas fue el protocolo TCP/IP.

EL PROTOCOLO DE COMUNICACIÓN TCP/IP: PIEDRA ANGULAR DE INTERNET HOY

Un protocolo puede definirse como el conjunto de normas establecidas entre dos o más
ordenadores para que puedan comunicarse entre sí.

El TCP/IP fue el medio ideado por los expertos Robert Kahn y Vinton Cerf, para facilitar la conexión entre ordenadores de distinto tipo. Fue desarrollado a comienzos de los años 70, también en el seno del Departamento de Defensa de los EEUU.

En primer lugar apareció el TCP (Transmission Control Protocol) y un poco más tarde el IP (Internet Protocol).

La misión del TCP es dividir los datos en pequeños paquetes de bytes para que viajen por Internet. Es el encargado de desensamblarlos y ensamblarlos posteriormente en su destino.

El IP se sitúa en un nivel inferior y sirve para que los datos conozcan dicho destino cuando viajan de un ordenador a otro en la red.

El TCP/IP usa el modelo de comunicación cliente/servidor. El usuario de un ordenador (cliente) requiere un servicio (por ejemplo, la consulta de un sitio web) de otro ordenador (servidor).

Gracias a este protocolo, se establece una comunicación desde un punto de la red a otro.

La red está formada por múltiples servidores conectados entre sí y a cada servidor se conectan numerosos ordenadores clientes. Como Internet es una red de redes, cuando un ordenador cliente utiliza su protocolo TCP/IP para conectarse, en realidad lo hace a una estructura superior, que suele ser una red regional, nacional, supranacional, etc.

Estas redes conforman las distintas capas de Internet y presentan sus propios nodos de control o gateways para garantizar la fiabilidad de las conexiones.

En la actualidad, cada ordenador conectado tiene asignado un número identificativo único, una dirección inequívoca a través de la cual accede a Internet, denominada IP.

Las direcciones IP se componen de 4 grupos de números de tres dígitos cada uno. Poseen una estructura jerárquica y presentan dos partes: una identifica la red concreta y la otra identifica localmente al ordenador dentro de la red.

Para facilitar la memorización de las direcciones IP, se ha establecido un sistema de nombres de dominio que ayuda a identificarlas y recordarlas. Este sistema, que asocia nombres en lenguaje natural con direcciones numéricas, se denomina DNS (Domain Name System).

Sobre esta importante infraestructura, fruto de la investigación y perfeccionamiento tecnológico, se ha cimentado el funcionamiento de la red de comunicaciones más importante del mundo, pero no cabe duda de que Internet no sería lo que es hoy sin la existencia de la WWW.

LA WORLD WIDE WEB: ORIGEN Y EVOLUCIÓN HASTA NUESTROS DÍAS

A finales de los años 80, la interconexión de miles de redes de área local había convertido internet en el mayor almacén de datos jamás visto, pero también en el más caótico.

Sus posibilidades eran enormes, pero las dificultades causadas por la incompatibilidad de formatos, programas, etc. resultaban frustrantes. Era necesario simplificar el acceso a tal cantidad de información de una manera más sencilla y homogénea.

Éste fue uno de los objetivos de Tim Berners-Lee, quien, en 1989, presentó en el CERN (Consejo Europeo para la Investigación Nuclear, emplazado en Suiza) su propuesta original de proyecto para la World Wide Web.

Su primera versión operativa se aplicó en el CERN en 1991 y ese mismo año el sistema se abrió a Internet.

Su éxito ha sido tal que, en poco más de una década, la World Wide Web o Red Global Mundial, conocida comúnmente como la Web, se ha impuesto como la alternativa más potente
y rápida para la difusión internacional de información a través de Internet.

En la actualidad, el volumen documental que alberga es asombroso. Se dice que todo está en la Web, y lo que no está es porque no existe.

Los elementos en que se basa la WWW son fundamentalmente: la arquitectura cliente/servidor, ya comentada, el concepto de hipertexto e hipermedia y los lenguajes de marcado, en especial HTML y, cada vez más, XML.

LENGUAJES DE MARCADO Y CARACTERÍSTICA HIPERTEXTUAL DE LA WEB

Los lenguajes de marcado son modos de codificar un documento mediante la incorporación,
junto al texto, de etiquetas o marcas provistas de información adicional sobre la estructura o presentación que ha de tener el mismo.

En la actualidad, aunque el lenguaje extensible XML se impone cada vez con más fuerza, la construcción de la mayoría de páginas web continúa basándose en el Lenguaje de Marcas de Hipertexto HTML (HyperText Markup Language), definido por Sir Tim Berners-Lee en 1990, a partir de la sintaxis de un lenguaje anterior, el SGML (Lenguaje de marcado generalizado).

La característica que dota a HTML de un poder extraordinario frente a otros lenguajes
es su capacidad hipertextual, es decir, su capacidad para establecer vínculos con otros
documentos electrónicos.

El término hipertexto fue acuñado en 1965 por Theodor Nelson para definir un sistema de
lectura y escritura no lineal.

En el contexto digital actual, el hipertexto es un sistema de organización y acceso a la información basado en la asociación de documentos, que utiliza para ello un sistema informático.

Este principio de asociación permite que se pueda acceder desde una idea a otras íntimamente relacionadas, en virtud de diferentes criterios. Si a esto se añade la capacidad de integrar distintos tipos de información (textual, imagen, sonido), nos
encontramos frente a lo que se denomina hipermedia.

Los documentos web escritos con HTML tienen la gran ventaja de poder mostrar texto con
enlaces a otras partes de la misma página (anclas), a otras páginas (hiperenlaces), o incluso a servidores distintos. Se trata de una navegación hacia documentos parejos que sólo exige del usuario un simple click con el ratón.

A la realización de saltos hipertextuales, esto es, de un nodo de origen a un nodo de destino, contribuye igualmente el protocolo http (HyperText Transfer Protocol), hablado por todos los servidores de la WWW.

Por otra parte, la estructura hipermedia de la web es también posible gracias a la existencia de las herramientas software necesarias para crear y visualizar los documentos, es decir, los NAVEGADORES.

Los navegadores permiten la visualización de los documentos por parte de los usuarios, actuando como interfaz entre estos y los componentes de la página web.

Además, facilitan múltiples prestaciones de apoyo a la navegación, tales como las prestadas por los botones Anterior (Back) y Siguiente (Forward), que con una simple pulsación vuelven a un documento web anterior o posterior del historial del usuario, evitando así la necesidad de establecer una nueva conexión con una página ya visitada.

La opción Favoritos (Bookmarks), que guarda de forma permanente las páginas de especial interés para el usuario, es otra de las más utilizadas. Las páginas web escogidas se conservan en un índice con el nombre sus URL (Uniform Resource Locator), es decir, de sus direcciones web.

Asimismo, cabe señalar que, cada vez más, y debido a los problemas de recuperación y el acceso a la información masiva de Internet, los navegadores posibilitan la inclusión de barras pertenecientes a buscadores, para lanzar conexiones directas a los motores de búsqueda, sin necesidad de escribir su URL.

El buscador estrella hoy en día es Google, aunque existen también otros como Yahoo,
Altavista, Excite o Vivísimo.

LA WEB SOCIAL
Desde 2004, se puede hablar de una segunda generación en la historia de la Web, denominada Web Social o Web 2.0. Está basada en comunidades de usuarios, que hacen uso
de servicios tales como redes sociales, cuadernos de bitácora, etc., que fomentan la
colaboración y el intercambio ágil de información.

Es un fenómeno que afecta por igual a los diferentes ámbitos de la actividad humana, pues está presente en las relaciones sociales, economía, comunicación, administración, educación, cultura…

Ningún área escapa a las posibilidades de esta nueva generación Web, mucho menos aquéllas en las que la gestión de información constituye la base de su ejercicio profesional, como la Biblioteconomía.

Gracias a Internet, las bibliotecas y centros de documentación pueden prestar hoy múltiples servicios virtuales a través de sus sedes web: servicios de información y referencia, acceso a los catálogos en línea (OPAC) y consulta remota de documentos digitales, resolución de dudas por correo electrónico, construcción de catálogos colectivos como fruto de la cooperación interbibliotecaria, servicios de alerta sobre novedades, actividades de formación y extensión cultural a distancia, etc.

Pero, aparte de estas opciones más organizadas y planificadas, surgen otras más espontáneas, aunque igualmente válidas, que ayudan a desempeñar la tarea bibliotecaria.

Es el caso de las listas de distribución o blogs, que se convierten en auténticos foros de debate o actualizadísimos boletines de información útil para profesionales y Usuarios.

Bibliotecas tan importantes a nivel internacional como la Biblioteca del Congreso de Estados Unidos ya aprovechan las posibilidades que les ofrece la Web Social, por ejemplo, a través de Flickr, sitio web en el que cuelgan parte de sus colecciones fotográficas.

En España, la biblioteca de la Universidad de Sevilla también hace ya uso de Flickr para mostrar y promocionar sus instalaciones.

INTERNET Y LA WORLD WIDE WEB: PERSPECTIVAS DE FUTURO
En la 10ª Conferencia de la WWW, celebrada en mayo de 2001, Tim Berners-Lee advirtió ya
que Internet estaba lejos de su madurez.

Por un lado, sigue presentando el problema de ser un enorme y caótico almacén de información, en cuyo orden se está trabajando mediante el desarrollo y perfeccionamiento de estándares como el DC, lenguaje RDF (Resource Description Framework), etc.

Por otro, Internet está ampliando su campo de actuación a agendas PDA, móviles, etc., lo que está creando un nuevo universo informático y comunicativo “nómada”. Estos novedosos modos de acceso darán lugar a nuevas formas de servicio y a aplicaciones aún desconocidas, que harán evolucionar a la propia Red.

Pero eso no es todo. La Web Semántica es el ideal hacia el que camina hoy la WWW. Es un
ambicioso proyecto, promovido por el propio Tim Berners-Lee, para lograr que las máquinas puedan entender y, por tanto, utilizar correctamente lo que la Web contiene.

Sobre la base de la estructura tecnológica actual, como los lenguajes RDF o XML, se pretende dotar a los recursos de algún elemento que añada información sobre la propia información, de manera que ésta sea utilizada “con lógica” por los ordenadores.

No se trata, por tanto, de una sustitución de la Web actual, sino de una extensión que permita a los equipos procesar “conocimiento” y no únicamente datos.

Protocolos HTTP, HTTPS y TLS.

Algunos de los protocolos de seguridad en Internet más conocidos son los protocolos SSL, protocolos TLS y los protocolos HTTPS. Cada uno realiza una funcionalidad distinta, que permiten una mayor seguridad cuando navegamos por Internet.

Para poder entender las diferencias, lo importante es entender su funcionalidad y usos, ya que, aunque algunos se utilicen en ámbitos parecidos, no todos comparten los mismos usos dentro de lo que sería el campo de la seguridad en Internet.

Funcionalidad y usos de los protocolos SSL, TLS y HTTPS

Protocolo SSL
El protocolo SSL (Capa de Puertos Seguros) es el predecesor del protocolo TLS (Seguridad de la Capa de Transporte). Se trata de protocolos criptográficos que proporcionan privacidad e integridad en la comunicación entre dos puntos en una red de comunicación. Esto garantiza que la información transmitida por dicha red no pueda ser interceptada ni modificada por elementos no autorizados, garantizando de esta forma que sólo los emisores y los receptores legítimos sean los que tengan acceso a la comunicación de manera íntegra.

Uno de sus usos más extendidos, es el que se realiza junto al protocolo HTTP, dando lugar al HTTPS o versión segura de HTTP. Se utiliza para la transferencia de hipertexto, sitios web, de manera segura. De esta forma se consigue que la información transmitida entre un sitio web y un usuario, bidireccional, sea segura, especialmente importante cuando se trata de información sensible.

Como se menciona, es más común su uso en el caso de sitios web, del cual hace uso el protocolo HTTPS para un funcionamiento estable haciendo uso de certificados emitidos por entidades especializadas en ello, los cuales están encriptados, tanto a nivel de certificado en sí como su clave y su cadena de certificación. Precisamente por ello, los protocolos de correo tienen una opción de uso segura donde cuentan con puertos securizados, SSL, para que el intercambio de hipertexto de esta forma pueda seguir siendo igual de segura. En el caso de POP3 e IMAP usan SSL, al igual que se dan casos en la que la encriptación hace uso de TLS, pero en el caso del protocolo de envío, SMTP, hace uso exclusivo del protocolo TLS. Los puertos que utilizan en este caso serían 995 para POP3, 993 para IMAP y 465 para SMTP. Estos puertos también cubren el uso de TLS.

Anteriormente éste se conocía como SSL. Dado que esta abreviatura sigue siendo más popular que TLS, es habitual que nos refiramos a TLS con la doble denominación SSL/TLS ya que, al final del día, el TLS es la evolución natural y más segura del SSL.

Protocolo TLS
El protocolo TLS es un proceso que encripta los flujos de datos de Internet para que solo sus legítimos destinatarios puedan leerlos, de aquí que en correo se use en el protocolo SMTP, al igual que, por su tipo de encriptación, es algo que esencialmente se utiliza en todo campo que utilice SSL. El ámbito de aplicación más importante de TLS es Internet en sí, o más concretamente, el protocolo cifrado HTTPS. La seguridad en un cifrado TLS completamente seguro es tan alta que en su momento se buscó implantarle una vulnerabilidad a las comunicaciones realizadas mediante este protocolo, de forma que autoridades pudieran inspeccionar dichas comunicaciones para intentar prevenir diferentes tipos de actividades delictivas.

Protocolo HTTPS
El protocolo HTTPS tiene como base el protocolo HTTP, con el añadido de la seguridad, por lo que utiliza una conexión segura que se basa en el sistema de cifrado SSL. Esto permite que los datos puedan viajar de manera segura de un punto a otro, y que no puedan ser captados por cualquiera. De esta forma, tratar con información sensible en entornos online resulta menos peligroso que en entornos con uso de HTTP, e incrementa la privacidad de manejo de dicho tipo de datos. No solo eso, si no que a ojos de navegadores web, mejora la credibilidad y la posición en los motores de búsqueda para que puedan ser encontrados antes.

Privacidad y seguridad de navegadores web

La recopilación y el seguimiento de datos se han convertido en una epidemia digital en la última década, ya que la información del usuario se ha convertido en el producto más grande del mundo. Los principales navegadores son algunos de los peores delincuentes.

En particular, Google Chrome, Microsoft Edge y Safari usan cookies para rastrear los sitios web que visitas y mantener registros de tu historial de navegación, todo para enviarte anuncios dirigidos.

Las cookies y la gestión de la privacidad
Las cookies son archivos que contienen pequeños fragmentos de texto con datos que los sitios web que visitas envían al navegador.

De esta manera, pueden identificar al usuario que entra en la web y mejorar su experiencia de navegación.

El informático estadounidense, Lou Montulli, las creó en 1994 con la intención de hacer única la navegación de cada internauta. Estos archivos van colocando las preferencias del navegante y aseguran que los anuncios y elementos predilectos aparezcan los primeros en los motores o en las webs, personalizando la travesía por Internet.

Por ello, cada vez que se ingresa en una página web, esta solicita que se acepten las cookies, lo que supone recabar esos fragmentos de datos y hacer el seguimiento del usuario en su búsqueda.

En general, existen muchos tipos de cookies pero se destacan las cookies propias y las cookies a terceros:

 

Cookies propias:

– De sesión, que surgen al navegar por una web y se borran automáticamente al finalizar sesión. De hecho, ayudan a la privacidad del cibernauta.

– Persistentes, son las que se quedan grabadas en el ordenador, aunque algunas tienen fecha de fin. Entre ellas, se pueden distinguir las siguientes:

– Cookies de autenticación, que permiten recordar las contraseñas.
– Cookies de seguimiento, que posibilitan mejorar el viaje por Internet.
– Cookies de seguridad, que guardan información cifrada para evitar que ciertos datos sean vulnerables.

 

Cookies a terceros

Sin embargo, las cookies a terceros son las que más problemas generan.

No son originarias de las web en las que se entra, sino que surgen en otros sitios distintos a los visitados o se suelen vincular a anuncios.

Por ello, desde mayo del 2018, momento en el que el Reglamento General de Protección de Datos entró en vigor tras la aprobación de la Comisión Europea en 2016, las webs están obligadas a informar de los tipos de cookies que emplean, sus finalidades y su procedencia.

Este aviso sobre la política de cookies es el que surge en cada página a la que se accede.

En España, se concretó con la Ley Orgánica de Protección de Datos Personales y garantía de los derechos digitales, publicada en el BOE el 6 de diciembre de 2018.

Ante esto, es importante acostumbrarse a configurar las cookies cada vez que se entra a un sitio web con objeto de aceptar las indispensables para navegar por dicha página y descartar las innecesarias.

Si bien es cierto que cada vez más sitios tienen solo configuradas las necesarias, es imprescindible hacer un uso responsable evitando aceptar todo sin leer la política de cookies.

Normalmente, esas cookies necesarias suelen ser las técnicas, mientras que las analíticas o de medición y otras cookies son prescindibles, ya que pueden generar molestias por la publicidad que llevan asociadas.

 

Sobre la gestión de la privacidad en los distintos navegadores es preciso saber que, a través de la configuración, se puede:

  • Borrar los datos de navegación, cookies y otros datos.
  • Bloquear las cookies a terceros.
  • Proteger la navegación con modos de navegación segura que permiten bloquear rastreadores y evitar seguimiento del viaje por Internet.

En los navegadores debes ir a la parte superior derecha para acudir al menú (donde hay tres puntos, bien de forma horizontal o bien vertical) y se abre una ventana donde puedes clicar en «Configuración».

Si usas Microsoft Edge, las pestañas a las que debes prestar atención en la «Configuración» son «Privacidad, búsqueda y servicios» y «Cookies y permisos del sitio».

Para Google Chrome todos estos aspectos están en la pestaña «Privacidad y seguridad».