World Wide Web (www)
La World Wide Web (www), comúnmente conocida como Web, es la plataforma de software dominante en el mundo. Es un espacio de información donde se puede acceder a documentos y otros recursos web a través de Internet utilizando un navegador web. La Web ha cambiado enormemente la vida de las personas. Es la principal herramienta que utilizan miles de millones de personas en todo el mundo para interactuar en Internet.
Los recursos web pueden ser cualquier tipo de medio descargable. Las páginas web son documentos interconectados por enlaces de hipertexto formateados en lenguaje de marcado de hipertexto (HTML). La sintaxis HTML muestra hipervínculos incrustados con URL, lo que permite a los usuarios navegar a otros recursos web. Además del texto, las páginas web pueden contener referencias a imágenes, video, audio y componentes de software, que se muestran o se ejecutan internamente en el navegador web del usuario para representar páginas o flujos de contenido multimedia. Las aplicaciones web son páginas web que funcionan como software de aplicación.
Múltiples recursos web con un tema común y, por lo general, un nombre de dominio común conforman un sitio web. Los sitios web se almacenan en computadoras que ejecutan un servidor web, que es un programa que responde a las solicitudes realizadas a través de Internet desde los navegadores web que se ejecutan en la computadora de un usuario. El contenido del sitio web puede ser proporcionado por un editor o de forma interactiva a partir del contenido generado por el usuario. Los sitios web se proporcionan por una miríada de razones informativas, de entretenimiento, comerciales y gubernamentales.
La Web fue originalmente concebida como un sistema de gestión de documentos. La información en la Web se transfiere a través del Protocolo de transferencia de hipertexto (HTTP) para que los usuarios accedan a ella a través de aplicaciones de software.
Historia
El informático inglés Tim Berners-Lee inventó la World Wide Web en 1989 mientras trabajaba en el CERN en Suiza. En 1990 desarrolló las bases de la Web: HTTP, HTML, el navegador WorldWideWeb, un servidor y el primer sitio web para gestionar documentación. El navegador se lanzó fuera del CERN a otras instituciones de investigación a partir de enero de 1991 y luego al público en general en agosto de 1991. La Web fue un éxito en el CERN y comenzó a extenderse a otras instituciones científicas y académicas. En los dos años siguientes, se crearon 50 sitios web.
El CERN hizo que el código y el protocolo web estuvieran disponibles sin regalías en 1993, lo que permitió su uso generalizado. Después de que la NCSA lanzara Mosaic ese mismo año, la Web se volvió muy popular con miles de sitios web que surgieron en menos de un año. Mosaic era un navegador gráfico que podía mostrar imágenes en línea y enviar formularios, y HTTPd, un servidor que podía procesar formularios (ver CGI). Marc Andreessen y Jim Clark fundaron Netscape al año siguiente y lanzaron Navigator, que introdujo Java y JavaScript en la Web. Rápidamente se convirtió en el navegador dominante. Netscape se convirtió en una empresa pública en 1995, lo que desencadenó un frenesí por la Web y comenzó la burbuja de las puntocom.Microsoft respondió desarrollando su propio navegador, Internet Explorer. Al combinarlo con Windows, se convirtió en el navegador dominante durante 14 años.
Tim Berners-Lee fundó el World Wide Web Consortium (W3C) que creó XML en 1996 y recomendó reemplazar HTML con XHTML más estricto. Mientras tanto, los desarrolladores comenzaron a explotar una característica de IE llamada XMLHttpRequest para crear aplicaciones Ajax y lanzaron la revolución Web 2.0. Mozilla, Opera y Apple rechazaron XHTML y crearon WHATWG que desarrolló HTML5. En 2009, el W3C concedió y abandonó XHTML y, en 2019, cedió el control de la especificación HTML a WHATWG.
La World Wide Web ha sido fundamental para el desarrollo de la era de la información y es la principal herramienta que utilizan miles de millones de personas para interactuar en Internet.
Función
Los términos Internet y World Wide Web a menudo se usan sin mucha distinción. Sin embargo, los dos términos no significan lo mismo. Internet es un sistema global de redes informáticas interconectadas a través de telecomunicaciones y redes ópticas. Por el contrario, la World Wide Web es una colección global de documentos y otros recursos, vinculados por hipervínculos y URI. Se accede a los recursos web mediante HTTP o HTTPS, que son protocolos de Internet a nivel de aplicación que utilizan los protocolos de transporte de Internet.
La visualización de una página web en la World Wide Web normalmente comienza escribiendo la URL de la página en un navegador web o siguiendo un hipervínculo a esa página o recurso. Luego, el navegador web inicia una serie de mensajes de comunicación en segundo plano para obtener y mostrar la página solicitada. En la década de 1990, el uso de un navegador para ver páginas web y pasar de una página web a otra a través de hipervínculos se conoció como "navegación", "navegación web" (después de navegar por canales) o "navegar por la web". Los primeros estudios de este nuevo comportamiento investigaron los patrones de los usuarios en el uso de los navegadores web. Un estudio, por ejemplo, encontró cinco patrones de usuario: navegación exploratoria, navegación por ventanas, navegación evolucionada, navegación limitada y navegación dirigida.
El siguiente ejemplo demuestra el funcionamiento de un navegador web al acceder a una página en la URLhttp://ejemplo.org/inicio.html. El navegador resuelve el nombre del servidor de la URL (ejemplo.org) en una dirección de Protocolo de Internet utilizando el Sistema de Nombres de Dominio (DNS) distribuido globalmente. Esta búsqueda devuelve una dirección IP como 203.0.113.4 o 2001:db8:2e::7334. Luego, el navegador solicita el recurso enviando una solicitud HTTP a través de Internet a la computadora en esa dirección. Solicita el servicio de un número de puerto TCP específico que es bien conocido por el servicio HTTP para que el host receptor pueda distinguir una solicitud HTTP de otros protocolos de red a los que puede estar dando servicio. HTTP normalmente usa el número de puerto 80 y para HTTPS normalmente usa el número de puerto 443. El contenido de la solicitud HTTP puede ser tan simple como dos líneas de texto:
OBTENER /home.html HTTP / 1.1 Host: ejemplo.org
La computadora que recibe la solicitud HTTP la entrega al software del servidor web que escucha las solicitudes en el puerto 80. Si el servidor web puede cumplir con la solicitud, envía una respuesta HTTP al navegador que indica el éxito:
HTTP / 1.1 200 OK Tipo de contenido: texto/html; conjunto de caracteres = UTF-8
seguido del contenido de la página solicitada. El lenguaje de marcado de hipertexto (HTML) para una página web básica podría verse así:
< html > < cabeza > < título > Ejemplo.org – La World Wide Web </ título > </ cabeza > < cuerpo > < p > La World Wide Web, abreviada como WWW y comúnmente conocida... </ p > < / cuerpo > </ html >
El navegador web analiza el HTML e interpreta el marcado (, para párrafo, etc.) que rodea las palabras para formatear el texto en la pantalla. Muchas páginas web utilizan HTML para hacer referencia a las URL de otros recursos, como imágenes, otros medios incrustados, secuencias de comandos que afectan el comportamiento de la página y hojas de estilo en cascada que afectan el diseño de la página. El navegador realiza solicitudes HTTP adicionales al servidor web para estos otros tipos de medios de Internet. A medida que recibe su contenido del servidor web, el navegador presenta progresivamente la página en la pantalla según lo especificado por su HTML y estos recursos adicionales. <title>
<p>
HTML
El lenguaje de marcado de hipertexto (HTML) es el lenguaje de marcado estándar para crear páginas web y aplicaciones web. Con hojas de estilo en cascada (CSS) y JavaScript, forma una tríada de tecnologías fundamentales para la World Wide Web.
Los navegadores web reciben documentos HTML de un servidor web o del almacenamiento local y convierten los documentos en páginas web multimedia. HTML describe la estructura de una página web semánticamente y originalmente incluía pistas para la apariencia del documento.
Los elementos HTML son los componentes básicos de las páginas HTML. Con las construcciones HTML, las imágenes y otros objetos, como los formularios interactivos, se pueden incrustar en la página representada. HTML proporciona un medio para crear documentos estructurados al indicar la semántica estructural del texto, como encabezados, párrafos, listas, enlaces, citas y otros elementos. Los elementos HTML están delineados por etiquetas, escritas con corchetes angulares. Etiquetas como e introducen contenido directamente en la página. Otras etiquetas, como envolvente y proporcionan información sobre el texto del documento y pueden incluir otras etiquetas como subelementos. Los navegadores no muestran las etiquetas HTML, pero las utilizan para interpretar el contenido de la página. <img />
<input />
<p>
HTML puede incrustar programas escritos en un lenguaje de secuencias de comandos como JavaScript, lo que afecta el comportamiento y el contenido de las páginas web. La inclusión de CSS define el aspecto y el diseño del contenido. El World Wide Web Consortium (W3C), mantenedor de los estándares HTML y CSS, ha fomentado el uso de CSS sobre HTML de presentación explícito desde 1997.
Enlace
La mayoría de las páginas web contienen hipervínculos a otras páginas relacionadas y quizás a archivos descargables, documentos fuente, definiciones y otros recursos web. En el HTML subyacente, un hipervínculo se ve así: <a href="http://example.org/home.html">Example.org Homepage</a>.
Tal colección de recursos útiles relacionados, interconectados a través de enlaces de hipertexto, se denomina red de información. La publicación en Internet creó lo que Tim Berners-Lee llamó por primera vez WorldWideWeb (en su CamelCase original, que posteriormente se descartó) en noviembre de 1990.
La estructura de hipervínculos de la web está descrita por el gráfico web: los nodos del gráfico web corresponden a las páginas web (o URL) los bordes dirigidos entre ellos a los hipervínculos. Con el tiempo, muchos recursos web señalados por hipervínculos desaparecen, se reubican o se reemplazan con contenido diferente. Esto hace que los hipervínculos se vuelvan obsoletos, un fenómeno al que se hace referencia en algunos círculos como link rot, y los hipervínculos afectados a menudo se denominan enlaces muertos. La naturaleza efímera de la Web ha impulsado muchos esfuerzos para archivar sitios web. Internet Archive, activo desde 1996, es el más conocido de tales esfuerzos.
Prefijo WWW
Muchos nombres de host utilizados para la World Wide Web comienzan con www debido a la práctica de larga data de nombrar hosts de Internet de acuerdo con los servicios que brindan. El nombre de host de un servidor web suele ser www, del mismo modo que puede ser ftp para un servidor FTP y news o nntp para un servidor de noticias de Usenet. Estos nombres de host aparecen como Sistema de nombres de dominio (DNS) o nombres de subdominio, como en www.example.com. El uso de www no es requerido por ningún estándar técnico o de política y muchos sitios web no lo utilizan; el primer servidor web fue nxoc01.cern.ch. Según Paolo Palazzi,quien trabajó en el CERN junto con Tim Berners-Lee, el uso popular de www como subdominio fue accidental; la página del proyecto World Wide Web estaba destinada a publicarse en www.cern.ch, mientras que info.cern.ch estaba destinado a ser la página de inicio del CERN; sin embargo, los registros DNS nunca se cambiaron y la práctica de anteponer www al nombre de dominio del sitio web de una institución se copió posteriormente. Muchos sitios web establecidos todavía usan el prefijo, o emplean otros nombres de subdominio como www2, seguro o en para propósitos especiales. Muchos de estos servidores web están configurados para que tanto el nombre de dominio principal (p. ej., ejemplo.com) como el www.subdominio (por ejemplo, www.example.com) se refiere al mismo sitio; otros requieren una forma u otra, o pueden asignarse a diferentes sitios web. El uso de un nombre de subdominio es útil para equilibrar la carga del tráfico web entrante mediante la creación de un registro CNAME que apunta a un grupo de servidores web. Dado que, actualmente, solo se puede usar un subdominio en un CNAME, no se puede lograr el mismo resultado usando la raíz del dominio desnudo.
Cuando un usuario envía un nombre de dominio incompleto a un navegador web en el campo de entrada de la barra de direcciones, algunos navegadores web automáticamente intentan agregar el prefijo "www" al principio y posiblemente ".com", ".org" y ".net". " al final, dependiendo de lo que pueda faltar. Por ejemplo, ingresar "microsoft" puede transformarse en http://www.microsoft.com/ y "openoffice" en http://www.openoffice.org. Esta característica comenzó a aparecer en las primeras versiones de Firefox, cuando todavía tenía el título provisional 'Firebird' a principios de 2003, a partir de una práctica anterior en navegadores como Lynx. Se informa que a Microsoft se le otorgó una patente estadounidense para la misma idea en 2008, pero solo para dispositivos móviles.
En inglés, www suele leerse como double-u double-u double-u. Algunos usuarios lo pronuncian dub-dub-dub, particularmente en Nueva Zelanda. Stephen Fry, en su serie de podcasts "Podgrams", lo pronuncia wuh wuh wuh. El escritor inglés Douglas Adams bromeó una vez en The Independent on Sunday (1999): "La World Wide Web es lo único que conozco cuya forma abreviada tarda tres veces más en decirse que su abreviatura". En chino mandarín, World Wide Web se traduce comúnmente a través de una coincidencia fono-semántica a wàn wéi wǎng (万维网), que satisface wwwy literalmente significa "red multidimensional", una traducción que refleja el concepto de diseño y la proliferación de la World Wide Web. El espacio web de Tim Berners-Lee afirma que World Wide Web se escribe oficialmente como tres palabras separadas, cada una en mayúscula, sin guiones intermedios. No obstante, a menudo se le llama simplemente la Web, y también a menudo la web; ver Capitalización de Internet para más detalles. El uso del prefijo www ha disminuido, especialmente cuando las aplicaciones web Web 2.0 buscaban marcar sus nombres de dominio y hacerlos fácilmente pronunciables. A medida que la Web móvil creció en popularidad, los servicios como Gmail.com, Outlook.com, Myspace.com, Facebook.com y Twitter.com se mencionan con mayor frecuencia sin agregar "www". (o, de hecho, ".com") al dominio.
Especificadores de esquema
Los especificadores de esquema http://
y https://
al comienzo de un URI web se refieren al Protocolo de transferencia de hipertexto o HTTP seguro, respectivamente. Especifican el protocolo de comunicación que se utilizará para la solicitud y la respuesta. El protocolo HTTP es fundamental para el funcionamiento de la World Wide Web, y la capa de cifrado adicional en HTTPS es esencial cuando los navegadores envían o recuperan datos confidenciales, como contraseñas o información bancaria. Los navegadores web generalmente anteponen automáticamente http:// a los URI ingresados por el usuario, si se omiten.
Paginas
Una página web (también escrita como página web) es un documento adecuado para la World Wide Web y los navegadores web. Un navegador web muestra una página web en un monitor o dispositivo móvil.
El término página web generalmente se refiere a lo que es visible, pero también puede referirse al contenido del archivo de la computadora en sí, que generalmente es un archivo de texto que contiene hipertexto escrito en HTML o un lenguaje de marcado similar. Las páginas web típicas proporcionan hipertexto para navegar a otras páginas web a través de hipervínculos, a menudo denominados enlaces. Los navegadores web frecuentemente tendrán que acceder a múltiples elementos de recursos web, como leer hojas de estilo, scripts e imágenes, mientras presentan cada página web.
En una red, un navegador web puede recuperar una página web desde un servidor web remoto. El servidor web puede restringir el acceso a una red privada, como una intranet corporativa. El navegador web utiliza el Protocolo de transferencia de hipertexto (HTTP) para realizar dichas solicitudes al servidor web.
Una página web estática se entrega exactamente como está almacenada, como contenido web en el sistema de archivos del servidor web. Por el contrario, una página web dinámica es generada por una aplicación web, generalmente impulsada por un software del lado del servidor. Las páginas web dinámicas se utilizan cuando cada usuario puede requerir información completamente diferente, por ejemplo, sitios web bancarios, correo electrónico web, etc.
Página estática
Una página web estática (a veces llamada página plana/página estacionaria) es una página web que se entrega al usuario exactamente como está almacenada, en contraste con las páginas web dinámicas que son generadas por una aplicación web.
En consecuencia, una página web estática muestra la misma información para todos los usuarios, de todos los contextos, sujeta a las capacidades modernas de un servidor web para negociar el tipo de contenido o el idioma del documento donde dichas versiones están disponibles y el servidor está configurado para hacerlo.
Páginas dinámicas
Una página web dinámica del lado del servidor es una página web cuya construcción está controlada por un servidor de aplicaciones que procesa scripts del lado del servidor. En las secuencias de comandos del lado del servidor, los parámetros determinan cómo procede el ensamblaje de cada nueva página web, incluida la configuración de más procesamiento del lado del cliente.
Una página web dinámica del lado del cliente procesa la página web utilizando JavaScript que se ejecuta en el navegador. Los programas de JavaScript pueden interactuar con el documento a través del Modelo de objetos del documento, o DOM, para consultar el estado de la página y modificarlo. Las mismas técnicas del lado del cliente pueden actualizar o cambiar dinámicamente el DOM de la misma manera.
Luego, el usuario o un programa de computadora vuelve a cargar una página web dinámica para cambiar algún contenido variable. La información de actualización podría provenir del servidor o de los cambios realizados en el DOM de esa página. Esto puede o no truncar el historial de navegación o crear una versión guardada a la que volver, pero una actualización dinámica de la página web que utiliza tecnologías Ajax no creará una página a la que volver ni truncará el historial de navegación web antes de la página mostrada. Con las tecnologías Ajax, el usuario final obtiene una página dinámica administrada como una sola página en el navegador web, mientras que el contenido web real representado en esa página puede variar. El motor Ajax se encuentra solo en el navegador que solicita partes de su DOM, el DOM, para su cliente, desde un servidor de aplicaciones.
HTML dinámico, o DHTML, es el término general para tecnologías y métodos utilizados para crear páginas web que no son páginas web estáticas, aunque ha dejado de ser de uso común desde la popularización de AJAX, un término que ahora se usa raramente. Las secuencias de comandos del lado del cliente, las secuencias de comandos del lado del servidor o una combinación de estas crean una experiencia web dinámica en un navegador.
JavaScript es un lenguaje de secuencias de comandos que fue desarrollado inicialmente en 1995 por Brendan Eich, entonces de Netscape, para su uso en páginas web. La versión estandarizada es ECMAScript.Para hacer que las páginas web sean más interactivas, algunas aplicaciones web también utilizan técnicas de JavaScript como Ajax (JavaScript asíncrono y XML). El script del lado del cliente se entrega con la página que puede realizar solicitudes HTTP adicionales al servidor, ya sea en respuesta a acciones del usuario, como movimientos del mouse o clics, o en función del tiempo transcurrido. Las respuestas del servidor se utilizan para modificar la página actual en lugar de crear una nueva página con cada respuesta, por lo que el servidor solo necesita proporcionar información incremental limitada. Se pueden manejar varias solicitudes de Ajax al mismo tiempo y los usuarios pueden interactuar con la página mientras se recuperan los datos. Las páginas web también pueden sondear periódicamente el servidor para comprobar si hay nueva información disponible.
Sitio web
Un sitio web es una colección de recursos web relacionados, incluidas páginas web, contenido multimedia, normalmente identificado con un nombre de dominio común y publicado en al menos un servidor web. Ejemplos notables son wikipedia.org, google.com y amazon.com.
Se puede acceder a un sitio web a través de una red pública de Protocolo de Internet (IP), como Internet, o una red de área local (LAN) privada, haciendo referencia a un localizador uniforme de recursos (URL) que identifica el sitio.
Los sitios web pueden tener muchas funciones y pueden utilizarse de diversas formas; un sitio web puede ser un sitio web personal, un sitio web corporativo para una empresa, un sitio web del gobierno, un sitio web de una organización, etc. Los sitios web generalmente están dedicados a un tema o propósito en particular, que van desde entretenimiento y redes sociales hasta brindar noticias y educación. Todos los sitios web de acceso público constituyen colectivamente la World Wide Web, mientras que los sitios web privados, como el sitio web de una empresa para sus empleados, suelen formar parte de una intranet.
Las páginas web, que son los componentes básicos de los sitios web, son documentos, generalmente compuestos en texto sin formato intercalado con instrucciones de formato del lenguaje de marcado de hipertexto (HTML, XHTML). Pueden incorporar elementos de otros sitios web con anclajes de marcado adecuados. Las páginas web se acceden y transportan con el Protocolo de transferencia de hipertexto (HTTP), que opcionalmente puede emplear encriptación (HTTP Secure, HTTPS) para brindar seguridad y privacidad al usuario. La aplicación del usuario, a menudo un navegador web, presenta el contenido de la página de acuerdo con sus instrucciones de marcado HTML en una terminal de visualización.
Los hipervínculos entre páginas web transmiten al lector la estructura del sitio y guían la navegación del sitio, que a menudo comienza con una página de inicio que contiene un directorio del contenido web del sitio. Algunos sitios web requieren el registro o suscripción del usuario para acceder a los contenidos. Los ejemplos de sitios web de suscripción incluyen muchos sitios de negocios, sitios web de noticias, sitios web de revistas académicas, sitios web de juegos, sitios web para compartir archivos, tableros de mensajes, correo electrónico basado en la web, sitios web de redes sociales, sitios web que ofrecen cotizaciones de precios en tiempo real para diferentes tipos de mercados, como así como sitios que ofrecen varios otros servicios. Los usuarios finales pueden acceder a sitios web en una variedad de dispositivos, incluidas computadoras de escritorio y portátiles, tabletas, teléfonos inteligentes y televisores inteligentes.
Navegador
Un navegador web (comúnmente conocido como navegador) es un agente de usuario de software para acceder a información en la World Wide Web. Para conectarse al servidor de un sitio web y mostrar sus páginas, el usuario debe tener un programa de navegación web. Este es el programa que el usuario ejecuta para descargar, formatear y mostrar una página web en la computadora del usuario.
Además de permitir que los usuarios busquen, muestren y se desplacen entre páginas web, un navegador web generalmente tendrá funciones como guardar marcadores, registrar el historial, administrar cookies (ver a continuación) y páginas de inicio, y puede tener funciones para registrar contraseñas para iniciar sesión. sitios web
Los navegadores más populares son Chrome, Firefox, Safari, Internet Explorer y Edge.
Servidor
Un servidor web es un software de servidor, o hardware dedicado a ejecutar dicho software, que puede satisfacer las solicitudes de los clientes de la World Wide Web. Un servidor web puede, en general, contener uno o más sitios web. Un servidor web procesa las solicitudes de red entrantes a través de HTTP y varios otros protocolos relacionados.
La función principal de un servidor web es almacenar, procesar y entregar páginas web a los clientes. La comunicación entre el cliente y el servidor se realiza mediante el Protocolo de transferencia de hipertexto (HTTP). Las páginas que se envían suelen ser documentos HTML, que pueden incluir imágenes, hojas de estilo y secuencias de comandos además del contenido del texto.
Un agente de usuario, comúnmente un navegador web o un rastreador web, inicia la comunicación al realizar una solicitud de un recurso específico mediante HTTP y el servidor responde con el contenido de ese recurso o un mensaje de error si no puede hacerlo. El recurso suele ser un archivo real en el almacenamiento secundario del servidor, pero este no es necesariamente el caso y depende de cómo se implemente el servidor web.
Si bien la función principal es servir contenido, la implementación completa de HTTP también incluye formas de recibir contenido de los clientes. Esta función se utiliza para enviar formularios web, incluida la carga de archivos.
Muchos servidores web genéricos también admiten secuencias de comandos del lado del servidor utilizando Active Server Pages (ASP), PHP (preprocesador de hipertexto) u otros lenguajes de secuencias de comandos. Esto significa que el comportamiento del servidor web se puede programar en archivos separados, mientras que el software del servidor real permanece sin cambios. Por lo general, esta función se usa para generar documentos HTML dinámicamente ("sobre la marcha") en lugar de devolver documentos estáticos. El primero se utiliza principalmente para recuperar o modificar información de bases de datos. Este último suele ser mucho más rápido y más fácil de almacenar en caché, pero no puede entregar contenido dinámico.
Los servidores web también se pueden encontrar con frecuencia integrados en dispositivos como impresoras, enrutadores, cámaras web y sirviendo solo a una red local. Entonces, el servidor web puede usarse como parte de un sistema para monitorear o administrar el dispositivo en cuestión. Esto generalmente significa que no es necesario instalar ningún software adicional en la computadora del cliente, ya que solo se requiere un navegador web (que ahora se incluye con la mayoría de los sistemas operativos).
Galleta
Una cookie HTTP (también llamada cookie web, cookie de Internet, cookie del navegador o simplemente cookie) es una pequeña porción de datos enviada desde un sitio web y almacenada en la computadora del usuario por el navegador web del usuario mientras el usuario está navegando. Las cookies se diseñaron para ser un mecanismo confiable para que los sitios web recuerden información de estado (como elementos agregados en el carrito de compras en una tienda en línea) o para registrar la actividad de navegación del usuario (incluido hacer clic en botones específicos, iniciar sesión o registrar qué páginas se visitaron). en el pasado). También se pueden usar para recordar información arbitraria que el usuario ingresó previamente en los campos del formulario, como nombres, direcciones, contraseñas y números de tarjetas de crédito.
Las cookies realizan funciones esenciales en la web moderna. Quizás lo más importante, las cookies de autenticaciónson el método más común utilizado por los servidores web para saber si el usuario está logueado o no, y con qué cuenta está logueado. Sin dicho mecanismo, el sitio no sabría si enviar una página que contenga información confidencial o requerir que el usuario se autentique iniciando sesión. La seguridad de una cookie de autenticación generalmente depende de la seguridad del sitio web emisor y del navegador web del usuario. y sobre si los datos de las cookies están encriptados. Las vulnerabilidades de seguridad pueden permitir que un pirata informático lea los datos de una cookie, que se utilicen para obtener acceso a los datos del usuario o que se utilicen para obtener acceso (con las credenciales del usuario) al sitio web al que pertenece la cookie (consulte cross-site scripting y cross-site scripting). falsificación de solicitud de sitio para ejemplos).
Las cookies de seguimiento, y especialmente las cookies de seguimiento de terceros, se utilizan comúnmente como formas de compilar registros a largo plazo de los historiales de navegación de las personas, un posible problema de privacidad que llevó a los legisladores europeos y estadounidenses a tomar medidas en 2011. La legislación europea exige que todos los sitios web dirigidos a los estados miembros de la Unión Europea obtienen el "consentimiento informado" de los usuarios antes de almacenar cookies no esenciales en su dispositivo.
El investigador de Google Project Zero, Jann Horn, describe las formas en que los intermediarios, como los proveedores de puntos de acceso Wi-Fi, pueden leer las cookies. Recomienda usar el navegador en modo incógnito en tales circunstancias.
Buscador
Un motor de búsqueda web o motor de búsqueda de Internet es un sistema de software que está diseñado para llevar a cabo búsquedas en la web (búsqueda en Internet), lo que significa buscar en la World Wide Web de manera sistemática información particular especificada en una consulta de búsqueda web. Los resultados de la búsqueda generalmente se presentan en una línea de resultados, a menudo denominadas páginas de resultados del motor de búsqueda (SERP). La información puede ser una combinación de páginas web, imágenes, videos, infografías, artículos, trabajos de investigación y otros tipos de archivos. Algunos motores de búsqueda también extraen datos disponibles en bases de datos o directorios abiertos. A diferencia de los directorios web, que solo son mantenidos por editores humanos, los motores de búsqueda también mantienen información en tiempo real mediante la ejecución de un algoritmo en un rastreador web. El contenido de Internet que no puede ser buscado por un motor de búsqueda web generalmente se describe como la web profunda.
Red profunda
La web profunda, la web invisible o la web oculta son partes de la World Wide Web cuyos contenidos no están indexados por los motores de búsqueda web estándar. El término opuesto a la web profunda es la web superficial, a la que puede acceder cualquiera que utilice Internet. Al científico informático Michael K. Bergman se le atribuye haber acuñado el término web profunda en 2001 como un término de indexación de búsqueda.
El contenido de la web profunda se esconde detrás de formularios HTTP, e incluye muchos usos muy comunes como correo web, banca en línea y servicios que los usuarios deben pagar y que está protegido por un muro de pago, como video a pedido, algunos en línea. revistas y periódicos, entre otros.
El contenido de la web profunda se puede ubicar y acceder a través de una URL directa o dirección IP, y puede requerir una contraseña u otro acceso de seguridad más allá de la página del sitio web público.
Almacenamiento en caché
Un caché web es una computadora servidor ubicada en Internet pública o dentro de una empresa que almacena páginas web a las que se accedió recientemente para mejorar el tiempo de respuesta de los usuarios cuando se solicita el mismo contenido dentro de un cierto tiempo después de la solicitud original. La mayoría de los navegadores web también implementan un caché de navegador al escribir datos obtenidos recientemente en un dispositivo de almacenamiento de datos local. Las solicitudes HTTP de un navegador pueden solicitar solo los datos que han cambiado desde el último acceso. Las páginas web y los recursos pueden contener información de caducidad para controlar el almacenamiento en caché para proteger datos confidenciales, como en la banca en línea, o para facilitar sitios que se actualizan con frecuencia, como los medios de comunicación. Incluso los sitios con contenido muy dinámico pueden permitir que los recursos básicos se actualicen solo ocasionalmente. Los diseñadores de sitios web consideran que vale la pena recopilar recursos como datos CSS y JavaScript en unos pocos archivos de todo el sitio para que puedan almacenarse en caché de manera eficiente. Los cortafuegos empresariales a menudo almacenan en caché los recursos web solicitados por un usuario para el beneficio de muchos usuarios. Algunos motores de búsqueda almacenan contenido en caché de sitios web a los que se accede con frecuencia.
Seguridad
Para los delincuentes, la Web se ha convertido en un lugar para propagar malware y participar en una variedad de delitos cibernéticos, que incluyen (pero no se limitan a) el robo de identidad, el fraude, el espionaje y la recopilación de inteligencia. Las vulnerabilidades basadas en la web ahora superan en número a las preocupaciones tradicionales de seguridad informática y, según las mediciones de Google, aproximadamente una de cada diez páginas web puede contener código malicioso. La mayoría de los ataques basados en la web tienen lugar en sitios web legítimos y, según las mediciones de Sophos, la mayoría están alojados en Estados Unidos, China y Rusia. La más común de todas las amenazas de malware son los ataques de inyección SQL contra sitios web. A través de HTML y URI, la Web era vulnerable a ataques como el cross-site scripting (XSS) que vino con la introducción de JavaScript.y fueron exacerbados hasta cierto punto por la Web 2.0 y el diseño web Ajax que favorece el uso de scripts. Hoy, según una estimación, el 70 % de todos los sitios web están abiertos a ataques XSS contra sus usuarios. El phishing es otra amenaza común para la Web. En febrero de 2013, RSA (la división de seguridad de EMC) estimó las pérdidas globales por phishing en $1500 millones en 2012. Dos de los métodos de phishing más conocidos son Covert Redirect y Open Redirect.
Las soluciones propuestas varían. Las grandes empresas de seguridad como McAfee ya diseñan conjuntos de gobernanza y cumplimiento para cumplir con las regulaciones posteriores al 11 de septiembre, y algunas, como Finjan, han recomendado la inspección activa en tiempo real del código de programación y todo el contenido, independientemente de su origen. Algunos han argumentado que las empresas ven la seguridad web como una oportunidad comercial en lugar de un centro de costos, mientras que otros piden una "gestión de derechos digitales ubicua y siempre activa" aplicada en la infraestructura para reemplazar a los cientos de empresas que protegen los datos y las redes. Jonathan Zittrain ha dicho que los usuarios que comparten la responsabilidad de la seguridad informática son mucho más preferibles que bloquear Internet.
Privacidad
Cada vez que un cliente solicita una página web, el servidor puede identificar la dirección IP de la solicitud. Los servidores web suelen registrar las direcciones IP en un archivo de registro. Además, a menos que esté configurado para no hacerlo, la mayoría de los navegadores web registran las páginas web solicitadas en una función de historial visible y, por lo general, almacenan en caché gran parte del contenido localmente. A menos que la comunicación entre el servidor y el navegador utilice cifrado HTTPS, las solicitudes y respuestas web viajan en texto sin formato a través de Internet y los sistemas intermedios pueden verlas, grabarlas y almacenarlas en caché. Otra forma de ocultar información de identificación personal es mediante el uso de una red privada virtual. Una VPN encripta el tráfico en línea y enmascara la dirección IP original, lo que reduce la posibilidad de identificación del usuario.
Cuando una página web solicita, y el usuario proporciona, información de identificación personal, como su nombre real, dirección, dirección de correo electrónico, etc., las entidades basadas en la web pueden asociar el tráfico web actual con esa persona. Si el sitio web utiliza cookies HTTP, autenticación de nombre de usuario y contraseña u otras técnicas de seguimiento, puede relacionar otras visitas web, antes y después, con la información identificable proporcionada. De esta manera, una organización basada en la web puede desarrollar y crear un perfil de las personas individuales que usan su sitio o sitios. Es posible que pueda crear un registro para una persona que incluya información sobre sus actividades de ocio, sus intereses de compra, su profesión y otros aspectos de su perfil demográfico. Estos perfiles son de interés potencial para los vendedores, anunciantes y otros. Dependiendo del sitio web' Los términos y condiciones de sy las leyes locales que aplican, la información de estos perfiles puede venderse, compartirse o pasarse a otras organizaciones sin que el usuario sea informado. Para muchas personas comunes, esto significa poco más que algunos correos electrónicos inesperados en su bandeja de entrada o alguna publicidad sorprendentemente relevante en una futura página web. Para otros, puede significar que el tiempo dedicado a complacer un interés inusual puede resultar en una avalancha de marketing dirigido adicional que puede no ser bienvenido. Los organismos encargados de hacer cumplir la ley, la lucha contra el terrorismo y el espionaje también pueden identificar, apuntar y rastrear a las personas en función de sus intereses o inclinaciones en la Web. esto significa poco más que algunos correos electrónicos inesperados en su bandeja de entrada o alguna publicidad extrañamente relevante en una página web futura. Para otros, puede significar que el tiempo dedicado a complacer un interés inusual puede resultar en una avalancha de marketing dirigido adicional que puede no ser bienvenido. Los organismos encargados de hacer cumplir la ley, la lucha contra el terrorismo y el espionaje también pueden identificar, apuntar y rastrear a las personas en función de sus intereses o inclinaciones en la Web. esto significa poco más que algunos correos electrónicos inesperados en su bandeja de entrada o alguna publicidad extrañamente relevante en una página web futura. Para otros, puede significar que el tiempo dedicado a complacer un interés inusual puede resultar en una avalancha de marketing dirigido adicional que puede no ser bienvenido. Los organismos encargados de hacer cumplir la ley, la lucha contra el terrorismo y el espionaje también pueden identificar, apuntar y rastrear a las personas en función de sus intereses o inclinaciones en la Web.
Los sitios de redes sociales generalmente intentan que los usuarios usen sus nombres, intereses y ubicaciones reales, en lugar de seudónimos, ya que sus ejecutivos creen que esto hace que la experiencia de las redes sociales sea más atractiva para los usuarios. Por otro lado, las fotografías cargadas o las declaraciones no protegidas pueden ser identificadas para un individuo, que puede lamentar esta exposición. Los empleadores, las escuelas, los padres y otros familiares pueden verse influenciados por aspectos de los perfiles de redes sociales, como publicaciones de texto o fotos digitales, que la persona que publica la publicación no pretendía para estas audiencias. Los acosadores en línea pueden hacer uso de información personal para acosar o acechar a los usuarios. Los sitios web de redes sociales modernos permiten un control detallado de la configuración de privacidad para cada publicación, pero pueden ser complejos y difíciles de encontrar o usar, especialmente para los principiantes.Las fotografías y videos publicados en sitios web han causado problemas particulares, ya que pueden agregar el rostro de una persona a un perfil en línea. Con la tecnología de reconocimiento facial moderna y potencial, entonces puede ser posible relacionar esa cara con otras imágenes, eventos y escenarios, previamente anónimos, que se han fotografiado en otros lugares. Debido al almacenamiento en caché, duplicación y copia de imágenes, es difícil eliminar una imagen de la World Wide Web.
Estándares
Los estándares web incluyen muchos estándares y especificaciones interdependientes, algunos de los cuales rigen aspectos de Internet, no solo de la World Wide Web. Incluso cuando no están enfocados en la web, dichos estándares afectan directa o indirectamente el desarrollo y la administración de sitios web y servicios web. Las consideraciones incluyen la interoperabilidad, accesibilidad y usabilidad de las páginas web y los sitios web.
Los estándares web, en el sentido más amplio, consisten en lo siguiente:
- Recomendaciones publicadas por el World Wide Web Consortium (W3C)
- "Estándar de vida" elaborado por el Grupo de trabajo de tecnología de aplicaciones de hipertexto web (WHATWG)
- Documentos de solicitud de comentarios (RFC) publicados por el Grupo de trabajo de ingeniería de Internet (IETF)
- Normas publicadas por la Organización Internacional de Normalización (ISO)
- Estándares publicados por Ecma International (anteriormente ECMA)
- El estándar Unicode y varios informes técnicos de Unicode (UTR) publicados por Unicode Consortium
- Registros de nombres y números mantenidos por la Autoridad de Números Asignados en Internet (IANA)
Los estándares web no son conjuntos fijos de reglas, sino conjuntos en constante evolución de especificaciones técnicas finalizadas de tecnologías web. Los estándares web son desarrollados por organizaciones de estándares, grupos de partes interesadas y, a menudo, competidoras encargadas de la tarea de estandarización, no tecnologías desarrolladas y declaradas como un estándar por un solo individuo o empresa. Es crucial distinguir aquellas especificaciones que están en desarrollo de las que ya alcanzaron el estado final de desarrollo (en el caso de las especificaciones W3C, el nivel de madurez más alto).
Accesibilidad
Existen métodos para acceder a la Web en medios y formatos alternativos para facilitar su uso por parte de personas con discapacidades. Estas discapacidades pueden ser visuales, auditivas, físicas, relacionadas con el habla, cognitivas, neurológicas o alguna combinación. Las funciones de accesibilidad también ayudan a las personas con discapacidades temporales, como un brazo roto, o a los usuarios mayores a medida que cambian sus habilidades. La Web recibe información además de proporcionar información e interactuar con la sociedad. El Consorcio World Wide Web afirma que es esencial que la Web sea accesible, para que pueda brindar igualdad de acceso e igualdad de oportunidades a las personas con discapacidades. Tim Berners-Lee señaló una vez: "El poder de la Web está en su universalidad. El acceso de todos, independientemente de su discapacidad, es un aspecto esencial".Muchos países regulan la accesibilidad web como un requisito para los sitios web. La cooperación internacional en la Iniciativa de Accesibilidad Web del W3C condujo a pautas simples que los autores de contenido web, así como los desarrolladores de software, pueden usar para hacer que la Web sea accesible para personas que pueden o no estar usando tecnología de asistencia.
Internacionalización
La Actividad de Internacionalización del W3C asegura que la tecnología web funcione en todos los idiomas, escrituras y culturas. A partir de 2004 o 2005, Unicode ganó terreno y, finalmente, en diciembre de 2007 superó tanto a ASCII como a Europa occidental como la codificación de caracteres más utilizada en la Web. Originalmente, RFC 3986 permitía que los recursos fueran identificados por URI en un subconjunto de US-ASCII. RFC 3987 permite más caracteres, cualquier carácter en el conjunto de caracteres universales, y ahora IRI puede identificar un recurso en cualquier idioma.
Contenido relacionado
Control de acceso al medio
Protocolo de transmisión en tiempo real (RTSP)
Autoridad de Asignación de Números de Internet (IANA)