HTTP 404
En comunicaciones de redes informáticas, el HTTP 404, 404 no encontrado, 404, error 404, página no encontrado o archivo no encontrado mensaje de error es un código de respuesta estándar del protocolo de transferencia de hipertexto (HTTP), para indicar que el navegador pudo comunicarse con un servidor determinado, pero el servidor no pudo encontrar lo solicitado. El error también se puede utilizar cuando un servidor no desea revelar si tiene la información solicitada.
El servidor de alojamiento del sitio web generará normalmente un mensaje "404 No encontrado" página web cuando un usuario intenta seguir un enlace roto o muerto; por lo tanto, el error 404 es uno de los errores más reconocibles que se encuentran en la World Wide Web.
Resumen
Cuando se comunica a través de HTTP, se requiere que un servidor responda a una solicitud, como una solicitud de un navegador web para una página web, con un código de respuesta numérico y un mensaje opcional, obligatorio o no permitido (según el código de estado).. En el código 404, el primer dígito indica un error del cliente, como un localizador uniforme de recursos (URL) mal escrito. Los siguientes dos dígitos indican el error específico encontrado. El uso de HTTP de códigos de tres dígitos es similar al uso de dichos códigos en protocolos anteriores como FTP y NNTP. En el nivel de HTTP, un código de respuesta 404 va seguido de una "frase de razón" legible por humanos. La especificación HTTP sugiere la frase "No encontrado" y muchos servidores web emiten de forma predeterminada una página HTML que incluye tanto el código 404 como el mensaje "No encontrado" frase.
A menudo se devuelve un error 404 cuando se han movido o eliminado páginas. En el primer caso, es mejor emplear el mapeo de URL o la redirección de URL devolviendo una respuesta 301 Movido permanentemente, que se puede configurar en la mayoría de los archivos de configuración del servidor, o mediante la reescritura de URL; en el segundo caso, se debe devolver un 410 Gone. Debido a que estas dos opciones requieren una configuración especial del servidor, la mayoría de los sitios web no las utilizan.
Los errores 404 no deben confundirse con los errores de DNS, que aparecen cuando la URL dada hace referencia a un nombre de servidor que no existe. Un error 404 indica que se encontró el propio servidor, pero que el servidor no pudo recuperar la página solicitada.
Errores suaves 404
Algunos sitios web informan de un mensaje "no encontrado" error al devolver una página web estándar con un "200 OK" código de respuesta, informando falsamente que la página se cargó correctamente; esto se conoce como soft 404. El término "suave 404" fue presentado en 2004 por Ziv Bar-Yossef et al.
Los 404 suaves son problemáticos para los métodos automatizados de descubrir si un enlace está roto. Algunos motores de búsqueda, como Yahoo y Google, usan procesos automatizados para detectar 404 suaves. Los 404 suaves pueden ocurrir como resultado de errores de configuración cuando se usa cierto software de servidor HTTP, por ejemplo, con el software Apache, cuando un Documento de error 404 (especificado en un archivo.htaccess) se especifica como una ruta absoluta (por ejemplo, http://example.com/error.html) en lugar de una ruta relativa (/error.html). Esto también se puede hacer a propósito para obligar a algunos navegadores (como Internet Explorer) a mostrar un mensaje de error 404 personalizado en lugar de reemplazar lo que se muestra con un mensaje "amigable" específico del navegador. mensaje de error (en Internet Explorer, este comportamiento se activa cuando se entrega un 404 y el HTML recibido es más corto que una cierta longitud, y el usuario puede desactivarlo manualmente).
También hay "soft 3XX" errores en los que el contenido se devuelve con un estado 200 pero proviene de una página redirigida, como cuando las páginas que faltan se redirigen a la página de inicio/raíz del dominio.
Servidores proxy
Algunos servidores proxy generan un error 404 cuando un código de error de rango 500 sería más correcto. Si el servidor proxy no puede satisfacer una solicitud de una página debido a un problema con el host remoto (como fallas en la resolución del nombre del host o conexiones TCP rechazadas), esto debe describirse como un error interno del servidor 5xx, pero podría generar un 404 en su lugar.. Esto puede confundir a los programas que esperan y actúan sobre respuestas específicas, ya que ya no pueden distinguir fácilmente entre un servidor web ausente y una página web que falta en un servidor web que está presente.
404 intencionales
En julio de 2004, el proveedor de telecomunicaciones del Reino Unido, BT Group, implementó el sistema de bloqueo de contenido Cleanfeed, que devuelve un error 404 a cualquier solicitud de contenido identificado como potencialmente ilegal por Internet Watch Foundation. Otros ISP devuelven un HTTP 403 "prohibido" error en las mismas circunstancias. La práctica de emplear errores 404 falsos como medio para ocultar la censura también se ha informado en Tailandia y Túnez. En Túnez, donde la censura era severa antes de la revolución de 2011, la gente se dio cuenta de la naturaleza de los errores 404 falsos y creó un personaje imaginario llamado "Ammar 404" quien representa "el censor invisible".
Códigos de error de subestado de Microsoft Internet Server 404
El software del servidor web desarrollado por Microsoft, Internet Information Services (IIS) de Microsoft, devuelve un conjunto de códigos de subestado con sus respuestas 404. Los códigos de subestado adoptan la forma de números decimales adjuntos al código de estado 404. IANA no reconoce oficialmente los códigos de subestado y los servidores que no son de Microsoft no los devuelven.
Códigos de subestado
Los servidores IIS 7.0, IIS 7.5 e IIS 8.0 de Microsoft definen los siguientes códigos de subestado HTTP para indicar una causa más específica de un error 404:
- 404.0 – No se encuentra.
- 404.1 – Sitio no encontrado.
- 404.2 – ISAPI o restricción CGI.
- 404.3 – restricción tipo MIME.
- 404.4 – Sin controlador configurado.
- 404.5 – Denegado por solicitud de configuración de filtrado.
- 404.6 – Verbo negado.
- 404.7 – Extensión de archivo denegada.
- 404.8 – Espacio de nombres oculto.
- 404.9 – Atributo de archivo oculto.
- 404.10 – Solicitud de encabezado demasiado tiempo.
- 404.11 – La solicitud contiene doble secuencia de escape.
- 404.12 – La solicitud contiene caracteres de alto nivel.
- 404.13 – Longitud de contenido demasiado grande.
- 404.14 – Solicitar URL demasiado tiempo.
- 404.15 – Cadena de consulta demasiado tiempo.
- 404.16 – Solicitud DAV enviada al controlador de archivos estáticos.
- 404.17 – Contenido dinámico mapeado al manipulador de archivos estáticos a través de un mapeo de MIME comodín.
- 404.18 – Secuencia de cadena de consulta negada.
- 404.19 – Denegado por regla de filtrado.
- 404.20 – Demasiados segmentos URL.
Páginas de error personalizadas
Los servidores web normalmente se pueden configurar para mostrar una página de error 404 personalizada, incluida una descripción más natural, la marca del sitio principal y, a veces, un mapa del sitio, un formulario de búsqueda o un widget de página 404. La frase de nivel de protocolo, que está oculta para el usuario, rara vez se personaliza. Internet Explorer, sin embargo, no mostrará páginas personalizadas a menos que tengan más de 512 bytes, optando en su lugar por mostrar un "amigable" página de error Google Chrome incluyó una funcionalidad similar, donde el 404 se reemplaza con sugerencias alternativas generadas por los algoritmos de Google, si la página tiene menos de 512 bytes de tamaño. Otro problema es que si la página no proporciona un favicon y existe una página 404 personalizada separada, se generará tráfico adicional y tiempos de carga más prolongados en cada vista de página.
Muchas organizaciones utilizan las páginas de error 404 como una oportunidad para inyectar humor en lo que de otro modo podría ser un sitio web serio. Por ejemplo, Metro UK muestra un oso polar en una patineta y la agencia de desarrollo web Left Logic tiene un programa de dibujo simple. Durante la campaña de las elecciones generales del Reino Unido de 2015, los principales partidos políticos utilizaron sus 404 páginas para apuntar a los opositores políticos o mostrar políticas relevantes a posibles partidarios. En Europa, el proyecto NotFound, creado por varias organizaciones europeas, incluidas Missing Children Europe y Child Focus, alienta a los operadores del sitio a agregar un fragmento de código para mostrar páginas de error 404 personalizadas que brindan datos sobre niños desaparecidos.
Si bien muchos sitios web envían información adicional en un mensaje de error 404, como un enlace a la página de inicio de un sitio web o un cuadro de búsqueda, algunos también se esfuerzan por encontrar la página web correcta que busca el usuario. Hay extensiones disponibles para algunos sistemas de administración de contenido (CMS) para hacer esto.
Seguimiento de errores 404
Existen varias herramientas que rastrean un sitio web para encontrar páginas que devuelven códigos de estado 404. Estas herramientas pueden ser útiles para encontrar enlaces que existen dentro de un sitio web en particular. La limitación de estas herramientas es que solo encuentran enlaces dentro de un sitio web en particular e ignoran los 404 resultantes de enlaces en otros sitios web. Como resultado, estas herramientas pierden el 83 % de los 404 en los sitios web. Una forma de evitar esto es encontrar errores 404 analizando enlaces externos.
Una de las formas más efectivas de descubrir errores 404 es usar Google Search Console, Google Analytics o software de rastreo.
Otro método común es el seguimiento del tráfico a las páginas 404 mediante el análisis de archivos de registro. Esto puede ser útil para comprender más sobre lo que los usuarios de 404s alcanzaron en el sitio. Otro método para rastrear el tráfico a las páginas 404 es usar herramientas de rastreo de tráfico basadas en JavaScript.
Contenido relacionado
Máquina virtual de Java
Dia (software)
Caché (informática)