Filtro de palabras
Un filtro de palabras (a veces denominado simplemente "filtro" o "censura" ;) es un script que se utiliza normalmente en foros de Internet o salas de chat que escanea automáticamente las cuentas de los usuarios. publicaciones o comentarios a medida que se envían y cambia o censura automáticamente palabras o frases particulares.
Los filtros de palabras más básicos buscan sólo cadenas de letras específicas y las eliminan o sobrescriben independientemente de su contexto. Los filtros de palabras más avanzados hacen algunas excepciones por contexto (como filtrar "trasero" pero no "mantequilla"), y los filtros de palabras más avanzados pueden usar expresiones regulares.
Funciones
Los filtros de palabras pueden cumplir varias funciones.
Eliminación de lenguaje vulgar
Un filtro de malas palabras, también conocido como filtro de malas palabras o filtro de idioma, es un subsistema de software que modifica el texto para eliminar palabras consideradas ofensivas por el administrador o comunidad de un foro en línea. Los filtros de malas palabras son comunes en salas de chat programadas a medida y en videojuegos en línea, principalmente MMORPG. Esto no debe confundirse con el filtrado de contenido, que generalmente está integrado en programas de navegación de Internet por parte de desarrolladores externos para filtrar o bloquear sitios web o tipos de sitios web específicos. Los filtros de malas palabras suelen ser creados o implementados por los desarrolladores del servicio de Internet.
Lo más habitual es que los filtros de palabras se utilicen para censurar el lenguaje que los operadores del foro o sala de chat consideran inapropiado. Los insultos suelen ser reemplazados parcialmente, completamente o reemplazados por palabras sin sentido. Esto libera a los administradores o moderadores de la tarea de patrullar constantemente el foro para detectar dicho lenguaje. Esto también puede ayudar al tablero de mensajes a evitar que se instale software de control de contenido en los archivos de los usuarios. computadoras o redes, ya que dicho software a menudo bloquea el acceso a páginas web que contienen lenguaje vulgar.
Las frases filtradas pueden reemplazarse permanentemente a medida que se guardan (ejemplo: phpBB 1.x), o la frase original puede guardarse pero mostrarse como texto censurado. En algunos programas, los usuarios pueden ver el texto detrás del filtro de palabras citando la publicación.
Los filtros de malas palabras normalmente aprovechan las funciones de reemplazo de cadenas integradas en el lenguaje de programación utilizado para crear el programa, para intercambiar una lista de palabras y frases inapropiadas con una variedad de alternativas. Las alternativas pueden incluir:
- Personajes sin sentido, como!@#$%^
- Reemplazar una determinada carta con un carácter de número de turno o similar.
- Asteriscos (* o #) de una longitud de conjunto, o la longitud de la palabra original que se filtra. Alternativamente, los carteles suelen sustituir ciertas letras por un asterisco.
- Juramentos mineros como "coño" o "coño", o palabras inventadas como "flumo".
- Palabras o frases amigables de la familia, o eufemismos, como "Amor" o "Te amo", o palabras completamente diferentes que no tienen nada que ver con la palabra original.
- Eliminación del puesto. En este caso, todo el post está bloqueado y por lo general no hay manera de arreglarlo.
- Nada en absoluto. En este caso, se elimina la palabra ofensiva.
Algunos filtros de malas palabras realizan una búsqueda simple de una cadena. Otros tienen medidas que ignoran los espacios en blanco y otros llegan incluso a ignorar todos los caracteres no alfanuméricos y luego filtrar el texto sin formato. Esto significa que si la palabra "usted" estaba configurado para ser filtrado, "tú" o "y.o!u" También sería filtrado.
Control de clichés
Los clichés (palabras o frases concretas que se reutilizan constantemente en las publicaciones, también conocidos como "memes") suelen desarrollarse en los foros. Algunos usuarios encuentran que estos clichés aumentan la diversión, pero otros los encuentran tediosos, especialmente cuando se usan en exceso. Los administradores pueden configurar el filtro de palabras para reemplazar el molesto cliché con una frase más vergonzosa o eliminarlo por completo.
Control de vandalismo
Los foros de Internet a veces son atacados por vándalos que intentan llenar el foro con repetidos mensajes sin sentido, o por spammers que intentan insertar enlaces a sus sitios web comerciales. El filtro de palabras del sitio se puede configurar para eliminar el texto sin sentido utilizado por los vándalos o para eliminar de las publicaciones todos los enlaces a sitios web concretos.
Filtro de cojera
Losfiltros de cojera son filtros de palabras basados en texto que utilizan los sitios web basados en Slash (como tableros de texto e imágenes) para evitar que se publiquen comentarios basura en respuesta a las historias. Algunas de las cosas que están diseñados para filtrar incluyen:
- Demasiados mayúsculas
- Demasiado repetición
- ASCII art
- Comentarios que son demasiado cortos o largos
- Uso de etiquetas HTML que intentan romper páginas web
- Títulos de comentario consistentes únicamente en "primero post"
- Cualquier ocurrencia de una palabra o término considerado (por los programadores) como ofensivo/vulgar
Eludir filtros
Dado que los filtros de palabras están automatizados y solo buscan secuencias particulares de caracteres, los usuarios que conocen los filtros a veces intentarán eludirlos cambiando sus letras lo suficiente para evitarlos. Un usuario que intente evitar un filtro de vulgaridad podría reemplazar uno de los caracteres de la palabra ofensiva por un asterisco, un guión o algo similar. Algunos administradores responden revisando los filtros de palabras para detectar sustituciones comunes; otros pueden convertir la evasión de filtros en un delito punible en sí mismo. Un ejemplo sencillo de evadir un filtro de palabras sería introducir símbolos entre letras o utilizar leet. Las técnicas más avanzadas de evasión de filtros de palabras incluyen el uso de imágenes, el uso de etiquetas ocultas o caracteres cirílicos (es decir, un ataque de suplantación de homógrafos).
Otro método es utilizar un guión suave. Un guión suave solo se usa para indicar dónde se puede dividir una palabra al dividir líneas de texto y no se muestra. Al colocar esto a la mitad de una palabra, la palabra se divide y, en algunos casos, el filtro de palabras no la reconoce.
Algunos filtros más avanzados, como los del juego en línea RuneScape, pueden detectar la omisión. Sin embargo, la desventaja de los filtros de palabras sensibles es que también se filtran las frases legítimas.
Aspectos de censura
Los filtros de palabras están codificados en los foros o salas de chat de Internet y funcionan únicamente con el material enviado al foro o sala de chat en cuestión. Esto distingue los filtros de palabras del software de control de contenido, que normalmente se instala en la PC o red informática de un usuario final y que puede filtrar todo el contenido de Internet enviado hacia o desde la PC o red en cuestión. Dado que los filtros de palabras alteran la información de los usuarios, palabras sin su consentimiento, algunos usuarios todavía las consideran censura, mientras que otros las consideran una parte aceptable del derecho del operador del foro a controlar el contenido del foro.
Falsos positivos
Una peculiaridad común de los filtros de palabras, que a menudo los usuarios consideran cómica o irritante, es que a menudo afectan a palabras que no están destinadas a ser filtradas. Este es un problema típico cuando se filtran palabras cortas. Por ejemplo, con la palabra "culo" censurado, uno puede ver: "¿Necesitas distancia para reproducir música clásica?" en lugar de "¿Necesitas ayuda para tocar música clásica?" Se pueden filtrar varias palabras si se ignoran los espacios en blanco, lo que da como resultado "como se sospecha" convirtiéndose en " sospechado". Prohibir una frase como "duro" resultará en el filtrado de declaraciones inofensivas como "¡Esa fue difícil!" y "Perdón por haber sido duro contigo" en "¡Eso fue una e!" y "Lo siento, fui tú".
Algunas palabras que se han filtrado accidentalmente pueden convertirse en sustitutos de palabras profanas. Un ejemplo de esto se encuentra en el foro Mystcommunity. Allí, la palabra 'manuscrito' fue censurado accidentalmente por contener la palabra 'ano', lo que resultó en 'm****cript'. La palabra se adoptó como reemplazo del juramento y se mantuvo cuando el foro cambió, y muchos sustitutos, como " Se utilizan 'scripting " (aunque principalmente por los miembros mayores de la comunidad).
Los nombres de lugares pueden filtrarse involuntariamente debido a que contienen partes de malas palabras. En los primeros años de Internet, el topónimo británico Penistone a menudo se filtraba de los filtros de spam y malas palabras.
Implementación
Muchos juegos, como World of Warcraft y, más recientemente, Habbo Hotel y RuneScape permiten a los usuarios desactivar los filtros. Otros juegos, especialmente los juegos en línea multijugador masivo gratuitos, como Knight Online, no tienen esa opción.
Otros juegos como Medal of Honor y Call of Duty (excepto Call of Duty: World at War, Call of Duty: Black Ops, Call of Duty: Black Ops 2 y Call of Duty: Black Ops 3) no ofrecen a los usuarios la opción de desactivar las secuencias de comandos. lenguaje soez, mientras que Gears of War lo hace.
Además de los juegos, los filtros de malas palabras se pueden utilizar para moderar el contenido generado por los usuarios en foros, blogs, aplicaciones de redes sociales, sitios web para niños y reseñas de productos. Hay muchas API de filtro de malas palabras, como WebPurify, que ayudan a reemplazar las malas palabras con otros caracteres (es decir, "@#$!"). Estas API de filtros de malas palabras funcionan con el método de búsqueda y reemplazo de malas palabras.
Contenido relacionado
Morfología (lingüística)
Idioma hawaiano
Escritura tailandesa