Combinando carácter
En tipografía digital, los caracteres combinados son caracteres que tienen como objetivo modificar otros caracteres. Los caracteres combinados más comunes en la escritura latina son los signos diacríticos combinados (incluidos los acentos combinados).
Unicode también contiene muchos caracteres precompuestos, por lo que en muchos casos es posible utilizar tanto signos diacríticos como caracteres precompuestos, a elección del usuario o de la aplicación. Esto lleva a la necesidad de realizar la normalización Unicode antes de comparar dos cadenas Unicode y diseñar cuidadosamente convertidores de codificación para asignar correctamente todas las formas válidas de representar un carácter en Unicode a una codificación heredada para evitar la pérdida de datos.
En Unicode, el bloque principal para combinar signos diacríticos de idiomas europeos y el alfabeto fonético internacional es U+0300–U+036F. La combinación de signos diacríticos también está presente en muchos otros bloques de caracteres Unicode. En Unicode, los signos diacríticos siempre se agregan después del carácter principal (a diferencia de algunos conjuntos de caracteres combinados más antiguos, como ANSEL), y es posible agregar varios signos diacríticos al mismo carácter, incluidos los signos diacríticos apilados arriba y abajo, aunque es posible que algunos sistemas no renderícelos bien.
Rangos Unicode
Los siguientes bloques están dedicados específicamente a combinar personajes:
- Combinando marcas diacríticas (0300–036F), desde la versión 1.0, con modificaciones en versiones posteriores hasta 4.1
- Combinando marcas diacríticas extendidas (1AB0-1AFF), versión 7.0
- Suplemento combinado de marcas diacríticas (1DC0-1DFF), versiones 4.1 a 5.2
- Combinando marcas diacríticas para símbolos (20D0–20FF), desde la versión 1.0, con modificaciones en versiones posteriores hasta 5.1
- Cirílico Extended-A (2DE0–2DFF), versión 5.1
- Combinando Medias Marcas (FE20–FE2F), versiones 1.0, con modificaciones en versiones posteriores hasta 8.0
La combinación de personajes no se limita a estos bloques; por ejemplo, el dakuten combinado (U+3099) y el handakuten combinado (U+309A) están en el bloque Hiragana, el bloque Devanagari contiene signos vocales combinados y otras marcas para usar con esa escritura, y así sucesivamente. A los caracteres combinados se les asigna la categoría principal Unicode "M" ("Marca").
Combinación diacrítica Marcas Gráfico oficial de códigos Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+030x | ◌ | ◌ | ◌̂ | ◌ | ◌ | ◌̅ | ◌ | ◌ú | ◌ | ◌̉ | ◌̊ | ◌ english | ◌ | ◌̍ | ◌̎ | ◌̏ |
U+031x | ◌̐ | ◌̑ | ◌̒ | ◌ | ◌̔ | ◌ | ◌̖ | ◌̗ | ◌̘ | ◌̙ | ◌̚ | ◌̛ | ◌ | ◌̝ | ◌̞ | ◌̟ |
U+032x | ◌̠ | ◌̡ | ◌̢ | ◌̣ | ◌̤ | ◌̥ | ◌̦ | ◌ | ◌ | ◌ | ◌̪ | ◌̫ | ◌̬ | ◌̭ | ◌̮ | ◌̯ |
U+033x | ◌̰ | ◌̱ | ◌̲ | ◌̳ | ◌̴ | ◌̵ | ◌ | ◌ | ◌ | ◌̹ | ◌̺ | ◌̻ | ◌̼ | ◌̽ | ◌̾ | ◌̿ |
U+034x | ◌ | ◌ | ◌͂ | ◌ | ◌ | ◌ͅ | ◌͆ | ◌͇ | ◌͈ | ◌͉ | ◌͊ | ◌͋ | ◌͌ | ◌͍ | ◌͎ | CGJ |
U+035x | ◌͐ | ◌͑ | ◌͒ | ◌͓ | ◌͔ | ◌͕ | ◌͖ | ◌͗ | ◌͘ | ◌͙ | ◌͚ | ◌͛ | ◌͜◌ | ◌͝◌ | ◌͞◌ | ◌͟◌ |
U+036x | ◌͠◌ | ◌ | ◌͢◌ | ◌ | ◌ | ◌ | ◌ͦ | ◌ͧ | ◌ | ◌ͩ | ◌ͪ | ◌ͫ | ◌ | ◌ | ◌ | ◌ͯ |
Notas
|
Los puntos de código U+032A y U+0346–034A son símbolos IPA:
- U+032A◌̪: dental
- U+0346◌͆: dentolabial
- U+0347◌͇: alveolar
- U+0348◌͈: fuerte articulación
- U+0349◌͉: articulación débil
- U+034A◌͊: denasal
Los puntos de código U+034B–034E son signos diacríticos IPA para trastornos del habla:
- U+034B◌͋: escape nasal
- U+034C◌͌: fricción velofaríngea
- U+034D◌͍: difusión labial
- U+034E◌͎: articulación silbida
U+034F es el "unidor de grafemas combinado" (CGJ) y no tiene ningún glifo visible.
Los puntos de código U+035C–0362 son signos diacríticos dobles, signos diacríticos colocados entre dos letras.
Los puntos de código U+0363–036F son letras diacríticas en superíndice medieval, letras escritas directamente encima de otras letras que aparecen en manuscritos germánicos medievales, pero que en algunos casos se utilizaron hasta el siglo XIX. Por ejemplo, U+0364 es una e escrita encima de la letra anterior, que se utilizará para la notación de diéresis del nuevo alto alemán (temprano), como uͤ para el alemán moderno
Combinación diacrítica Marcas Extendidas Gráfico oficial de códigos Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1ABx | ◌᪰ | ◌᪱ | ◌᪲ | ◌᪳ | ◌᪴ | ◌᪵ | ◌᪶ | ◌᪷ | ◌᪸ | ◌᪹ | ◌᪺ | ◌᪻ | ◌᪼ | ◌᪽ | ◌᪾ | ◌ᪿ |
U+1ACx | ◌ᫀ | ◌᫁ | ◌᫂ | ◌᫃ | ◌᫄ | ◌᫅ | ◌᫆ | ◌᫇ | ◌᫈ | ◌᫉ | ◌᫊ | ◌᫋ | ◌ᫌ | ◌ᫍ | ◌ᫎ | |
U+1ADx | ||||||||||||||||
U+1AEx | ||||||||||||||||
U+1AFx | ||||||||||||||||
Notas
|
Combinación diacrítica Suplemento de las marcas Gráfico oficial de códigos Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1DCx | ◌᷀ | ◌᷁ | ◌᷂ | ◌᷃ | ◌᷄ | ◌᷅ | ◌᷆ | ◌᷇ | ◌᷈ | ◌᷉ | ◌᷊ | ◌᷋ | ◌᷌ | ◌᷍ | ◌᷎ | ◌᷏ |
U+1DDx | ◌᷐ | ◌᷑ | ◌᷒ | ◌ᷓ | ◌ᷔ | ◌ᷕ | ◌ᷖ | ◌ᷗ | ◌ᷘ | ◌ᷙ | ◌ᷚ | ◌ᷛ | ◌ᷜ | ◌ᷝ | ◌ᷞ | ◌ᷟ |
U+1DEx | ◌ᷠ | ◌ᷡ | ◌ᷢ | ◌ᷣ | ◌ᷤ | ◌ᷥ | ◌ᷦ | ◌ᷧ | ◌ᷨ | ◌ᷩ | ◌ᷪ | ◌ᷫ | ◌ᷬ | ◌ᷭ | ◌ᷮ | ◌ᷯ |
U+1DFx | ◌ᷰ | ◌ᷱ | ◌ᷲ | ◌ᷳ | ◌ᷴ | ◌᷵ | ◌᷶ | ◌᷷ | ◌᷸ | ◌᷹ | ◌᷺ | ◌᷻ | ◌᷼ | ◌᷽ | ◌᷾ | ◌᷿ |
Notas
|
Combinando marcas diacríticas para símbolos Gráfico oficial de códigos Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+20Dx | ◌⃐ | ◌⃑ | ◌⃒ | ◌⃓ | ◌⃔ | ◌⃕ | ◌⃖ | ◌⃗ | ◌⃘ | ◌⃙ | ◌⃚ | ◌⃛ | ◌⃜ | ◌⃝ | ◌⃞ | ◌⃟ |
U+20Ex | ◌⃠ | ◌⃡ | ◌⃢ | ◌⃣ | ◌⃤ | ◌⃥ | ◌⃦ | ◌⃧ | ◌⃨ | ◌⃩ | ◌⃪ | ◌⃫ | ◌⃬ | ◌⃭ | ◌⃮ | ◌⃯ |
U+20Fx | ◌⃰ | |||||||||||||||
Notas
|
Combinando Medias Marcas Gráfico oficial de códigos Unicode Consortium (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+FE2x | ◌︠ | ◌︡ | ◌︢ | ◌︣ | ◌︤ | ◌︥ | ◌︦ | ◌︧ | ◌︨ | ◌︩ | ◌︪ | ◌︫ | ◌︬ | ◌︭ | ◌︮ | ◌︯ |
Notas
|
Tipo abierto
OpenType tiene la etiqueta ccmp "feature tag" para definir glifos que son composiciones o descomposiciones que involucran la combinación de caracteres, la etiqueta mark para definir la posición de la combinación de caracteres en el glifo base, y mkmk para las posiciones de la combinación de caracteres en cada otro.
Texto de Zalgo
Se ha utilizado la combinación de caracteres para crear texto Zalgo, que es texto que aparece "corrupto" o "espeluznante" debido a un uso excesivo de la combinación de personajes. Esto hace que el texto se extienda verticalmente, superponiéndose a otro texto. Esto se utiliza principalmente en contextos de terror en Internet. Por lo general, para la mayoría del software resulta muy difícil renderizar, por lo que las marcas de combinación a menudo se reducen o se eliminan por completo.
Contenido relacionado
Vulgar
PLI
BR