Wubi method
El método de entrada de Wuzizixing (chino simplificado: 五笔字型输入法; chino tradicional: 五筆字型輸入法; pinyin: wǔbǐ zìxíng shūrùfǎ; lit. & #39;método de entrada del modelo de caracteres de cinco trazos'), a menudo abreviado simplemente como Wubi o Wubi Xing, es un método de entrada de caracteres chinos principalmente para ingresar chino simplificado y texto chino tradicional en una computadora. Wubi no debe confundirse con el método Wubihua (五笔画), que es un método de entrada diferente que comparte la categorización en cinco tipos de trazos.
El método también se conoce como Wang Ma (chino simplificado: 王码; chino tradicional: 王碼; pinyin: Wáng mǎ; lit. ' Código Wang'), llamado así por el inventor Wang Yongmin (王永民). Hay cuatro versiones de Wubi que se consideran estándar: Wubi 86, Wubi 98, Wubi 18030 y Wubi New-century (la versión de tercera generación). Los últimos tres también se pueden usar para ingresar texto en chino tradicional, aunque de una manera más limitada. Wubi 86 es el método de entrada basado en formas más conocido y utilizado para teclados de letras completas en China continental. Si también se necesita ingresar con frecuencia caracteres chinos tradicionales, otros métodos de entrada como Cangjie o Zhengma pueden ser más adecuados para la tarea, y también es mucho más probable encontrarlos en la computadora que se necesita usar.
El método Wubi se basa en la estructura de los caracteres en lugar de en su pronunciación, lo que permite ingresar caracteres incluso cuando el usuario no conoce la pronunciación, además de no estar demasiado vinculado a ninguna variedad hablada de chino en particular. También es extremadamente eficiente: casi todos los caracteres se pueden escribir con un máximo de 4 pulsaciones de teclas. En la práctica, la mayoría de los caracteres se pueden escribir con menos. Hay informes de mecanógrafos experimentados que alcanzan los 160 caracteres por minuto con Wubi. Lo que esto significa en el contexto del chino no es del todo lo mismo que en el inglés, pero es cierto que Wubi es extremadamente rápido cuando lo usa un mecanógrafo experimentado. La razón principal de esto es que, a diferencia de los métodos tradicionales de entrada fonética, no es necesario perder tiempo seleccionando el carácter deseado de una lista de posibilidades homofónicas: prácticamente todos los caracteres tienen una representación única.
Como sugiere su nombre, el teclado se divide en cinco regiones. El carácter chino 笔 (bǐ), cuando se usa en el contexto de escribir caracteres chinos, se refiere a las pinceladas que se usan en la caligrafía china. A cada región se le asigna un determinado tipo de trazo.
- Región 1: horizontal (hora)
- Región 2: vertical (丨)
- Región 3: hacia abajo derecha a izquierda (丿)
- Región 4: golpes de punto o golpes de izquierda a derecha (丶)
- Región 5: gancho (乙)
Un gran inconveniente de aprender Wubi es su curva de aprendizaje más pronunciada, ya que, como sistema más complejo, lleva más tiempo adquirir una habilidad. La memorización y la práctica son factores clave para un uso competente.
Para usar Wubi, hay varios métodos de entrada disponibles, incluidas las herramientas de entrada de Google (utilizadas por Google Translate) y opciones de teclado en dispositivos Mac. Las secuencias de Wubi se pueden buscar en busca de caracteres específicos mediante el uso de diccionarios en línea.
En este artículo, se utilizará la siguiente convención: carácter siempre significará carácter chino, mientras que letra, clave y pulsación de tecla siempre se referirá a las teclas del teclado.
Cómo funciona
Esencialmente, un carácter se divide en componentes, que por lo general (pero no siempre) son iguales a los radicales. Estos se escriben en el orden en que se escribirían a mano. Para garantizar que los caracteres extremadamente complejos no requieran un número excesivo de pulsaciones de teclas, cualquier carácter que contenga más de 4 componentes se ingresa escribiendo los primeros 3 componentes escritos, seguidos por el último. De esta manera, los datos de cada personaje se pueden ingresar con no más de 4 pulsaciones de teclas.
Wubi distribuye sus caracteres de manera muy uniforme y, como tal, la gran mayoría de los caracteres están definidos de manera única por las 4 pulsaciones de teclas discutidas anteriormente. Luego se escribe un espacio para mover el carácter del búfer de entrada a la pantalla. En el caso de que la representación de 4 letras del carácter no sea única, se escribiría un dígito para seleccionar el carácter relevante (por ejemplo, si dos caracteres tienen la misma representación, escribir 1 seleccionaría el primero)., y 2 el segundo). En la mayoría de las implementaciones, siempre se puede escribir un espacio y simplemente significa 1 en una configuración ambigua. El software inteligente intentará asegurarse de que el carácter en la posición predeterminada sea el deseado.
Muchos personajes tienen más de una representación. Esto a veces es para facilitar el uso, en caso de que haya más de una forma obvia de desglosar un carácter. Sin embargo, con mayor frecuencia se debe a que ciertos caracteres tienen una representación corta de menos de 4 letras, así como una representación "completa" representación.
Para caracteres con menos de 4 componentes que no tienen una representación de forma abreviada, uno escribe cada componente y luego "rellena" la representación (es decir, escribe suficientes pulsaciones de teclas adicionales para que la representación sea de 4 pulsaciones) escribiendo manualmente las pulsaciones del último componente, en el orden en que se escribirían. Si hay demasiados trazos, se deben escribir tantos como sea posible, pero colocar el último trazo en último lugar (esto refleja la regla de componentes para caracteres con más de 4 componentes descrita anteriormente).
Una vez que se comprende el algoritmo, se puede escribir casi cualquier carácter con un poco de práctica, incluso si no se ha escrito antes. La memoria muscular garantiza que los mecanógrafos frecuentes que utilizan este método no tengan que pensar en cómo se construyen realmente los caracteres, al igual que la gran mayoría de los mecanógrafos ingleses no piensan mucho en la ortografía de las palabras cuando escriben.
Detalles específicos de la implementación
Muchas implementaciones emplean optimizaciones adicionales de varias palabras. Por lo general, un dígrafo de uso común (palabra de dos caracteres) en el que ambos caracteres tienen representaciones de dos pulsaciones de forma abreviada se puede combinar en una sola representación de cuatro pulsaciones de teclas que genera dos caracteres en lugar de uno. También hay algunos atajos de 3 caracteres, e incluso uno bastante más largo, motivado políticamente. Algunos ejemplos de estos se proporcionan en la sección de ejemplos a continuación.
Otra característica común es el uso de la 'z' clave como comodín. El método Wubi en realidad fue diseñado con esta característica en mente; por eso no se asignan componentes a la tecla z. Básicamente, uno puede escribir una z cuando no está seguro de cuál debería ser el componente, y el método de entrada ayudará a completarlo. Si uno sabía, por ejemplo, que el carácter debería comenzar con "kt", pero no estaba seguro de cuál debería ser el siguiente componente, al escribir "ktz" generaría una lista de todos los caracteres que comienzan con "kt". Sin embargo, en la práctica, muchos motores de métodos de entrada utilizan un método de búsqueda tabular para todos los sistemas de entrada basados en tablas, incluido Wubi. Esto significa que simplemente tienen una gran tabla en la memoria, asociando diferentes caracteres a sus respectivas representaciones. El método de entrada simplemente se convierte en una búsqueda de tabla. En tal implementación, la tecla z rompe el paradigma y, como tal, no se encuentra en un software muy generalizado (aunque el método de entrada Wubi que se encuentra comúnmente en Windows chino implementa la función). Por esta misma razón, la optimización de caracteres múltiples descrita en el párrafo anterior también es relativamente rara.
Algunos métodos de entrada, como xcin (que se encuentra en muchos sistemas similares a UNIX), proporcionan una funcionalidad de comodín genérica que se puede usar en todos los sistemas de entrada basados en tablas, incluido pinyin y prácticamente cualquier otro. Xcin utiliza '*' para autocompletar y '?' por una sola letra, siguiendo las convenciones pioneras en la acumulación de archivos UNIX. Otras implementaciones tienen sus propias convenciones.
Subdivisión del teclado
El teclado Wubi asume un diseño similar al QWERTY, por lo que los usuarios de teclados que implementen un diseño nacionalizado o alternativo (como Dvorak o el AZERTY francés) probablemente tendrán que reasignar un poco para que el sistema sea sensato. Wubi no coloca sus componentes de manera arbitraria: hay demasiados, y solo con la introducción de una metodología lógica, el sistema se vuelve fácil de aprender.
Básicamente, el teclado está dividido en 5 zonas, cada una de las cuales representa un trazo. Esos cinco trazos son cayendo a la izquierda, cayendo a la derecha, horizontal, vertical y gancho, y las zonas que los representan son QWERT, YUIOP, ASDFG, HJKLM y XCVBN, respectivamente. Todas estas zonas están dispuestas horizontalmente, a excepción de la M, que no está en línea con el resto de las letras de su zona.
De forma general, se puede pensar que el teclado está dividido por el centro, entre T e Y, G y H, y N y M. Las teclas de cada zona están numeradas alejándose de esta línea divisoria: así que en realidad debería decir que en la zona QWERT, T es la primera letra, R es la segunda y E la tercera; en la zona YUIOP, Y es el primero, U es el segundo, I el tercero, etc. Para XCVBN, N es el primero, y así sucesivamente. En HJKLM, considere que M es el último de la serie, aunque no esté en la línea.
Esto es importante porque los componentes de la primera posición tendrán una repetición del trazo en cuestión (el trazo asignado a la zona a la que pertenecen), los de la segunda, dos, los de la tercera, tres. En la última letra se colocarán aquellos componentes que no sean fácilmente clasificables utilizando este paradigma.
Por lo tanto, uno esperaría que 一 estuviera ubicado en G, y 二 en F, y 三 en D, y de hecho, este es el caso. De manera similar, uno esperaría que 丨 estuviera ubicado en H, 刂 en J y 川 en K. Este patrón se cumple para todas las zonas. Además, se extiende a la mayoría de los radicales que parecen estar formados por tres de esos trazos, incluso si en realidad no lo están en absoluto. Un ejemplo de esto es 中 en K: aunque no tiene tres trazos hacia abajo (solo dos), parece tener tres. Además, se escribe a mano escribiendo primero un radical de boca, 口, y luego dividiéndolo en dos con un trazo vertical hacia abajo. El radical bucal se encuentra en 'K', por lo que la asignación es doblemente lógica. Y la romanización pinyin de 口, kou3, comienza con k, otra ayuda para la memoria codificada en el teclado Wubi.
Además, cada letra de cada zona tiene un componente asociado, su "componente principal". Estos suelen ser un carácter completo (con la excepción de X) por derecho propio. Siempre se puede escribir este componente principal escribiendo la letra en la que se encuentra cuatro veces. Entonces, por ejemplo, el componente principal de H es 目, por lo que uno lo escribiría escribiendo "hhhh".
Cada letra también tiene un carácter abreviado asociado. En algunos casos, este carácter es el mismo que el componente asociado con la clave en cuestión, y en otras no. Este carácter abreviado es el carácter producido cuando uno escribe solo la letra y nada más; todos estos son caracteres extremadamente comunes que se usan al escribir chino.
Es muy posible que haya una serie de componentes que no se enumeran a continuación, ya sea por descuido, porque rara vez se usan o porque no existe una representación Unicode simple para el componente.
Zona QWERT (cayendo a la izquierda)
El componente principal de la tecla Q es 金 y su carácter abreviado es 我. Está asociado con los siguientes componentes: 金, 钅, 勹, 儿, 夕, así como el gancho en la parte superior de 饣 y 角, el radical 犭 sin el trazo descendente inferior izquierdo (por lo que los caracteres con ese radical comienzan con "qt", no solo "q"), el entrecruzamiento (como en el centro de 区), la parte superior de 鱼 (es decir, sin el trazo horizontal en la parte inferior), y los tres (casi verticales) "pies" en la esquina inferior derecha de 流.
El componente principal de la tecla W y el carácter abreviado son 人. Está asociado con los siguientes componentes: 人, 亻, 八 y la parte superior de 癸. Si bien 人 significa persona, Wubi lo usa a menudo para construir un techo radical, como en 会, "wfc". 入 no está gobernado por W, a pesar de parecer similar, y aunque 餐 tiene una parte superior que se parece vagamente a la parte superior de 癸, los dos no son iguales (de hecho, para escribir 餐, uno debe escribir físicamente cada componente en la parte superior).
El componente principal de la tecla E es 月 y su carácter abreviado es 有. Está asociado con los siguientes componentes: 月, 用, 彡, 乃, la parte inferior de 衣 (es decir, sin 亠), la parte superior de 孚 (es decir, sin 子), 豕 (cerdo), la parte inferior de 良 (es decir, sin el 白), y la parte inferior de 舟 (es decir, sin el pequeño punto en la parte superior). En este caso, el carácter abreviado de E's ni siquiera comienza con un trazo descendente a la izquierda, sino que simplemente figura de manera prominente un componente que pertenece a E. 彡 aparece en este carácter, ya que es el tercer carácter en la zona (contando de T, ver arriba). Una distorsión particular que surge a menudo es el uso de E en 且 y en los caracteres que la contienen: Wubi piensa en este componente como 月 + 一.
El componente principal de la tecla R es 白 y su carácter abreviado es 的. Está asociado con los siguientes componentes: 白, 手, 扌, 斤 (con y sin la T), 牛 (sin el trazo vertical descendente) y, por supuesto, los dos trazos descendentes a la izquierda 𰀪 que uno esperaría de la segunda clave en la zona (ver arriba para una explicación). Tenga cuidado con las variedades de 手 donde el gancho central hacia abajo se reemplaza por un trazo hacia la izquierda, como en 看.
El componente principal de la tecla T es 禾 y su carácter abreviado es 和. Está asociado con los siguientes componentes: 禾, 竹, 夂, 攵, 彳 y la parte superior de 乞 (es decir, sin 乙). 竹 también se puede encontrar en su forma más pequeña (⺮). 丿 también se encuentra en esta tecla, porque T es la primera tecla en la zona (ver arriba). Esto significa que si uno está escribiendo un componente o carácter trazo por trazo, (generalmente) usaría T para representar un trazo descendente a la izquierda. Consulte la sección sobre trazos de desambiguación para obtener más información sobre las excepciones a esta regla.
Zona YUIOP (cayendo a la derecha)
Esta zona también podría llamarse zona de puntos, porque su patrón de Y: 讠 U: 冫 I: 氵 y O: 灬 en realidad no está necesariamente formado por trazos descendentes hacia la derecha. De hecho, se podría argumentar que el primer trazo en 灬 en realidad cae a la izquierda. Se denomina zona de caída hacia la derecha porque las teclas de esta zona, cuando se utilizan para construir un carácter por trazo (en lugar de componente), representan trazos hacia la derecha para alguna configuración de caracteres (consulte la sección sobre trazos de desambiguación para obtener más información).
El componente principal de la tecla Y es 言, y su carácter abreviado es 主. Está asociado con los siguientes componentes: 言, 讠, 亠, 亠 con 口 debajo, 广, 文, 方 y 丶. Todos estos componentes comienzan con un trazo descendente hacia la derecha. Generalmente, los puntos en los caracteres chinos en realidad son trazos descendentes izquierdos, por lo que la mayoría de las veces, el uso de T es más apropiado que Y. Por supuesto, si uno puede escribir caracteres chinos a mano, debe hacerlo. ser capaz de decir cuál elegir recordando cómo está escrito.
El componente principal de la tecla U es 立, y su carácter abreviado es 产. Está asociado con los siguientes componentes: 立, 六, 辛, 门, 疒, 丬, 冫, las "antenas" en la parte superior de 单 (solo dos trazos: 丷), y las antenas más un trazo horizontal, como se encuentra en la parte superior de 兹. La mayoría de estos cuentan con dos trazos diagonales cortos (门 es la excepción obvia). Esto es consistente con el lugar de la U como la segunda letra en la zona (ver arriba para una explicación).
El componente principal de la tecla I es 水 y su carácter abreviado es 不. Está asociado con los siguientes componentes: 水, 氵, 小, los tres trazos en la parte superior de 学 y los tres trazos en la parte superior de 当. Además, un componente que podría describirse como dos 冫, espalda con espalda, está asociado con este carácter.
El componente principal de la tecla O es 火 y su carácter abreviado es 为. Está asociado con los siguientes componentes: 火, 米, 灬 y 业 sin el trazo horizontal inferior; esto permite la construcción de caracteres como 严. Esta es la cuarta clave en la zona derecha descendente: de ahí la inclusión de 灬.
El componente principal de la tecla P es 之 y su carácter abreviado es 这. Está asociado con los siguientes componentes: 之, 辶, 廴, 冖, 宀 y 礻. Dado que los componentes de Wubi se escriben en el orden en que deberían escribirse si uno se escribiera a mano, los componentes 辶 y 廴 normalmente se escriben último.
Zona ASDFG (horizontal)
- El carácter atajo de la llave es у.
- El componente principal de la tecla S es la comprensión, y su carácter atajo es.
- El componente principal de la llave D es Н, y su carácter atajo es.
- El componente principal de la tecla F es JUEGO, y su carácter atajo es. El nombre del componente principal (tierra) se correlaciona con el carácter atajo que significa tierra.
- El componente principal de la llave G es Despierta, y su carácter atajo es.
Zona HJKLM (vertical)
- El componente principal de la tecla H es el accionamiento, y su carácter atajo está doblando.
- El componente principal de la llave J es 日本, y su carácter de acceso directo es.
- El componente principal de la llave K es Ø, y su carácter atajo es 中.
- El componente principal de la tecla L es ↑, y su carácter de acceso directo es 国.
- El componente principal de la llave M es Abdel, y su carácter atajo es.
Zona XCVBN (gancho)
- El componente principal de la tecla X es 纟, y su carácter atajo es.
- El componente principal de la tecla C es clar, y su carácter atajo es zan.
- El componente principal de la llave V es ágil, y su carácter atajo es.
- El componente principal de la tecla B es ≤, y su carácter de acceso directo es.
- El componente principal de la llave N es Ø, y su carácter atajo es confidencialidad.
Trazos de desambiguación
Las pulsaciones del teclado se dividen en 5 zonas
Zonas | Carta |
---|---|
1 | GFDSA |
2 | HJKLM |
3 | TREWQ |
4 | YUIOP |
5 | NBVCX |
Zonas | Stroke | Forma |
---|---|---|
1 | . | Izquierda derecha (horizontal) |
2 | 丨 | Top-bottom (vertical) |
3 | 丿 | A la izquierda |
4 | 丶 | Cayendo a la derecha |
5 | 乙 | Hook |
Ejemplos
Personajes con 4 componentes o menos (pero sin necesidad de trazos)
Example 1: 请 Consists of three components: y (讠, radical #10), g (王*, radical 89), e (月, radical 118) → 请
Personajes con más de cuatro componentes
Example 2: 遗
Consists of five components: k (口), h (丨), g (一), m (贝), p (辶) → khgp → 遗 (it is not necessary to type m)
Personajes con menos de 4 componentes (que necesitan trazos)
Ejemplo 3a: 文: primero escribe la tecla con el símbolo, que resulta ser 'Y'. Luego escribe el primer componente, que también es 'Y' para el trazo 点, luego una 'G' para el trazo 横, y dado que ya tiene tres trazos, escribe el último trazo, que también resulta ser un 捺, llegando al código clave 'YYGY' para el personaje completo.
Ejemplo 3b: 一: el código de este carácter es 'GGLL'. Como antes, primero escribe la clave del carácter, que es 'G', luego el primer trazo de ese carácter, que también es una 'G'. Debido a que esta es toda la información necesaria, la L se usa como relleno hasta llegar a 4 letras. Tenga en cuenta que el '一' es también el carácter abreviado de 'G' (haciéndolo de un solo golpe en la práctica).
Ejemplo 3c: 广: el código de este carácter es 'YYGT'. Al principio, escribe la clave donde se encuentra este carácter, que es una 'Y'. Luego, escribe un trazo 点, que también está en 'Y'. El siguiente será el trazo 横 en 'G', y el último será el 捺, en 'T'.
Caracteres que requieren trazos de desambiguación
Ejemplo 4: 等
Consists of three components: t (竹), f (土), f (寸),
Trazos de desambiguación: el último trazo es 丶 y el carácter tiene una estructura de arriba abajo (42,u) → 等
Poema
Se realizó un poema como mnemónico para el teclado Wubi, asociando pocos caracteres a cada tecla. El primer carácter es el componente principal clave correspondiente, mientras que los siguientes son componentes o caracteres asociados.
Versión de 1986
G11 organizada
F12 evolucionando
D13 acta
S14/2007/2
A15 segundos
H21 recurriendo a la decisión
J22UNCA
K23 expresando,
L24 apareció
M25uelvo comenzar,
T31⁄4⁄2⁄4 }
R32órmula controlada
E33 de nuevo
W34人八,
Q35 automáticamente aparecen
Y41 rigurosamente escrito
U42 frutales
I43HI水 estabilizarse
O44 brillando
P45]
N51
B52
V53 libremente
C54 cuerda,
X55母ajuste,
Versión de 1998
G11
F12
D13
S14
A15
H21
J22
K23 ❌
L24
M25 Гленныханивы
T31
R32
E33,
W34
Q35
Y41
U42 Alternativa
I43 перитьный
O44
P45
N51
B52
V53
C54
X55
Versión del nuevo siglo (tercera generación)
G11
F12
D13
S14
A15
H21 أэликантованы
J22
K23 口
L24 Отеличе
M25 Гленных
T31
R32
E33,
W34
Q35 金 parecía apropiado
Y41
U42
I43
O44
P45
N51
B52
V53
C54
X55
En los medios
En 2020, la historia de Wubi se presentó en un episodio de Radiolab titulado "El efecto Wubi".
Notas y referencias
- ^ Este es el nombre utilizado en Mac OS X
- ^ a b Wicentowski, Joe (1996), Wubizixing for Speakers of English, archivado desde el original el 10 de julio de 2015
- ^ Adler, Simon. "El efecto Wubi: Radiolab". WNYC Studios, 14 agosto 2020.
Contenido relacionado
PowerMacintosh
Joder
Fabio taglioni