Grafema
Na linguística, um grafema é a menor unidade funcional de um sistema de escrita. A palavra grafema é derivada do grego antigo γράφω (gráphō) 'escrever' e o sufixo -eme por analogia com fonema e outros nomes de unidades êmicas. O estudo dos grafemas é chamado de grafêmica. O conceito de grafemas é abstrato e semelhante à noção de computação de um caractere. Em comparação, uma forma específica que representa qualquer grafema específico em um determinado tipo de letra é chamada de glifo.
Conceito
Existem dois conceitos principais de grafemas opostos.
Na chamada concepção referencial, os grafemas são interpretados como as menores unidades de escrita que correspondem a sons (mais precisamente fonemas). Nesse conceito, o sh na palavra inglesa escrita shake seria um grafema porque representa o fonema /ʃ/. Este conceito referencial está ligado à hipótese da dependência que afirma que a escrita apenas retrata a fala.
Em contraste, o conceito analógico define grafemas de forma análoga a fonemas, ou seja, por meio de pares mínimos escritos como shake vs. snake. Neste exemplo, h e n são grafemas porque distinguem duas palavras. Este conceito analógico está associado à hipótese da autonomia que sustenta que a escrita é um sistema em si e deve ser estudada independentemente da fala. Ambos os conceitos têm pontos fracos.
Alguns modelos aderem a ambos os conceitos simultaneamente, incluindo duas unidades individuais, que recebem nomes como grafema grafêmica para o grafema de acordo com a concepção analógica (h em shake) e grafema de ajuste fonológico para o grafema de acordo com o conceito referencial (sh em shake).
Em conceitos mais recentes, nos quais o grafema é interpretado semioticamente como um signo linguístico diádico, ele é definido como uma unidade mínima de escrita que é lexicalmente distintiva e corresponde a uma unidade lingüística (fonema, sílaba ou morfema).
Notação
Os grafemas geralmente são anotados entre colchetes angulares: ⟨a⟩, ⟨b⟩, etc. Isso é análogo a ambos a notação de barra (/a/, /b/) usado para fonemas e à notação de colchetes usada para transcrições fonéticas ([a], [b]).
Glifos
Da mesma forma que as formas superficiais dos fonemas são sons de fala ou fones (e diferentes fonemas que representam o mesmo fonema são chamados de alofones), as formas superficiais dos grafemas são glifos (às vezes gráficos), ou seja, representações escritas concretas de símbolos (e diferentes glifos representando o mesmo grafema são chamados de alógrafos).
Assim, um grafema pode ser considerado como uma abstração de uma coleção de glifos que são todos funcionalmente equivalentes.
Por exemplo, em inglês escrito (ou em outros idiomas que usam o alfabeto latino), há duas representações físicas diferentes da letra "a" latina minúscula: "a" e "ɑ". Como, porém, a substituição de um deles pelo outro não pode alterar o sentido de uma palavra, eles são considerados alógrafos de um mesmo grafema, que pode ser escrito ⟨a⟩. Da mesma forma, o grafema correspondente ao "número arábico zero" tem uma identidade semântica única e valor Unicode U+0030
mas exibe variação na forma de zero cortado. As formas em itálico e em negrito também são alográficas, assim como a variação observada nas formas serif (como em Times New Roman) versus sans-serif (como em Helvetica).
Existe algum desacordo sobre se as letras maiúsculas e minúsculas são alógrafos ou grafemas distintos. As maiúsculas geralmente são encontradas em certos contextos de ativação que não alteram o significado de uma palavra: um nome próprio, por exemplo, ou no início de uma frase, ou todas as maiúsculas em uma manchete de jornal. Em outros contextos, a capitalização pode determinar o significado: compare, por exemplo, polonês e polonês: o primeiro é uma língua, o último é para engraxar sapatos.
Alguns linguistas consideram dígrafos como ⟨sh⟩ em ship como grafemas distintos, mas geralmente são analisados como sequências de grafemas. Ligaduras não estilísticas, no entanto, como ⟨æ⟩, são grafemas distintos, assim como várias letras com diacríticos distintos, como ⟨ç⟩ .
Glifos idênticos nem sempre representam o mesmo grafema. Por exemplo, as três letras ⟨A⟩, ⟨А⟩ e ⟨Α⟩ parecem idênticos, mas cada um tem um significado diferente: em ordem, eles são a letra latina A, a letra cirílica Azǔ/Азъ e a letra grega Alpha. Cada um tem seu próprio ponto de código em Unicode: U+0041 A LETRA A MAIÚSCULA LATINA, U +0410 А CIRÍLICO MAIÚSCULA LETRA A e U+0391 Α LETRA GREGA MAIÚSCULA ALPHA.
Tipos de grafema
Os principais tipos de grafemas são logogramas (mais precisamente chamados de morfogramas), que representam palavras ou morfemas (por exemplo, caracteres chineses, o e comercial "&" representando a palavra e, algarismos arábicos); caracteres silábicos, representando sílabas (como no kana japonês); e letras alfabéticas, correspondendo aproximadamente a fonemas (ver a próxima seção). Para uma discussão completa dos diferentes tipos, consulte Sistema de escrita § Classificação funcional.
Existem componentes grafêmicos adicionais usados na escrita, como sinais de pontuação, símbolos matemáticos, divisores de palavras como o espaço e outros símbolos tipográficos. Escritas logográficas antigas frequentemente usavam determinativos silenciosos para eliminar a ambiguidade do significado de uma palavra vizinha (não silenciosa).
Relação com fonemas
Como mencionado na seção anterior, em idiomas que usam sistemas de escrita alfabéticos, muitos dos grafemas representam, em princípio, os fonemas (sons significativos) do idioma. Na prática, no entanto, as ortografias de tais línguas acarretam pelo menos um certo desvio do ideal de correspondência exata entre grafema e fonema. Um fonema pode ser representado por um multigrafo (sequência de mais de um grafema), pois o dígrafo sh representa um único som em inglês (e às vezes um único grafema pode representar mais de um fonema, como no Letra russa я ou espanhol c). Alguns grafemas podem não representar nenhum som (como o b em inglês debt ou o h em todas as palavras em espanhol que contenham a referida letra), e muitas vezes as regras de correspondência entre grafemas e fonemas tornam-se complexas ou irregulares, principalmente como resultado de mudanças sonoras históricas que não necessariamente se refletem na ortografia. "Raso" ortografias como as do espanhol e finlandês padrão têm correspondência relativamente regular (embora nem sempre um-para-um) entre grafemas e fonemas, enquanto as do francês e do inglês têm correspondência muito menos regular e são conhecidas como ortografias profundas.
Os multigrafos que representam um único fonema são normalmente tratados como combinações de letras separadas, não como grafemas por si só. No entanto, em alguns idiomas, um multigrafo pode ser tratado como uma única unidade para fins de agrupamento; por exemplo, em um dicionário tcheco, a seção para palavras que começam com ⟨ch⟩ vem depois de ⟨h⟩. Para obter mais exemplos, consulte Ordem alfabética § Convenções específicas do idioma.
Contenido relacionado
Alfabeto aramaico
Linguagem adâmica
Delta (letra)
Epsilon
Língua etrusca