Dans cet article, le sujet de Caractère précomposé sera abordé sous différents angles, afin d'en offrir une vision globale et complète. Dans cette optique, différents aspects liés à Caractère précomposé seront analysés, approfondissant ses origines, son évolution et ses répercussions actuelles. De plus, nous essaierons de fournir au lecteur une compréhension plus approfondie de Caractère précomposé, en explorant ses implications possibles dans divers domaines. L’objectif est ainsi de générer un débat autour de Caractère précomposé et d’encourager une réflexion critique sur son importance et sa pertinence dans la société contemporaine.
Un caractère précomposé ou caractère composite ou caractère décomposable est une entité Unicode qui peut aussi être définie comme une séquence d'un ou de plusieurs autres caractères. Un caractère précomposé peut typiquement représenter une lettre surmontée d'un accent, comme é (lettre e avec accent aigu). Techniquement, é (U+00E9) est un caractère qui peut être décomposé en son équivalent Unicode à partir de la lettre e (U+0065) et du caractère combinant (en) accent aigu (U+0301). De même les ligatures sont des précompositions des lettres ou graphèmes les constituant.
Les caractères précomposés sont un palliatif de représentation des caractères spécifiques par des systèmes et logiciels dépourvus de mécanismes de composition. En Unicode, ils servent à permettre l'utilisation de ces caractères dans les systèmes et logiciels prenant en charge les caractères décomposés équivalents de façon incomplète.
Les exemples suivants se basent sur le patronyme Åström — commun en suédois — qui peut s'écrire avec chacune de ces deux conventions. Ici, les caractères précomposés sont Å (U+00C5) et ö (U+00F6), et les décomposés sont A (U+0041) avec rond en chef (U+030A) et o (U+006F) avec tréma (U+0308). Pour illustrer la différence, les caractères précomposés sont ici affichés en vert et les caractères décomposés en noir. Selon le navigateur, les accents décomposés peuvent apparaître en rouge ou en noir.
Mis à part pour les couleurs, les deux solutions sont équivalentes et devraient s'afficher de manière identique. En pratique cependant, certaines mises en œuvre d'Unicode gèrent difficilement les caractères décomposés. Dans le pire des cas, les diacritiques ne sont pas affichés ou pas affichés convenablement.
L'exemple suivant montre la reconstruction en indo-européen commun du mot français chien :
Dans certaines situations, les lettres précomposées vertes k, u et o avec accent peuvent apparaître sous forme d'autres caractères, ou leur apparence typographique être très différente de la lettre finale n sans diacritique. Dans la deuxième ligne, les lettres devraient au moins être affichées correctement même si les diacritiques combinants ne sont pas gérés correctement.