| 1. | "FSS-UTF, UTF-2, UTF-8, and UTF-16". Citons : UTF-8 ; UTF-16 ; UTF-32. |
| 2. | Microsoft made the change from UCS-2 to UTF-16 with Windows 2000. Microsoft a réalisé la migration depuis UCS-2 vers UTF-16 avec Windows 2000. |
| 3. | UCS-2 disallows use of code values for these code points, but UTF-16 allows their use in pairs. UCS-2 interdit l’utilisation de valeurs de code pour ces points de code, mais UTF-16 permet leur utilisation par paires afin de désigner les caractères extérieurs au PMB. |
| 4. | There exists a non-standard encoding for Unicode characters: %uxxxx, where xxxx is a UTF-16 code unit represented as four hexadecimal digits. Il existe un encodage non-standard pour les caractères Unicode : %uxxxx, dans lequel xxxx est une unité de code UTF-16 représentée comme quatre chiffres hexadécimaux. |
| 5. | The first amendment to the original edition of the UCS defined UTF-16, an extension of UCS-2, to represent code points outside the BMP. Le premier amendement de l’édition originale d’ISO/CEI 10646 définit UTF-16, une extension d’UCS-2, pour représenter les points de code extérieurs au PMB, reprise ensuite par Unicode. |
| 6. | The Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8) is a variant of UTF-8 that is described in Unicode Technical Report #26. Le CESU-8 (Compatibility Encoding Scheme for UTF-16: 8-Bit) est un codage de caractères variante d'UTF-8 décrit dans le document Unicode Technical Report #26 publié par le consortium Unicode. |
| 7. | Unicode text files encoded in UTF-16 often start with the Byte Order Mark to detect endianness (FE FF for big endian and FF FE for little endian). Les fichiers textes Unicode encodés en UTF-16 commencent généralement par un indicateur d'ordre des octets pour détecter l'endianness (FE FF pour les big-endian et FF FE pour les little-endian). |
| 8. | The UCS-4 encoding of ISO 10646 was incorporated into the Unicode standard with the limitation to the UTF-16 range and under the name UTF-32, although it has almost no use outside programs' internal data. Le codage UCS-4 de l'ISO 10646 a été incorporé dans le standard Unicode avec la limitation de l’UTF-16 sous le nom d’UTF-32. |
| 9. | For that reason, ISO 10646 was limited to contain as many characters as could be encoded by UTF-16 and no more, that is, a little over a million characters instead of over 679 million. Pour cette raison, ISO 10646 fut limité à contenir autant de caractères que pouvait en coder l’UTF-16, c’est-à-dire à peine plus d’un million de caractères au lieu de plus de 2 milliards. |
| 10. | Some people use DBCS to mean the UTF-16 and UTF-8 encodings, while other people use the term DBCS to mean older (pre-Unicode) character encodings that use more than one byte per character. Le terme DBCS est utilisé par certains pour désigner les encodages UTF-16 et UTF-8 alors que, pour d'autres, DBCS fait référence à des pages de code pré-unicode qui utilisent plus d'un octet par caractère . |