Oracle
 sql >> Base de données >  >> RDS >> Oracle

Tout problème avec l'utilisation de Windows-1252 au lieu d'UTF-8

Windows 1252 est l'un des nombreux jeux de caractères de taille fixe. Mac a son propre ensemble. il existe quelques ISO pour différentes parties de l'Europe et pour d'autres parties du monde. La plupart d'entre eux ont de légères variations.

Le bon point est que vous avez un caractère de taille fixe, ce qui signifie 1 caractère =1 octet quoi qu'il arrive.

Les mauvais points sont :

  • Certaines personnes peuvent ne pas avoir installé votre encodage
  • Certaines personnes peuvent utiliser un encodage légèrement différent, ce qui entraîne très peu de problèmes, pas évidents à voir, mais très laids à long terme
  • Vous ne pouvez prendre en charge que quelques langues

Cela inclut toute citation que vous souhaitez faire. Dans Windows-1252, vous ne pouvez pas afficher le russe, le grec, le polonais ...

UTF-8 est l'encodage standard pour la représentation unicode sur 1+ octets. Il peut représenter une très grande majorité des caractères que vous pouvez rencontrer, bien qu'il soit conçu pour les langues basées sur le latin, car les autres langues prennent plus d'espace de stockage.

Il est utilisé dans XML, JSON et la plupart des types de services Web que vous pouvez trouver. C'est une bonne valeur par défaut lorsque vous ne savez pas quel encodage utiliser. Cela permet de limiter le nombre de problèmes d'encodage, comme "Je pensais que tu étais en latin-1 / Non, j'utilisais latin-9, mais alors ce gars sur mac a utilisé Roman". Si vous avez plus d'une personne travaillant sur le contenu du site Web, ils peuvent avoir des encodages différents sur leur plateforme, et donc votre contenu peut être foiré à un moment donné.

UTF-8 est, à ma connaissance, le seul moyen de normaliser facilement l'encodage utilisé entre les personnes sans discussion.

Par exemple, si votre site Web est encodé en Windows1252 et que le nouveau développeur a un Mac, vous aurez probablement des problèmes.