Mysql
 sql >> Base de données >  >> RDS >> Mysql

Différences entre utf8 et latin1

UTF-8 est prêt pour la domination mondiale, Latin1 n'est pas.

Si vous essayez de stocker des caractères non latins comme le chinois, le japonais, l'hébreu, le russe, etc. en utilisant l'encodage Latin1, ils se retrouveront sous la forme mojibake . Vous pouvez trouver le texte d'introduction de cet article utile (et encore plus si vous connaissez un peu Java).

Notez que la prise en charge complète de l'UTF-8 à 4 octets n'a été introduite que dans MySQL 5.5. Avant cette version, il n'allait que jusqu'à 3 octets par caractère, et non 4 octets par caractère. Ainsi, il ne supportait que le plan BMP et non par ex. l'avion Emoji. Si vous souhaitez une prise en charge complète de l'UTF-8 à 4 octets, mettez à niveau MySQL vers au moins la version 5.5 ou optez pour un autre SGBDR comme PostgreSQL. Dans MySQL 5.5+, il s'appelle utf8mb4 .