La collation est le moindre de vos soucis, ce à quoi vous devez penser est le jeu de caractères pour la colonne/table/base de données. La collation (règles régissant la manière dont les données sont comparées et triés ) n'est qu'un corollaire de cela.
MySQL prend en charge plusieurs jeux de caractères Unicode, utf8
et utf8mb4
étant le plus intéressant. utf8
prend en charge les caractères Unicode dans le BMP
, c'est-à-dire un sous-ensemble de tout Unicode. utf8mb4
, disponible depuis MySQL 5.5.3, supporte tous d'Unicode.
La collation à utiliser avec l'un des encodages Unicode est très probablement xxx_general_ci
ou xxx_unicode_ci
. Le premier est un algorithme général de tri et de comparaison indépendant de la langue, le second est plus complet algorithme indépendant du langage prenant en charge davantage de fonctionnalités Unicode (par exemple, traiter "ß" et "ss" comme équivalents), mais est donc également plus lent.
Voir https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .