Oui c'est correct. UTF-8 est un encodage pour le jeu de caractères Unicode, qui prend en charge pratiquement toutes les langues du monde.
Je pense que la seule différence vient du tri de vos résultats, différentes lettres peuvent apparaître dans un ordre différent dans d'autres langues (accents, trémas, etc.). Aussi, en comparant a
à ä
peut se comporter différemment dans un autre classement.
Le _ci
le suffixe signifie que le tri et la comparaison se produisent c as i nsensible.
http://www.collation-charts.org/ pourrait vous intéresser.