PostgreSQL
 sql >> Base de données >  >> RDS >> PostgreSQL

Empêcher la radicalisation des noms propres dans PostgreSQL ?

L'intérêt des algorithmes de stemming n'est pas réduire chaque mot à sa racine propre; le but est de réduire les mots qui se ressemblent à une forme radicale commune. Le but n'est généralement pas d'obtenir un mot qui puisse être présenté à l'utilisateur :même si 'balling' et 'ball' produisaient tous les deux 'kjebnkkekaa', l'algorithme est correct car il considère toujours 'balling' et 'ball' comme généralement préoccupants la même chose.

Méfiez-vous également qu'aucun algorithme de stemming n'est absolument parfait, pour plus d'informations consultez l'algorithme de Porter Stemming