La correspondance des noms est difficile . L'indexation de texte d'Oracle prend en charge la correspondance floue et la recherche de radicaux, ce qui est un début, mais tenez compte de ces noms :
- Nicolas Raleigh
- Nicolas Raleigh
- Nico Raleigh
- Nik Raleigh
- Nicky Raleigh
- Nick Raleigh
- Nikolaus Raleigh
- Nicola Raleigh
- Nikki Raleigh
- Nikola Raleigh
- Nikolai Raleigh
- Nikolaj Raleigh
Tenter de faire correspondre ceux-ci par le biais d'abstractions, que ce soit la distance de Levenshtein ou le double métaphone, va générer des faux positifs et des faux négatifs. C'est la nature de l'abstraction. La meilleure façon d'obtenir un ensemble de résultats ciblé et précis est d'utiliser un thésaurus (et même celui-ci n'est pas parfait). Malheureusement, assembler un thésaurus complet de noms est une entreprise gigantesque; pour avoir une idée de la tâche, consultez les statistiques sur le site NameX .
Mise à jour :Oracle 11gR2 inclut une extension d'Oracle Text adaptée à la recherche de noms. C'est très soigné, et certainement le premier endroit pour commencer. En savoir plus .