Mysql
 sql >> Base de données >  >> RDS >> Mysql

Obtenir les lignes les plus similaires dans la table MySQL et les classer par similarité

Comme dans ma table actuellement, je n'ai qu'environ 5 000 lignes et qu'elles grandissent lentement, j'ai décidé d'utiliser l'approche simple suivante (elle m'est venue juste après avoir écrit la question).

La semence disons est Honda Accord (model_id 456), 2004, essence, 2.0L, 155hp, berline avec auto-inc ID 123.

SELECT vehicles.*,  
    (IF(`fuel_type`='gasoline', 3, 0) + 
     IF(`body_style`='sedan', 1, 0) + 
     IF(`year` > 2001 AND `year` < 2007, 2, 0) + 
     IF(`engine_size` >= 1.8 AND `engine_size` <= 2.2, 1, 0) + 
     IF(`engine_power`=155, 3, IF(`engine_power`>124 AND `engine_power`<186, 1, 0))) AS `rank`
FROM vehicles
WHERE vehicle_id!=123 AND model_id=456
ORDER BY `rank` DESC
LIMIT 3

Cela fonctionnera, tant que je ne fais pas trop de lignes. Si la table devient 50-100k, je devrai probablement passer à quelque chose comme Lucene ?