Mysql
 sql >> Base de données >  >> RDS >> Mysql

déterminer l'ensemble de mots le plus utilisé php mysql

D'accord, cela fonctionne comme un chien et se limite à travailler avec un seul délimiteur, mais j'espère que cela vous donnera une idée.

SELECT aWord, COUNT(*) AS WordOccuranceCount
FROM (SELECT SUBSTRING_INDEX(SUBSTRING_INDEX(concat(SomeColumn, ' '), ' ', aCnt), ' ', -1) AS aWord
FROM SomeTable
CROSS JOIN (
SELECT a.i+b.i*10+c.i*100 + 1 AS aCnt
FROM integers a, integers b, integers c) Sub1
WHERE (LENGTH(SomeColumn) + 1 - LENGTH(REPLACE(SomeColumn, ' ', ''))) >= aCnt) Sub2
WHERE Sub2.aWord != ''
GROUP BY aWord
ORDER BY WordOccuranceCount DESC
LIMIT 10

Cela repose sur le fait d'avoir un tableau appelé entiers avec une seule colonne appelée i avec 10 lignes avec les valeurs 0 à 9. Il gère jusqu'à ~ 1000 mots mais peut facilement être modifié pour en gérer plus (mais ralentira encore plus).