Mysql
 sql >> Base de données >  >> RDS >> Mysql

MySQL sélectionne les enregistrements pour les doublons en utilisant plusieurs colonnes

Si vous souhaitez compter les doublons sur plusieurs colonnes, utilisez group by :

select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
from table
group by ColumnA, ColumnB, ColumnC

Si vous ne voulez que les valeurs qui sont dupliquées, alors le nombre est supérieur à 1. Vous obtenez ceci en utilisant le having clause :

select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
from table
group by ColumnA, ColumnB, ColumnC
having NumDuplicates > 1

Si vous voulez réellement que toutes les lignes en double soient renvoyées, joignez la dernière requête aux données d'origine :

select t.*
from table t join
     (select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
      from table
      group by ColumnA, ColumnB, ColumnC
      having NumDuplicates > 1
     ) tsum
     on t.ColumnA = tsum.ColumnA and t.ColumnB = tsum.ColumnB and t.ColumnC = tsum.ColumnC

Cela fonctionnera, en supposant qu'aucune des valeurs de colonne n'est NULL. Si oui, essayez :

     on (t.ColumnA = tsum.ColumnA or t.ColumnA is null and tsum.ColumnA is null) and
        (t.ColumnB = tsum.ColumnB or t.ColumnB is null and tsum.ColumnB is null) and
        (t.ColumnC = tsum.ColumnC or t.ColumnC is null and tsum.ColumnC is null)

MODIFIER :

Si vous avez NULL valeurs, vous pouvez également utiliser le NULL -opérateur sûr :

     on t.ColumnA <=> tsum.ColumnA and
        t.ColumnB <=> tsum.ColumnB and
        t.ColumnC <=> tsum.ColumnC