Mysql
 sql >> Base de données >  >> RDS >> Mysql

centile par COUNT(DISTINCT) avec WHERE corrélé ne fonctionne qu'avec une vue (ou sans DISTINCT)

Je dirais probablement que la requête est lente car elle accède à plusieurs reprises à la table lorsque le déclencheur se déclenche.

Je ne suis pas un expert SQL mais j'ai essayé de créer une requête à l'aide de tables temporaires. Vous pouvez voir si cela aide à accélérer la requête. J'ai utilisé des noms de colonne différents mais similaires dans mon exemple de code ci-dessous.

MODIF : Il y avait une erreur de calcul dans mon code précédent. Mis à jour maintenant.

SELECT COUNT(id) INTO @no_of_attempts from tb2;

-- DROP TABLE IF EXISTS S1Percentiles;
-- DROP TABLE IF EXISTS S2Percentiles;
-- DROP TABLE IF EXISTS S3Percentiles;

CREATE TEMPORARY TABLE S1Percentiles (
    s1 FLOAT NOT NULL,
    percentile FLOAT NOT NULL DEFAULT 0.00
);

CREATE TEMPORARY TABLE S2Percentiles (
    s2 FLOAT NOT NULL,
    percentile FLOAT NOT NULL DEFAULT 0.00
);

CREATE TEMPORARY TABLE S3Percentiles (
    s3 FLOAT NOT NULL,
    percentile FLOAT NOT NULL DEFAULT 0.00
);



INSERT INTO S1Percentiles (s1, percentile)
    SELECT A.s1, ((COUNT(B.s1)/@no_of_attempts)*100)
    FROM (SELECT DISTINCT s1 from tb2) A
    INNER JOIN tb2 B
    ON B.s1 <= A.s1
    GROUP BY A.s1;

INSERT INTO S2Percentiles (s2, percentile)
    SELECT A.s2, ((COUNT(B.s2)/@no_of_attempts)*100)
    FROM (SELECT DISTINCT s2 from tb2) A
    INNER JOIN tb2 B
    ON B.s2 <= A.s2
    GROUP BY A.s2;

INSERT INTO S3Percentiles (s3, percentile)
    SELECT A.s3, ((COUNT(B.s3)/@no_of_attempts)*100)
    FROM (SELECT DISTINCT s3 from tb2) A
    INNER JOIN tb2 B
    ON B.s3 <= A.s3
    GROUP BY A.s3;

-- select * from S1Percentiles;
-- select * from S2Percentiles;
-- select * from S3Percentiles;

UPDATE tb1 A
    INNER JOIN
    (
    SELECT B.tb1_id AS id, (C.percentile + D.percentile + E.percentile) AS sum FROM tb2 B
        INNER JOIN S1Percentiles C
        ON B.s1 = C.s1
        INNER JOIN S2Percentiles D
        ON B.s2 = D.s2
        INNER JOIN S3Percentiles E
        ON B.s3 = E.s3
    ) F
    ON A.id = F.id

    SET A.sum = F.sum;

-- SELECT * FROM tb1;

DROP TABLE S1Percentiles;
DROP TABLE S2Percentiles;
DROP TABLE S3Percentiles;

Ce que cela fait, c'est qu'il enregistre le centile pour chaque groupe de scores, puis met finalement à jour le tb1 colonne avec les données requises au lieu de recalculer le centile pour chaque ligne d'étudiant.

Vous devez également indexer les colonnes s1 , s2 et s3 pour optimiser les requêtes sur ces colonnes.

Remarque :Veuillez mettre à jour les noms de colonne en fonction de votre schéma de base de données. Notez également que chaque calcul de centile a été multiplié par 100 car je crois que ce centile est généralement calculé de cette façon.