PostgreSQL
 sql >> Base de données >  >> RDS >> PostgreSQL

Problème complexe de "lacunes et d'îlots"

La façon dont vous déterminez le type n'est pas claire pour chaque période. J'ai choisi le nombre minimum.

En supposant cette définition de table de base :

CREATE TABLE tbl (person text, eventdate date, type int);

Fondamentalement, je suggère fonctions de fenêtre dans deux sous-requêtes imbriquées pour identifier les membres de la même période (île). Ensuite, agrégez :

SELECT person, period
     , min(eventdate) AS startdate
     , max(eventdate) AS enddate
     , count(*)       AS days
     , min(type)      AS type
FROM  (
   SELECT person, eventdate, type
        , count(gap) OVER (PARTITION BY person ORDER BY eventdate) AS period
   FROM  (
      SELECT person, eventdate, type
           , CASE WHEN lag(eventdate) OVER (PARTITION BY person ORDER BY eventdate)
                     > eventdate - 6  -- within 5 days
                  THEN NULL           -- same period
                  ELSE TRUE           -- next period
             END AS gap
      FROM   tbl
      ) sub
   ) sub
GROUP  BY person, period
ORDER  BY person, period;

Résultat (basé sur vos données d'exemple) :

  person  | period | startdate  |  enddate   | days | type
----------+--------+------------+------------+------+------
 <uuid-1> |      1 | 2016-05-14 | 2016-05-22 |    5 |  300
 <uuid-1> |      2 | 2016-05-30 | 2016-06-01 |    2 |  300
 <uuid-1> |      3 | 2016-06-21 | 2016-06-21 |    1 |  300
 <uuid-2> |      1 | 2016-05-22 | 2016-05-27 |    2 |  301
 <uuid-2> |      2 | 2016-06-15 | 2016-06-23 |    4 |  300
 <uuid-2> |      3 | 2016-06-30 | 2016-06-30 |    1 |  300
 <uuid-3> |      1 | 2016-05-14 | 2016-05-14 |    1 |  300
 <uuid-3> |      2 | 2016-06-30 | 2016-06-30 |    1 |  300
 <uuid-4> |      1 | 2016-06-16 | 2016-06-16 |    1 |  300
 <uuid-4> |      2 | 2016-06-30 | 2016-06-30 |    1 |  300
 <uuid-5> |      1 | 2016-06-20 | 2016-06-20 |    1 |  300

Si le même jour pour la même personne peut être saisi plusieurs fois avec des types différents, et que vous souhaitez uniquement compter distinct jours, faites-le :count(DISTINCT eventdate) AS days .

Connexe, avec une explication détaillée :

BTW, eventdate - 6 fonctionne pour le type de données date , mais pas pour timestamp :