Sqlserver
 sql >> Base de données >  >> RDS >> Sqlserver

SQL, tableau auxiliaire des nombres

Hé... désolé, je réponds si tard à un ancien message. Et, oui, j'ai dû répondre parce que la réponse la plus populaire (à l'époque, la réponse CTE récursive avec le lien vers 14 méthodes différentes) sur ce fil est, euh... les performances sont au mieux mises à l'épreuve.

Tout d'abord, l'article avec les 14 solutions différentes est bien pour voir les différentes méthodes de création d'un tableau Numbers/Tally à la volée, mais comme indiqué dans l'article et dans le fil cité, il y a un très citation importante...

"Les suggestions concernant l'efficacité et les performances sont souvent subjectives. Indépendamment de la façon dont une requête est utilisée, l'implémentation physique détermine l'efficacité d'une requête. Par conséquent, plutôt que de vous fier à des directives biaisées, il est impératif que vous testiez la requête et déterminiez celle qui fonctionne le mieux."

Ironiquement, l'article lui-même contient de nombreuses déclarations subjectives et "directives biaisées" telles que "un CTE récursif peut générer une liste de nombres assez efficacement " et "C'est une méthode efficace d'utiliser la boucle WHILE d'une publication de groupe de discussion par Itzik Ben-Gen" (que je suis sûr qu'il a posté juste à des fins de comparaison). Allez les gens... Le simple fait de mentionner le bon nom d'Itzik peut amener un pauvre slob à utiliser cette horrible méthode. L'auteur doit mettre en pratique ce qu'il prêche et faire quelques tests de performance avant de faire des déclarations aussi ridiculement incorrectes, en particulier face à toute évolutivité.

Avec l'idée de faire des tests avant de faire des déclarations subjectives sur ce que fait n'importe quel code ou ce que quelqu'un "aime", voici un code avec lequel vous pouvez faire vos propres tests. Configurez le profileur pour le SPID à partir duquel vous exécutez le test et vérifiez-le par vous-même... faites simplement une "recherche et remplacement" du nombre 1000000 pour votre numéro "favori" et voyez...

--===== Test for 1000000 rows ==================================
GO
--===== Traditional RECURSIVE CTE method
   WITH Tally (N) AS 
        ( 
         SELECT 1 UNION ALL 
         SELECT 1 + N FROM Tally WHERE N < 1000000 
        ) 
 SELECT N 
   INTO #Tally1 
   FROM Tally 
 OPTION (MAXRECURSION 0);
GO
--===== Traditional WHILE LOOP method
 CREATE TABLE #Tally2 (N INT);
    SET NOCOUNT ON;
DECLARE @Index INT;
    SET @Index = 1;
  WHILE @Index <= 1000000 
  BEGIN 
         INSERT #Tally2 (N) 
         VALUES (@Index);
            SET @Index = @Index + 1;
    END;
GO
--===== Traditional CROSS JOIN table method
 SELECT TOP (1000000)
        ROW_NUMBER() OVER (ORDER BY (SELECT 1)) AS N
   INTO #Tally3
   FROM Master.sys.All_Columns ac1
  CROSS JOIN Master.sys.ALL_Columns ac2;
GO
--===== Itzik's CROSS JOINED CTE method
   WITH E00(N) AS (SELECT 1 UNION ALL SELECT 1),
        E02(N) AS (SELECT 1 FROM E00 a, E00 b),
        E04(N) AS (SELECT 1 FROM E02 a, E02 b),
        E08(N) AS (SELECT 1 FROM E04 a, E04 b),
        E16(N) AS (SELECT 1 FROM E08 a, E08 b),
        E32(N) AS (SELECT 1 FROM E16 a, E16 b),
   cteTally(N) AS (SELECT ROW_NUMBER() OVER (ORDER BY N) FROM E32)
 SELECT N
   INTO #Tally4
   FROM cteTally
  WHERE N <= 1000000;
GO
--===== Housekeeping
   DROP TABLE #Tally1, #Tally2, #Tally3, #Tally4;
GO

Pendant que nous y sommes, voici les chiffres que j'obtiens de SQL Profiler pour les valeurs de 100, 1000, 10000, 100000 et 1000000...

SPID TextData                                 Dur(ms) CPU   Reads   Writes
---- ---------------------------------------- ------- ----- ------- ------
  51 --===== Test for 100 rows ==============       8     0       0      0
  51 --===== Traditional RECURSIVE CTE method      16     0     868      0
  51 --===== Traditional WHILE LOOP method CR      73    16     175      2
  51 --===== Traditional CROSS JOIN table met      11     0      80      0
  51 --===== Itzik's CROSS JOINED CTE method        6     0      63      0
  51 --===== Housekeeping   DROP TABLE #Tally      35    31     401      0

  51 --===== Test for 1000 rows =============       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method      47    47    8074      0
  51 --===== Traditional WHILE LOOP method CR      80    78    1085      0
  51 --===== Traditional CROSS JOIN table met       5     0      98      0
  51 --===== Itzik's CROSS JOINED CTE method        2     0      83      0
  51 --===== Housekeeping   DROP TABLE #Tally       6    15     426      0

  51 --===== Test for 10000 rows ============       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method     434   344   80230     10
  51 --===== Traditional WHILE LOOP method CR     671   563   10240      9
  51 --===== Traditional CROSS JOIN table met      25    31     302     15
  51 --===== Itzik's CROSS JOINED CTE method       24     0     192     15
  51 --===== Housekeeping   DROP TABLE #Tally       7    15     531      0

  51 --===== Test for 100000 rows ===========       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method    4143  3813  800260    154
  51 --===== Traditional WHILE LOOP method CR    5820  5547  101380    161
  51 --===== Traditional CROSS JOIN table met     160   140     479    211
  51 --===== Itzik's CROSS JOINED CTE method      153   141     276    204
  51 --===== Housekeeping   DROP TABLE #Tally      10    15     761      0

  51 --===== Test for 1000000 rows ==========       0     0       0      0
  51 --===== Traditional RECURSIVE CTE method   41349 37437 8001048   1601
  51 --===== Traditional WHILE LOOP method CR   59138 56141 1012785   1682
  51 --===== Traditional CROSS JOIN table met    1224  1219    2429   2101
  51 --===== Itzik's CROSS JOINED CTE method     1448  1328    1217   2095
  51 --===== Housekeeping   DROP TABLE #Tally       8     0     415      0

Comme vous pouvez le voir, la méthode CTE récursive est la deuxième pire après la boucle While pour la durée et le processeur et a 8 fois plus de pression mémoire sous forme de lectures logiques que la boucle While . C'est RBAR sur les stéroïdes et doit être évité à tout prix pour tous les calculs à une seule ligne, tout comme une boucle While doit être évitée. Il y a des endroits où la récursivité est très utile, mais ce N'EST PAS l'un d'entre eux .

En tant que barre latérale, M. Denny est absolument parfait... une table de nombres ou de pointage permanente de taille correcte est la voie à suivre pour la plupart des choses. Que signifie correctement dimensionné ? Eh bien, la plupart des gens utilisent une table Tally pour générer des dates ou pour faire des fractionnements sur VARCHAR(8000). Si vous créez une table Tally de 11 000 lignes avec l'index clusterisé correct sur "N", vous aurez suffisamment de lignes pour créer plus de 30 ans de dates (je travaille un peu avec des hypothèques donc 30 ans est un nombre clé pour moi ) et certainement assez pour gérer une scission VARCHAR(8000). Pourquoi la "bonne taille" est-elle si importante ? Si la table Tally est beaucoup utilisée, elle tient facilement dans le cache, ce qui la rend extrêmement rapide sans trop de pression sur la mémoire.

Enfin et surtout, tout le monde sait que si vous créez une table de pointage permanente, peu importe la méthode que vous utilisez pour la construire car 1) elle ne sera créée qu'une seule fois et 2) si c'est quelque chose comme une ligne de 11 000 table, toutes les méthodes vont fonctionner "assez bien". Alors pourquoi toute cette indigence de ma part sur la méthode à utiliser ???

La réponse est qu'un pauvre gars/fille qui ne sait pas mieux et qui a juste besoin de faire son travail pourrait voir quelque chose comme la méthode CTE récursive et décider de l'utiliser pour quelque chose de beaucoup plus grand et beaucoup plus fréquemment utilisé que la construction une table de pointage permanente et j'essaie de protéger ces personnes, les serveurs sur lesquels leur code s'exécute et la société qui détient les données sur ces serveurs . Ouais... c'est si important. Cela devrait être pour tout le monde aussi. Enseigner la bonne façon de faire les choses au lieu de "assez bien". Faites quelques tests avant de publier ou d'utiliser quelque chose d'un article ou d'un livre... la vie que vous sauvez peut, en fait, être la vôtre, surtout si vous pensez qu'un CTE récursif est la voie à suivre pour quelque chose comme ça.;-)

Merci pour votre écoute...