PostgreSQL
 sql >> Base de données >  >> RDS >> PostgreSQL

File d'attente des tâches en tant que table SQL avec plusieurs consommateurs (PostgreSQL)

J'utilise également postgres pour une file d'attente FIFO. À l'origine, j'utilisais ACCESS EXCLUSIVE, qui donne des résultats corrects dans une concurrence élevée, mais a le malheureux effet d'être mutuellement exclusif avec pg_dump, qui acquiert un verrou ACCESS SHARE lors de son exécution. Cela provoque le verrouillage de ma fonction next() pendant très longtemps (la durée de pg_dump). Ce n'était pas acceptable car nous sommes un magasin ouvert 24h/24 et 7j/7 et les clients n'aimaient pas le temps mort dans la file d'attente au milieu de la nuit.

J'ai pensé qu'il devait y avoir un verrou moins restrictif qui serait toujours sécurisé et non verrouillé pendant l'exécution de pg_dump. Ma recherche m'a conduit à cet article SO.

Ensuite, j'ai fait quelques recherches.

Les modes suivants sont suffisants pour une fonction FIFO queue NEXT() qui mettra à jour le statut d'un travail depuis queued à courir sans aucun échec de concurrence, et également sans bloquer contre pg_dump :

SHARE UPDATE EXCLUSIVE
SHARE ROW EXCLUSIVE
EXCLUSIVE

Requête :

begin;
lock table tx_test_queue in exclusive mode;
update 
    tx_test_queue
set 
    status='running'
where
    job_id in (
        select
            job_id
        from
            tx_test_queue
        where
            status='queued'
        order by 
            job_id asc
        limit 1
    )
returning job_id;
commit;

Le résultat ressemble à :

UPDATE 1
 job_id
--------
     98
(1 row)

Voici un script shell qui teste tous les différents modes de verrouillage à haute simultanéité (30).

#!/bin/bash
# RESULTS, feel free to repro yourself
#
# noLock                    FAIL
# accessShare               FAIL
# rowShare                  FAIL
# rowExclusive              FAIL
# shareUpdateExclusive      SUCCESS
# share                     FAIL+DEADLOCKS
# shareRowExclusive         SUCCESS
# exclusive                 SUCCESS
# accessExclusive           SUCCESS, but LOCKS against pg_dump

#config
strategy="exclusive"

db=postgres
dbuser=postgres
queuecount=100
concurrency=30

# code
psql84 -t -U $dbuser $db -c "create table tx_test_queue (job_id serial, status text);"
# empty queue
psql84 -t -U $dbuser $db -c "truncate tx_test_queue;";
echo "Simulating 10 second pg_dump with ACCESS SHARE"
psql84 -t -U $dbuser $db -c "lock table tx_test_queue in ACCESS SHARE mode; select pg_sleep(10); select 'pg_dump finished...'" &

echo "Starting workers..."
# queue $queuecount items
seq $queuecount | xargs -n 1 -P $concurrency -I {} psql84 -q -U $dbuser $db -c "insert into tx_test_queue (status) values ('queued');"
#psql84 -t -U $dbuser $db -c "select * from tx_test_queue order by job_id;"
# process $queuecount w/concurrency of $concurrency
case $strategy in
    "noLock")               strategySql="update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "accessShare")          strategySql="lock table tx_test_queue in ACCESS SHARE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "rowShare")             strategySql="lock table tx_test_queue in ROW SHARE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "rowExclusive")         strategySql="lock table tx_test_queue in ROW EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "shareUpdateExclusive") strategySql="lock table tx_test_queue in SHARE UPDATE EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "share")                strategySql="lock table tx_test_queue in SHARE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "shareRowExclusive")    strategySql="lock table tx_test_queue in SHARE ROW EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "exclusive")            strategySql="lock table tx_test_queue in EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "accessExclusive")      strategySql="lock table tx_test_queue in ACCESS EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    *) echo "Unknown strategy $strategy";;
esac
echo $strategySql
seq $queuecount | xargs -n 1 -P $concurrency -I {} psql84 -U $dbuser $db -c "$strategySql"
#psql84 -t -U $dbuser $db -c "select * from tx_test_queue order by job_id;"
psql84 -U $dbuser $db -c "select count(distinct(status)) as should_output_100 from tx_test_queue;"
psql84 -t -U $dbuser $db -c "drop table tx_test_queue;";

Le code est également ici si vous souhaitez le modifier :https://gist.github.com/1083936

Je mets à jour mon application pour utiliser le mode EXCLUSIF car c'est le mode le plus restrictif qui a) est correct et b) n'entre pas en conflit avec pg_dump. J'ai choisi le plus restrictif car il semble le moins risqué en termes de changement d'application d'ACCESS EXCLUSIVE sans être un super-expert en verrouillage postgres.

Je me sens assez à l'aise avec mon banc d'essai et avec les idées générales derrière la réponse. J'espère que partager cela aidera à résoudre ce problème pour les autres.