You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Les jobs de la queue workflow ne sont pas exécutés et en regardant en console il y a des jobs qui sont dans des états incohérents entre la console de production et la base de données.
Il se trouve que quand un Transport.Jobs.Workflow exécute un job avec un timeout et que cette situation se produit, la payload reçue par le handler Telemetry n'était pas bien gérée oban-bg/oban#1210 (comment). La documentation d'Oban est perfectible pour les événements oban-bg/oban#1153 (comment)
Ceci empêche le job Workflow de se mettre à jour : retry ou discarded. Le job reste en executing pendant plus de 60 minutes et se fait donc remettre en available par le plugin Lifeline oban-bg/oban#1210 (comment).
On ne s'attendait pas à avoir une struct dans ce bout de code, ce qui cause le problème. Un crash dans un handler se voit mal, remonte mal (pas du tout même ?) dans Sentry (identifié dans #3454 précédemment). Bref, difficile à voir.
The text was updated successfully, but these errors were encountered:
Conséquences de ce job : la queue workflow est bloquée, on n'historise plus aucune ressource statique jusqu'au reboot du worker et on va stopper de nouveau si on tombe sur une ressource qu'on a du mal à historiser (serveur HTTP qui met plus de 2 minutes à répondre, vu en production…).
Si on n'historise plus les ressources statiques, ensuite :
on n'a plus les bonnes informations des ressources affichées dans l'API
plus de validations
plus de conversions
plus de visualisations
plus de notifications par rapport aux nouvelles données
on risque de prévenir d'expiration de données alors que les données ont été mises à jour (on ne détecte pas le changement de ressource)
Symptômes du bug décrits dans #4406 et oban-bg/oban#1210 en détails.
Les jobs de la queue
workflow
ne sont pas exécutés et en regardant en console il y a des jobs qui sont dans des états incohérents entre la console de production et la base de données.Il se trouve que quand un
Transport.Jobs.Workflow
exécute un job avec un timeout et que cette situation se produit, la payload reçue par le handler Telemetry n'était pas bien gérée oban-bg/oban#1210 (comment). La documentation d'Oban est perfectible pour les événements oban-bg/oban#1153 (comment)Ceci empêche le job
Workflow
de se mettre à jour : retry ou discarded. Le job reste enexecuting
pendant plus de 60 minutes et se fait donc remettre enavailable
par le plugin Lifeline oban-bg/oban#1210 (comment).On ne s'attendait pas à avoir une
struct
dans ce bout de code, ce qui cause le problème. Un crash dans un handler se voit mal, remonte mal (pas du tout même ?) dans Sentry (identifié dans #3454 précédemment). Bref, difficile à voir.The text was updated successfully, but these errors were encountered: