Cowork conversa
R
Conversa · investigação

Por que SUP-01
demorou mais este mês?

Iniciada há 12 minutos · 3 turnos · contexto carregado de 12 execuções históricas
SUP-01 · Atlas Suprimentos 12 runs · 30d SAP · Ariba · Icertis
Por que SUP-01 demorou 6m 11s em março versus 4m 32s em abril? Compare os workflows pra mim.
Cowork · resposta 3 de 3 etapas
Carreguei as 12 execuções de SUP-01 nos últimos 30 dias.
Comparei os tempos por nó entre março e abril.
Identifiquei o gargalo no nó N1 (Extrair dados).

A diferença está concentrada em um único nó: N1 — Extrair dados. Em março, esse passo demorou 3m 27s; em abril, voltou ao normal de 1m 42s. Os outros três nós tiveram performance consistente entre os meses.

Workflow comparado · março ⇄ abril

março/2026
N1 · Extrair dados
3m 27s
N2 · Consolidar
36s
N3 · Gerar PDF
1m 48s
N4 · Distribuir
20s
abril/2026
N1 · Extrair dados
1m 42s
N2 · Consolidar
38s
N3 · Gerar PDF
1m 51s
N4 · Distribuir
21s

A causa do pico em março foi o conector Icertis. A latência de resposta saltou para 2.840ms (vs. baseline 1.241ms) durante uma janela de manutenção da plataforma na noite de 31 mar, comunicada pela TI deles em ticket interno.

Conector · N1 Latência mar Latência abr
SAP 897ms 894ms −0,3%
Ariba 624ms 612ms −1,9%
Icertis 2.840ms 1.241ms −56,3%

Foi um evento pontual e já resolvido. Não há ação necessária. Mas vale registrar: o p95 do Icertis em horários de maintenance window pode comprometer o SLA do D+1, então recomendo configurar uma circuit-breaker para reagendar a execução de SUP-01 quando latência do Icertis ultrapassar 2s. Quer que eu rascunhe essa configuração?

"Manutenção programada na plataforma Icertis CLM · ambiente de produção · janela 31/03 22:00–05:00 BRT · degradação aceita até 3s p95" — Icertis Status Page · ticket SP-2026-1402 · vinculado por Atlas em 01.04 06:01
Sim, rascunhe a circuit-breaker. E mostra como ficaria a SUP-01 com ela.
Cowork · proposta draft · aguardando aprovação

Rascunho pronto. Não aplico nada antes da sua confirmação.

DRAFT · CIRCUIT-BREAKER · SUP-01.N1
Reagendar quando Icertis > 2s
Trigger: latência p95 do conector Icertis ultrapassa 2.000ms em janela de 5 min.
Ação: pausa a execução de SUP-01, cria registro em queue de retry, agenda nova tentativa em 30 min.
Notificação: e-mail para Carla Andrade + log em audit.
Limite: máximo 3 retries; após isso, escala para o coordenador.
Auditoria: todas as decisões registradas em audit_log com motivo e timestamp.

Comportamento esperado em uma janela de degradação como a de 31 mar:

  • Atlas detecta latência alta logo na primeira tentativa de N1.
  • Pausa a run, salva contexto e aguarda 30 min.
  • Re-tenta. Se Icertis estiver normal, segue. Se não, repete até 3 vezes.
  • Em vez do relatório chegar atrasado e degradado, ele chega uns minutos depois, mas íntegro — ou escala para humano explicitamente.

Confirma a aplicação? Posso publicar como SUP-01 v2.5 agora, ou deixar como rascunho para você revisar amanhã com o time.