L'alarm fatigue è documentata in letteratura industriale dagli anni '80. Eppure ogni nuovo sistema di allarmi la riscopre. Tre principi per non cascarci.
La definizione operativa
L'alarm fatigue è la perdita di reattività agli allarmi causata da: (1) frequenza eccessiva, (2) alto tasso di falsi positivi, (3) mancanza di azionabilità. Il sintomo finale: gli allarmi vengono ignorati anche quando segnalano un problema reale.
Lo standard EEMUA 191 e l'ISA 18.2 codificano il fenomeno per le sale di controllo di processo industriale.
Le soglie pratiche da non superare
- Allarmi medi per operatore: ≤6 per ora in stato stabile, ≤300 al giorno totale. Sopra c'è fatica.
- Picchi di allarmi: ≤10 in 10 minuti durante condizioni avverse. Sopra è "allarme tempesta", l'operatore non li gestisce.
- Allarmi standby: ≥95% del tempo dovrebbe essere "nessun allarme attivo". Se è meno, gli allarmi non sono eccezionali — sono lo stato normale.
Le 3 contromisure
1. Allarmi solo se azionabili. Se ricevere un allarme non comporta un'azione possibile per chi lo riceve, l'allarme non deve esistere. Quel dato sta in dashboard o in log, non in notifica.
2. Razionalizzazione periodica. Trimestralmente, riguardare gli allarmi top-10 per frequenza. Quelli che si ripetono molte volte vanno: rivisti come soglia, fixati nella causa root, o eliminati.
3. Pattern detection. Quando un allarme A è sempre seguito da B e C entro 2 minuti, il MES dovrebbe raggruppare A+B+C come singolo evento "anomalia X" invece che 3 allarmi separati.