Walker K., Neuburger J., Groene O., Cramwell D., Van der Meulen J., Public reporting of surgeon outcomes : low numbers of procedures lead to false complacency, Lancet 2013, 1382, 1674-77
A partir de l’été 2013, le Royaume Uni a décidé de publier les résultats cliniques nominaux des chirurgiens. La pratique avait déjà été testée sur une initiative restreinte des chirurgiens cardio-thoraciques en Angleterre et Irlande qui publient annuellement leur chiffre de mortalité (chaque chirurgien avec son nom). Le but est évidemment d’être transparent et de servir les choix des patients.
Un problème récurrent pour que ces chiffres prennent du sens se situe dans le volume de procédures. Plus il est bas, plus les chiffres perdent leur sens, et peuvent sérieusement masquer des problèmes.
L’article évalue ce risque dans quatre familles d’actes : la chirurgie cardio vasculaire précitée, l’oesophagostomie ou gastrectomie sur cancer, la chirurgie sur cancer de l’intestin, et la PTH. Trois questions sont plus particulièrement étudiées : (1) quel volume est suffisant pour la détection fiable d’un problème de compétence du chirurgien, (2) est ce que ce volume est à considérer sur 1 an, 2 an ou 5 ans, (3), quelle est la probabilité pour que le chirurgien soit détecté automatiquement dans un processus de surveillance comme sortant de l’épure et être catalogué à risque.
En chirurgie cardiaque, 50% des chirurgiens anglais font entre 60 et 170 actes/an. Les autres chirurgies cardio-thoraciques sont réalisées avec des volumes plus faibles. Dans l’ensemble, le volume est plutôt conséquent et le calcul statistique montre que 8 chirurgiens cardiaques sur 10 présentant un problème de surmortalité de ses patients seront très vraisemblablement identifiés par une surveillance basée sur le résultat.
Autre exemple, en chirurgie cancérologique de l’intestin, on est plus clairement confronté aux très faibles volumes. La mortalité post op dépasse en moyenne 5%, de sorte que si un chirurgien viscéral pratique 20 chirurgies de ce type (ce qui est plutôt le haut des fréquences observées), il aura 1 patient décédé. S’il en fait beaucoup moins (ce qui est fréquent), le rôle de facteurs contextuels peut facilement fausser totalement des résultats déjà très peu exploitables d’une recherche de sur-risque au seuil de 5%.
Quand on applique les calculs formels de statistiques pour chercher le seuil de volume nécessaire pour conclure sur un sur-risque associé au chirurgien, quasiment toutes les chirurgies doivent être observées sur plus d’un an, souvent sur plusieurs années. Le cas le plus favorable est la PTH (haut volume), et le plus difficile à conclure est celui de la chirurgie cancérologique viscérale.
Dans son nouvel indicateur public, la NHS a décidé de qualifier la mortalité associée individuellement aux chirurgiens sur une base de 3 ans de volume. Avec ce choix de 3 ans, la conclusion donne une image très fiable ou fiable du risque pour seulement 75% des chirurgiens. C’est un compromis, parce que bien sûr, une solution apparemment meilleure pour juger 100% des chirurgiens consisterait à considérer une plus longue période, mais dans ce cas on échange un risque sur la qualité d’interprétation du volume avec un risque peut être plus important d’évolution des critères d’inclusion des patients, d’innovation des techniques et des contextes et organisations.
Autre point récurrent, certains chirurgiens ne sont pas identifiés par des biais divers. Par exemple, si le risque moyen accepté est de 1 décès / 20 chirurgies cardiaques, on détectera seulement 63% des chirurgiens cardiaques présentant un sur risque (en fonction du volume de chirurgie) (on parle de positive predictive value); par extension, on ne détectera que 62 % des orthopédistes ayant des pratiques à risques dans les PTH, 57% des viscéraux ayant des difficultés avec les gastrectomies sur cancer, et 38% des viscéraux ayant des difficultés en cancérologie colique. Il faut dès lors faire attention à toute publication d’indicateur, rassurant, mais pas très fiable, où les médecins faisant très peu d’actes auraient plutôt toutes les chances d’échapper à une détection automatique, alors qu’ils sont les plus à risques.
D’autres indicateurs pourraient être considérés : taux de complications ou de ré-hospitalisation , mais le point faible est dans la certitude de récupérer les informations, codées de la même façon, pour tous les chirurgiens du pays (et donc d’éviter des biais de comptage)
Les auteurs terminent l’article par deux considérations.
Enfin, il faut évoquer les problèmes récurrents de cases mixes variables selon les chirurgiens, en bref les biais associés aux recrutements des chirurgiens, et à la difficulté de corriger les données pour que tout soit comparable à tout.
Un très bon article.