diagnóstico (PD) y al grupo control (. Utilizamos el puntaje de Alvarado -una escala de 10 puntos (ref)- para estratificar pacientes de acuerdo a su probabilidad de apendicitis (el puntaje es, a grandes rasgos, proporcional a la probabilidad). La GCUS fue realizada en todos los pacientes del grupo de protocolo de diagnóstico que tenían un puntaje de Alvarado de 4-8 inclusive, pero era opcional en aquellos con puntaje de Alvarado de 9 o 10, de acuerdo con la preferencia del cirujano. De esta forma permitíamos a los cirujanos evitar pruebas innecesarias en pacientes con probabilidades previa extremas. Por las razones mencionadas previamente, los resultados de la prueba diagnóstica no determinaron el tratamiento. La decisión de operar o no fue tomada por el cirujano a cargo, teniendo en cuenta los resultados del test así como el cuadro clínico.Identificamos 4 resultados clínicos importantes: tiempo hasta la intervención quirúrgica (para aquellos a quienes les realizaron una cirugía terapéutica); tiempo de internación; cirugía no terapéutica (CNT), y tratamiento tardío con perforación (TTCP), definido como tiempo hasta la operación mayor de 10 horas en un paciente con evidencia objetiva de perforación. Incluimos la laparoscopia diagnóstica como una cirugía no terapéutica. Algunos autores aducen que la laparoscopia puede «reducir el número de apendicectomías innecesarias». La laparoscopia requiere anestesia general, tiene efectivamente morbilidad asociada y conlleva un pequeño riesgo de muerte.Mientras que CNT (o su burdo equivalente «apendicectomía negativa») ha sido uno de los puntos de investigación clínica, el tratamiento tardío en asociación con perforación o TTCP no es un resultado generalmente notificado. Los investigadores tienden a citar su tasa de perforación total: pero éste no es un buen indicador de resultado clínico, porque varía ampliamente entre distintos grupos de la población (especialmente con la edad) y en la mayoría de los casos refleja lo que ha ocurrido previamente a la presentación en el servicio de cirugía. Por otro lado, TTCP es probablemente un resultado evitable y la tasa de TTCP refleja con mayor precisión el daño que puede causarse por ser demasiado reticente a intervenir quirúrgicamente (aunque puedan existir razones relacionadas con el sistema que retrasen la cirugía). Es nuestra esperanza que TTCP se transforme en una medición estándar de resultado clínico.Resultados Recolectamos 302 pacientes en 12 meses incluyendo adultos y niños. La precisión de la GCUS para el diagnóstico de apendicitis en nuestro estudio fue 93% (sensibilidad 95%, especificidad 89%), lo cual no es solamente un buen resultado sino que es mejor que las cifras publicadas en la mayoría de los estudios. El tratamiento fue instaurado más rápido en las pacientes del grupo de protocolo diagnóstico (PD), con un tiempo hasta la cirugía terapéutica de 7.2 horas comparada con 10 horas en los controles (p=0.016). Sin embargo, no hubo diferencias significativas entre los grupos en ningún otro resultado primario. La proporción de pacientes con un resultado desfavorable fue casi idéntica: 17/142 en el grupo control (15 CNT, 2 TTCP) y 19/160 en el grupo PD (14 CNT, 5 TTCP). No hubo diferencias significativas entre los grupos en la duración media de internación (54.5 horas en el grupo control, 53.4 horas en el grupo PD, p=0,84). Las conclusiones fueron las mismas en todos los subgrupos del análisis, incluyendo el análisis por sexo y por edad.Los pacientes del grupo PD en quienes no se realizó GCUS (porque tenían un puntaje de Alvarado de 9 o 10 y los cirujanos eligieron intervenirlos quirúrgicamente sobre la base de la clínica) no tuvieron probabilidades más bajas de tener un resultado adverso (CNT o TTCP) ni más altas de una cirugía temprana que los pacientes en los que se realizó GCUS. Esto parece confirmar que la GCUS tiene poco que ofrecer al paciente con los signos y síntomas clásicos de apendicitis. El puntaje de Avarado provee una descripción objetiva de este grupo con «altas probabilidades»: son los que tienen puntaje 9 o 10. En realidad, existe alguna evidencia de este estudio, y de un trabajo posterior en nuestra institución, acerca de que aquellos pacientes con puntajes de 10, 9 u 8 deben ser considerados de alto riesgo y que todos los casos de TTCP ocurren en esta franja.Asimismo, nuestro estudio no pudo demostrar ningún beneficio significativo con el uso de GCUS, aun en los casos de puntajes más bajos. Esto parece confuso al principio, especialmente porque todos los 54 pacientes que fueron intervenidos quirúrgicamente luego de una GCUS positiva tuvieron verdaderamente apendicitis. Si no hubo falsos positivos, ¿por qué no existió una reducción importante en la tasa de cirugía no terapéutica como resultadoEl problema de las pruebas falsas negativas La pregunta es fácil de responder considerando a los pacientes que tuvieron una GCUS negativa. Una proporción de estos pacientes no va a mejorar en las próximas horas o días. La mayoría no va a tener apendicitis pero algunos sí: sabemos que GCUS produce falsos negativos. Más aún, muchos de esos falsos negativos que se han visto en nuestro estudio y en otros ocurren en pacientes con apendicitis perforadas (2, 6). Sin tratamiento, estos pacientes podrían morir. Por lo tanto el cirujano debe operar a algunos pacientes con dolor persistente y dolor a la palpación superficial, independientemente de los resultados del GCUS. No es de extrañar que el cirujano carezca de una manera de distinguir una prueba falsa negativa de una negativa verdadera, y que en el afán de evitar algunas muertes realice un número mayor de CNT.Debe destacarse que este dilema clínico permanecerá en la medida en que no se encuentre efectivamente una prueba con sensibilidad del 100%. Mientras sigan existiendo falsos negativos y mientras sigamos lidiando con una patología potencialmente fatal, va a haber dudas acerca de si puede confiarse en una prueba diagnóstica negativa. Una vez que esta falta de certeza se incorpora, ya no sería posible obtener el beneficio completo de muchas pruebas negativas verdaderas.El «problema» de las pruebas verdaderas positivas Ya ha sido señalado en la discusión general que algunos pacientes pueden ser manejados sin tratamiento, aunque creamos que padecen verdaderamente la enfermedad. Hay cada vez más evidencias, irónicamente de estudios de GCUS (7,8), de que los pacientes se recuperan de la apendicitis. Nuestro estudio sugirió (pero no demostró) que la CGUS lleva a un aumento en el número de cirugías. Puede ser que algunos pacientes que tienen una prueba positiva se beneficien con una cirugía terapéutica, pero no estrictamente necesaria, ya que se recuperarían después de una noche de observación. Cuánta es la morbilidad de dichas cirugías innecesarias, comparadas con futuros ataques recurrentes de apendicitis, es por supuesto un punto difícil de determinar.Futuro del diagnóstico de apendicitis No creemos que nuestro estudio vaya a ser la última palabra en GCUS, pero sí creemos que no deben empeñarse esfuerzos en futuros estudios no controlados. Lo mismo se aplicaría a otras modalidades diagnósticas promisorias. La TC se presenta como una opción de alta sensibilidad, ciertamente menor del 100%, cuando todos los trabajos publicados se tienen en cuenta en forma conjunta. Por otro lado, es de algún modo un estudio invasivo ya que requiere contraste oral y rectal para conseguir las tasas más altas de precisión publicadas. Ningún estudio aleatorizado ha sido publicado todavía aunque hemos recibido algunas comunicaciones contemplando un estudio planeado. La laparoscopia, como ya ha sido mencionado, es aún más invasiva. Se ha realizado un estudio aleatorizado entre laparotomía versus laparoscopia (4), pero no contamos con una comparación entre laparoscopia versus diagnóstico clínico.Resumen Existen razones fundamentales para sospechar de que una prueba más precisa signifique mejor tratamiento. Una prueba diagnóstica merece ser realizada si mejora los resultados clínicos. Como cualquier otra forma de intervención, las pruebas diagnósticas pueden y deben ser evaluadas en trabajos controlados aleatorizados.References 1. Rao PM, Boland GWL. Imaging of acute right lower abdominal quadrant pain. Clin Radiol 1998;53:639-649.2. Douglas CD, Macpherson NE, Davidson PM, Gani JS. Randomised controlled trial of ultrasonography in the diagnosis of acute appendicitis, incorporating the Alvarado score. BMJ,2000;321:919-922.3. Jones PF. Active observation in the management of acute abdominal pain in childhood. Br Med J 1976;ii:551-3.4. Olsen JB, Myren CJ, Haahr PE. Randomized study of the value of laparoscopy before appendicectomy. Br J Surg 1993;80:822-923.5. Kum CK, Sim EK, Goh PM et al. Diagnostic laparoscopy: reducing the number of normal appendicectomies. Dis Colon Rectum. 1993;36(8):763-6.6. Hahn HB, Hoepner FU, Kalle T et al. Sonography of acute appendicitis in children: 7 years experience Pediatr Radiology, 1998;28:147-151.7. Ooms HW, Koumans RK, Ho-Kang-You PJ, Puylaert JB. Ultrasonography in the diagnosis of acute appendicitis. Br J Surg 1991;78(3):315-8.8. Heller MB, Skolnick ML. Ultrasound documentation of spontaneously resolving appendicitis. Am J Emerg Med 1993;11(1):51-3.
diagnóstico (P, con un tiempo hasta la cirugía terapéutica de 7.2 horas comparada con 10 horas en los controles (p=0.016). Sin embargo, no hubo diferencias significativas entre los grupos en ningún otro resultado primario. La proporción de pacientes con un resultado desfavorable fue casi idéntica: 17/142 en el grupo control (15 CNT, 2 TTCP) y 19/160 en el grupo PD (14 CNT, 5 TTCP). No hubo diferencias significativas entre los grupos en la duración media de internación (54.5 horas en el grupo control, 53.4 horas en el grupo PD, p=0,84). Las conclusiones fueron las mismas en todos los subgrupos del análisis, incluyendo el análisis por sexo y por edad.Los pacientes del grupo PD en quienes no se realizó GCUS (porque tenían un puntaje de Alvarado de 9 o 10 y los cirujanos eligieron intervenirlos quirúrgicamente sobre la base de la clínica) no tuvieron probabilidades más bajas de tener un resultado adverso (CNT o TTCP) ni más altas de una cirugía temprana que los pacientes en los que se realizó GCUS. Esto parece confirmar que la GCUS tiene poco que ofrecer al paciente con los signos y síntomas clásicos de apendicitis. El puntaje de Avarado provee una descripción objetiva de este grupo con «altas probabilidades»: son los que tienen puntaje 9 o 10. En realidad, existe alguna evidencia de este estudio, y de un trabajo posterior en nuestra institución, acerca de que aquellos pacientes con puntajes de 10, 9 u 8 deben ser considerados de alto riesgo y que todos los casos de TTCP ocurren en esta franja.Asimismo, nuestro estudio no pudo demostrar ningún beneficio significativo con el uso de GCUS, aun en los casos de puntajes más bajos. Esto parece confuso al principio, especialmente porque todos los 54 pacientes que fueron intervenidos quirúrgicamente luego de una GCUS positiva tuvieron verdaderamente apendicitis. Si no hubo falsos positivos, ¿por qué no existió una reducción importante en la tasa de cirugía no terapéutica como resultadoEl problema de las pruebas falsas negativas La pregunta es fácil de responder considerando a los pacientes que tuvieron una GCUS negativa. Una proporción de estos pacientes no va a mejorar en las próximas horas o días. La mayoría no va a tener apendicitis pero algunos sí: sabemos que GCUS produce falsos negativos. Más aún, muchos de esos falsos negativos que se han visto en nuestro estudio y en otros ocurren en pacientes con apendicitis perforadas (2, 6). Sin tratamiento, estos pacientes podrían morir. Por lo tanto el cirujano debe operar a algunos pacientes con dolor persistente y dolor a la palpación superficial, independientemente de los resultados del GCUS. No es de extrañar que el cirujano carezca de una manera de distinguir una prueba falsa negativa de una negativa verdadera, y que en el afán de evitar algunas muertes realice un número mayor de CNT.Debe destacarse que este dilema clínico permanecerá en la medida en que no se encuentre efectivamente una prueba con sensibilidad del 100%. Mientras sigan existiendo falsos negativos y mientras sigamos lidiando con una patología potencialmente fatal, va a haber dudas acerca de si puede confiarse en una prueba diagnóstica negativa. Una vez que esta falta de certeza se incorpora, ya no sería posible obtener el beneficio completo de muchas pruebas negativas verdaderas.El «problema» de las pruebas verdaderas positivas Ya ha sido señalado en la discusión general que algunos pacientes pueden ser manejados sin tratamiento, aunque creamos que padecen verdaderamente la enfermedad. Hay cada vez más evidencias, irónicamente de estudios de GCUS (7,8), de que los pacientes se recuperan de la apendicitis. Nuestro estudio sugirió (pero no demostró) que la CGUS lleva a un aumento en el número de cirugías. Puede ser que algunos pacientes que tienen una prueba positiva se beneficien con una cirugía terapéutica, pero no estrictamente necesaria, ya que se recuperarían después de una noche de observación. Cuánta es la morbilidad de dichas cirugías innecesarias, comparadas con futuros ataques recurrentes de apendicitis, es por supuesto un punto difícil de determinar.Futuro del diagnóstico de apendicitis No creemos que nuestro estudio vaya a ser la última palabra en GCUS, pero sí creemos que no deben empeñarse esfuerzos en futuros estudios no controlados. Lo mismo se aplicaría a otras modalidades diagnósticas promisorias. La TC se presenta como una opción de alta sensibilidad, ciertamente menor del 100%, cuando todos los trabajos publicados se tienen en cuenta en forma conjunta. Por otro lado, es de algún modo un estudio invasivo ya que requiere contraste oral y rectal para conseguir las tasas más altas de precisión publicadas. Ningún estudio aleatorizado ha sido publicado todavía aunque hemos recibido algunas comunicaciones contemplando un estudio planeado. La laparoscopia, como ya ha sido mencionado, es aún más invasiva. Se ha realizado un estudio aleatorizado entre laparotomía versus laparoscopia (4), pero no contamos con una comparación entre laparoscopia versus diagnóstico clínico.Resumen Existen razones fundamentales para sospechar de que una prueba más precisa signifique mejor tratamiento. Una prueba diagnóstica merece ser realizada si mejora los resultados clínicos. Como cualquier otra forma de intervención, las pruebas diagnósticas pueden y deben ser evaluadas en trabajos controlados aleatorizados.References 1. Rao PM, Boland GWL. Imaging of acute right lower abdominal quadrant pain. Clin Radiol 1998;53:639-649.2. Douglas CD, Macpherson NE, Davidson PM, Gani JS. Randomised controlled trial of ultrasonography in the diagnosis of acute appendicitis, incorporating the Alvarado score. BMJ,2000;321:919-922.3. Jones PF. Active observation in the management of acute abdominal pain in childhood. Br Med J 1976;ii:551-3.4. Olsen JB, Myren CJ, Haahr PE. Randomized study of the value of laparoscopy before appendicectomy. Br J Surg 1993;80:822-923.5. Kum CK, Sim EK, Goh PM et al. Diagnostic laparoscopy: reducing the number of normal appendicectomies. Dis Colon Rectum. 1993;36(8):763-6.6. Hahn HB, Hoepner FU, Kalle T et al. Sonography of acute appendicitis in children: 7 years experience Pediatr Radiology, 1998;28:147-151.7. Ooms HW, Koumans RK, Ho-Kang-You PJ, Puylaert JB. Ultrasonography in the diagnosis of acute appendicitis. Br J Surg 1991;78(3):315-8.8. Heller MB, Skolnick ML. Ultrasound documentation of spontaneously resolving appendicitis. Am J Emerg Med 1993;11(1):51-3.