Resumen
Propósito: Evaluar un nuevo sistema de clasificación de cataratas nucleares que pretende ser un sistema de guía quirúrgica para predecir la dureza del cristalino antes de la cirugía de cataratas. Métodos: El nuevo sistema de gradación BCN 10 consiste en imágenes frontales y transversales con lámpara de hendidura de lentes de ojos humanos, que van desde un núcleo de lente completamente transparente hasta una catarata nuclear totalmente negra. La validación se realizó con 9 observadores para 110 casos. Se aplicaron dos modalidades y se pidió a los observadores que utilizaran sólo dígitos enteros y luego medio dígito para la clasificación. Resultados: La repetibilidad con respecto a las diferencias test-retest mostró un límite medio de concordancia de 1,70 para dígitos enteros y 1,32 para dígitos medios. La diferencia absoluta entre la prueba y la repetición de la prueba fue cercana a cero para grados bajos y altos de cataratas. La confiabilidad para todo el grupo de 9 observadores produjo un coeficiente de correlación intraclase que estuvo dentro del mismo intervalo de confianza, es decir, 0,991-0.995, para dígitos enteros y medios dígitos. Conclusiones: La repetibilidad de la escala BCN 10 no se vio afectada por la gravedad de la catarata. Mostró muy buena repetibilidad. La repetibilidad fue significativamente mayor cuando los observadores usaron medios dígitos en comparación con dígitos enteros. También se encontró que la confiabilidad era muy buena, independientemente del uso de dígitos enteros o medios.
© 2017 El (los) Autor (es) Publicado (s) por S. Karger AG, Basel
Introducción
El desarrollo de estándares fotográficos para la clasificación de cataratas ha facilitado la evaluación de opacidades y coloración en el cristalino. Sin embargo, en la aplicación clínica, siempre habrá algún grado de subjetividad porque dependerá del juicio del examinador.
Estos sistemas de calificación fueron diseñados para ser fáciles de aprender y aplicar y para ser reproducibles. Se han propuesto diferentes sistemas de clasificación de cataratas, con diferentes niveles de complejidad dependiendo de las aplicaciones para las que se diseñaron (es decir, diagnóstico, estudios epidemiológicos, análisis de factores de riesgo, estudios de posibles medicamentos anticatarácticos y evaluación prequirúrgica).
Una escala de calificaciones se puede definir como una herramienta que permite cuantificar la gravedad de una afección con referencia a un conjunto de descripciones o ilustraciones estandarizadas . En la actualidad, en lugar de aplicar términos descriptivos o cualitativos, como incipiente, leve, grave o maduro, para indicar una etapa de desarrollo de cataratas, a menudo se utilizan sistemas numéricos de escala o clasificación. El médico hace una observación y asigna un valor numérico, y este número sirve como referencia en base a la cual se puede juzgar cualquier cambio futuro.
La desventaja de usar una escala de calificaciones es que tenemos que dividir el proceso continuo de desarrollo de cataratas en grupos discretos. Esto podría llevar a una escala que puede ser demasiado gruesa. Cuando una escala es demasiado gruesa, la tendencia de concordancia es mayor, pero la sensibilidad es menor. El uso de una escala más fina puede mejorar sustancialmente la capacidad del médico o investigador para detectar cambios pequeños . Por otro lado, algunos estudios han observado que, incluso cuando la escala permite incrementos de 0,1, existe una tendencia de los observadores a clasificar principalmente los cambios utilizando incrementos de 1 o 0,5 .
El sistema Oxford es un ejemplo de un sistema de clasificación complejo en el que es necesario analizar un gran número de características de cataratas; esto incluye la proyección de un objetivo de resolución con un oftalmoscopio y una evaluación con lámpara de hendidura para capas corticales y nucleares, que incluye diferentes morfologías de cataratas como vacuolas, puntos retro, puntos focales, brunescencia nuclear y dispersión nuclear blanca. Es una clasificación muy detallada y compleja, pero es difícil de aplicar clínicamente. Otros sistemas propuestos, más simples en términos de diseño, implementación y reproducibilidad, han sido diseñados principalmente para estudios epidemiológicos. Un ejemplo es el Sistema Cooperativo Japonés de Grupos de Estudio de Epidemiología de Cataratas . También se basa en imágenes estandarizadas y fue diseñado para ser simple y fácil de usar, sacrificando la precisión y la capacidad de detectar pequeñas variaciones. Otro ejemplo es el Sistema Simplificado de Clasificación de Cataratas de la OMS, una iniciativa de la Organización Mundial de la Salud. Su propósito era unificar y simplificar los criterios utilizados en varias otras clasificaciones. El sistema más utilizado hoy en día es el Sistema de Clasificación de Opacidades de Lentes III (LOCS III) , que es un gráfico que consta de 6 imágenes de lámpara de hendidura para clasificar el color nuclear y la opalescencia nuclear, 5 imágenes de retroiluminación para clasificar las cataratas corticales y 5 imágenes de retroiluminación para clasificar las cataratas subcapsulares posteriores.
Nuestro sistema de clasificación propuesto BCN 10 está concebido como un sistema de guía clínica y quirúrgica. Se centra principalmente en el núcleo, ya que es el componente más crítico para predecir las necesidades quirúrgicas y elegir la técnica quirúrgica más adecuada de acuerdo con la dureza del núcleo. Se ha hecho especial hincapié en las etapas más avanzadas de las cataratas, que son precisamente las que son más difíciles de operar. En este sentido, el LOCS III tiene ciertas limitaciones debido al hecho de que no incluye los grados más avanzados de cataratas.
En el presente estudio, validamos nuestro sistema de gradación de cataratas nucleares BCN 10.
Métodos
El Sistema de Clasificación Nuclear BCN 10
El sistema de clasificación BCN 10 se presenta como una carta laminada de tamaño A4 con fotografías de alta resolución. Estas fotografías fueron tomadas por el personal de fotografía utilizando una lámpara de hendidura Zeiss (Carl Zeiss AG; Oberkochen, Alemania) con los siguientes ajustes: ancho de haz, 10 mm; altura para una vista frontal, 10 mm; y altura y anchura a 45° para una vista transversal, 10 y 1 mm, respectivamente.
El sistema divide la progresión de la catarata nuclear en un cristalino transparente de referencia (N0) y 10 grados de opacificación (N1 a N10). Este grado de opacidad es nuestra unidad de escala de calificación. El gráfico del sistema de clasificación muestra una imagen de sección transversal con lámpara de hendidura grande, una imagen de vista frontal más pequeña y el color relativo para cada etapa del desarrollo de cataratas (Fig. 1). Los grados se eligieron en intervalos equidistantes de un cristalino envejecido normal (N1) a un cristalino completamente oscuro (cataracta nigra – N10).
Fig. 1
Gráfico del sistema de gradación nuclear BCN 10 que muestra una imagen de sección transversal con lámpara de hendidura, una imagen de vista frontal más pequeña y el color relativo para cada etapa del desarrollo de cataratas (N0 a N10).
Proceso de Validación
La base para el proceso de validación fue estandarizado fotografías de 110 pacientes programados para cirugía de cataratas en el Centro de Oftalmología Barraquer. Los pacientes fueron seleccionados para cubrir todos los grados de catarata por igual. Esto incluyó una vista frontal del ojo y una vista transversal, ambas con pupilas dilatadas, tomadas en la lámpara de hendidura por el personal de fotografía de la clínica. Las fotografías se presentaron al azar en una pantalla de computadora y tuvieron que compararse con la carta BCN 10 en el lateral.
Los observadores del proceso de validación fueron 3 cirujanos oftalmológicos y 6 residentes en oftalmología (al final de su formación). El proceso de validación se realizó para 2 modalidades diferentes, primero permitiendo el uso de incrementos de solo 1 grado (dígitos completos), lo que produce 11 pasos de calificación, y aproximadamente 6 meses después permitiendo incrementos de 0,5 grados (medio dígito), lo que produce un total de 21 pasos de calificación.
La calificación para ambas modalidades se realizó dos veces con un intervalo de aproximadamente 3 semanas para evaluar la repetibilidad de los resultados de la calificación. Repetibilidad, o acuerdo intraobservador, significa la capacidad del evaluador de dar resultados similares para una prueba repetida (prueba-re-prueba) en las mismas condiciones. También evaluamos la fiabilidad o precisión del sistema de clasificación, que es la precisión de todos los observadores en dar el mismo valor al mismo objeto de evaluación. La fiabilidad puede denominarse acuerdo interobservador .
Análisis estadístico
Consideramos que nuestra unidad de escala de calificaciones (grado de opacidad) son datos continuos y cuantitativos. Las calificaciones de la tabla BCN 10 se han elegido en intervalos equidistantes y se evalúan con 11 o 21 pasos de calificación.
Se utilizó el enfoque Bland-Altman para evaluar la repetibilidad. Aplica un diagrama que muestra la diferencia o discrepancia entre 2 observaciones repetidas trazadas contra la media de ambas observaciones. La desviación estándar de todas las diferencias multiplicada por 1,96 da los llamados límites de concordancia o coeficiente de repetibilidad . Los valores de los límites de concordancia están en unidades de escala de calificaciones (grados de opacidad). Cuanto menor sea el valor del límite de acuerdo, mejor será la repetibilidad.
Se aplicó el coeficiente de correlación intraclase (CCI) para evaluar la repetibilidad y la fiabilidad. La estimación del CCI se basa en técnicas de análisis de varianza. Puede muy entre 0 y 1. El valor máximo es 1 cuando todos los observadores asignan la misma calificación. Debe ser superior a 0,7 para que el sistema de clasificación se considere fiable .
Calculamos el ICC utilizando SPSS versión 13.0 (SPSS Inc., Chicago, IL, EE. UU.) elegir la opción de análisis de Confiabilidad estadística con el modelo Alfa. Con base en el hecho de que teníamos un grupo de muestra de observadores y casos, utilizamos el modelo Aleatorio Bidireccional y seleccionamos concordancia absoluta. Los resultados de las Medidas Individuales se utilizaron para evaluar la repetibilidad, y las Medidas Promedio se utilizaron para la confiabilidad.
El nivel de significancia y los coeficientes de confianza se establecieron en 0,05 y 0,95, respectivamente.
Resultados
Se evaluó la repetibilidad de las respuestas test-retest de los 9 observadores para los 110 casos de ambas modalidades, es decir, dígitos enteros y medios dígitos. La discrepancia media entre las dos pruebas repetidas fue cercana a cero para todos los observadores, oscilando entre -0,308 y +0,514 para dígitos enteros y entre -0,311 y +0,261 para dígitos medios. Los límites de concordancia variaron de 1,09 a 2,78 para dígitos enteros y de 0,94 a 1,70 para dígitos medios (Fig. 2a, b). Una prueba de t pareada reveló que el límite medio de concordancia utilizando dígitos enteros (es decir, 1,70) fue significativamente mayor en comparación con el valor utilizando medios dígitos (es decir, 1,32), con p = 0,008.
Fig. 2
a, b Diferencia (discrepancia) media de la prueba y la repetición de la prueba con los límites de concordancia correspondientes para todos los observadores individuales que califican 110 casos, aplicando 2 modalidades: uso de solo dígitos enteros (a) o medios dígitos (b) para la calificación. La línea discontinua indica cero discrepancia. El asterisco indica una diferencia significativa de los límites medios de concordancia comparando el uso de dígitos enteros y medios. gráficos de c, d Bland-Altman para todas las discrepancias de prueba y retest de los 9 observadores agrupados para dígitos enteros (c) y medios dígitos (d). Las líneas horizontales indican la discrepancia media global y los respectivos límites de acuerdo calculados para todos los observadores juntos.
También agrupamos las 990 observaciones repetidas de nuestros 9 observadores en una gráfica de Bland-Altmann (Fig. 2c, d). La Figura 2 muestra que todos los grados de opacificación de N0 a N10 estaban presentes de manera equilibrada. La discrepancia entre los valores de la prueba y la repetición de la prueba fue cercana a cero para grados bajos y altos de cataratas. La discrepancia media combinada fue de -0,033 y -0,062 y el límite combinado de concordancia fue de 1,81 y 1,38 para dígitos enteros y medios, respectivamente (Fig. 2c, d).
El ICC para la repetibilidad del observador fue menor para dígitos enteros (media 0,951, rango 0,880-0,981) en comparación con medio dígito (media 0,971, rango 0,955-0,982). Esta diferencia fue estadísticamente significativa (p = 0,043; Tabla 1).
Tabla 1
ICC para cada observador (repetibilidad) y para todo el grupo (fiabilidad) utilizando dígitos enteros y medios para el sistema de clasificación de cataratas nucleares BCN 10
El ICC para la fiabilidad, considerando los 9 observadores juntos, fue muy alta (0,993 y 0,994), pero no fue diferente para dígitos enteros y medios, como muestra el intervalo de confianza del CCI, que se situó entre 0,991 y 0,995 para ambas modalidades de clasificación (Tabla 1).
Discusión
El sistema de gradación BCN 10 fue diseñado para ser utilizado en la lámpara de hendidura con el paciente delante. Sin embargo, para el proceso de validación no fue práctico que los 9 observadores tuvieran personalmente a los mismos 110 pacientes frente a una lámpara de hendidura. Por lo tanto, la validación se realizó con la ayuda de fotografías estandarizadas en el mismo tipo de pantalla de computadora. Esto podría haber introducido alguna variación adicional con respecto a tener al paciente delante de la lámpara de hendidura.
Hay un debate continuo sobre qué prueba métrica y estadística usar para la cuantificación y comparación de repetibilidad y confiabilidad. El enfoque Bland-Altman es sencillo y se centra en la diferencia entre las observaciones. El ICC se centra, como su nombre lo indica, en las correlaciones. Cuantifica muy bien la correlación entre los observadores, pero es insensible a los errores sistemáticos. Utilizamos ambos enfoques en nuestro análisis de validación.
El sistema de gradación BCN 10 para cataratas nucleares arrojó muy buena repetibilidad en términos de correlación, con un ICC medio de 0.951 para dígitos enteros y 0,971 para dígitos medios. Se considera que un sistema de calificación da excelentes resultados cuando el ICC es superior a 0,75 .
En términos absolutos, nuestro sistema dio una confianza de repetibilidad, o límite de concordancia, de 1,70 unidades de escala de calificaciones para dígitos enteros y 1,32 para dígitos medios. Esto se compara con las unidades de escala de graduación 2.0 reportadas para el LOCS II (dígitos enteros) y 0.7 para el LOCS III (dígitos decimales) para el color nuclear y la opalescencia . Hay que tener en cuenta que el LOCS utiliza una escala de 0 a 6 y en el LOCS III el observador ve imágenes de 5 grados de opacidad (falta una imagen de lente transparente) y se le pide que gradúe la catarata con incrementos de 0,1 (interpolando entre las imágenes que representan dígitos enteros). Se sabe que estos pequeños incrementos de 0,1 proporcionan límites de acuerdo más estrechos . Por otro lado, algunos estudios han observado que, incluso cuando la escala permite incrementos de 0,1, existe una tendencia para el evaluador a clasificar principalmente los cambios utilizando incrementos de 1 o 0,5 . Es por eso que pedimos a los observadores de nuestra segunda modalidad que usaran medios dígitos. Creemos que esto resultó en un compromiso razonable entre la aplicación práctica y los límites de concordancia relativamente bajos de 1,32 unidades de escala de calificación, considerando nuestra escala de 0 a 10.
Los dispositivos ópticos automatizados como Pentacam (Oculus GmbH, Wetzlar-Dutenhofen, Alemania) o el Sistema de Análisis de Calidad Óptica (Visiometrics SL, Tarrasa, España) luchan por dar resultados precisos en casos de cataratas graves (por ejemplo, BCN 10 grados por encima de 6). Estos dispositivos objetivos se basan en la transmisión de luz a través del cristalino. Los sistemas Scheimpflug analizan el aumento de la retrodispersión a medida que progresan las cataratas; sin embargo, las cataratas avanzadas presentan menos retrodispersión porque se absorbe la luz. Los sistemas de doble paso tienen que pasar la luz de medición a través de la lente dos veces. En lentes muy opacas, esto no funcionará correctamente. En particular, hasta donde sabemos, estos dispositivos ópticos automatizados solo se han probado en casos de cataratas leves a moderadas (hasta LOCS III grado 4) .
Nuestro sistema podría ser especialmente útil en los países en desarrollo debido a su falta de acceso a estos dispositivos de prueba objetivos. Estos países también tienen una prevalencia de cataratas de grado superior, que otros sistemas de clasificación basados en imágenes no tienen en cuenta .
La repetibilidad de la gradación para BCN 10 no se vio afectada por la gravedad de la catarata, ya que encontramos que las diferencias absolutas entre test y retest eran cercanas a cero para grados bajos y altos de cataratas (Fig. 2a, b).
La confiabilidad del BCN 10 para todo el grupo de 9 observadores dio un CIC que se encontraba dentro del mismo intervalo de confianza, es decir, 0,991-0,995, para dígitos enteros y medios dígitos. Esto representa una excelente fiabilidad y el hecho de que sea el mismo para ambas modalidades da al usuario la opción de aplicar dígitos enteros o de medio dígito, aunque recomendaríamos dígitos de medio dígito debido a la mejor repetibilidad.
Declaración de divulgación
Los autores no tienen intereses de propiedad en los materiales descritos en este artículo y no tienen conflictos de intereses que declarar.
- Efron N, Morgan PB, Katsara SS: Validación de escalas de clasificación para complicaciones de lentes de contacto. Ophthalmic Physiol Opt 2001; 21: 17-29.
- Bullimore MA, Bailey IL: Consideraciones en la evaluación subjetiva de la catarata. Optom Vis Sci 1993; 70: 880-885.
- Bailey IL, Bullimore MA, Raasch TW, Taylor HR: Clasificación clínica y efectos de la escala. Invest Ophthalmol Vis Sci 1991; 32: 422-432.
- Sparrow JM, Bron AJ, Brown NA, Ayliffe W, Hill AR: The Oxford Clinical Cataract Classification and Grading System (en inglés). Int Ophthalmol 1986; 9: 207-225.
- Sasaki K, Shibata T, Obazawa H, Fujiwara T, Kogure F, Obara Y, Itoi M, Katou K, Akiyama K, Okuyama S: Sistema de clasificación de cataratas: aplicación del Grupo de Estudio Cooperativo Japonés de Epidemiología de Cataratas. Ophthalmic Res 1990; 22 (suppl 1): 46-50.
- Thylefors B, Chylack LT Jr, Konyama K, Sasaki K, Sperduto R, Taylor HR, West S: Un sistema simplificado de clasificación de cataratas. Ophthalmic Epidemiol 2002; 9: 83-95.
- Chylack LT Jr, Wolfe JK, Singer DM, Leske MC, Bullimore MA, Bailey IL, Friend J, McCarthy D, Wu SY: The Lens Opacities Classification System III. The Longitudinal Study of Cataract Study Group (en inglés). Arch Ophthalmol 1993; 111: 831-836.
- Wong AL, Leung CK, Weinreb RN, Cheng AK, Cheung CY, Lam PT, Pang CP, Lam DS: Evaluación cuantitativa de las opacidades del cristalino con tomografía de coherencia óptica del segmento anterior. Br J Ophthalmol 2009; 93: 61-65.
- Chong E, Simpson T, Fonn D: La repetibilidad de escalas de gradación de segmentos anteriores discretos y continuos. Optom Vis Sci 2000; 77: 244-251.
- Bland JM, Altman DG: Métodos estadísticos para evaluar la concordancia entre dos métodos de medición clínica. Lancet 1986; 1:307-310.
- Koch GG: Coeficiente de correlación intraclase; en Kotz S, Johnson NL (eds): Enciclopedia de Ciencias Estadísticas 4. Nueva York, Wiley, 1982, pp 213-217.
- Zaki R, Bulgiba A, Nordin N, Azina IN: A systematic review of statistical methods used to test for reliability of medical instruments measuring continuous variables. Iran J Basic Med Sci 2013;16: 803-807.
- Pan AP, Wang QM, Huang F, Huang JH, Bao FJ, Yu AY: Correlación entre la clasificación del Sistema de Clasificación de Opacidades del Cristalino III, el Índice de Función Visual-14, la estadificación del núcleo Pentacam y el índice de dispersión objetivo para la evaluación de cataratas. Am J Ophthalmol 2015; 159: 241-247.
- Cochener B, Patel SR, Galliot F: Análisis correlacional de medidas objetivas y subjetivas de cuantificación de cataratas. J Refract Surg 2016; 32: 104-109.
- Artal P, Benito A, Perez GM, Alcon E, De Casa A, Pujol J, Marin JM: Un índice de dispersión objetivo basado en imágenes retinianas de doble paso de una fuente puntual para clasificar cataratas. PLoS One 2011; 6: e16823. Lam D, Rao SK, Ratra V, Liu Y, Mitchell P, King J, Tassignon MJ, Jonas J, Pang CP, Chang DF: Cataract. Nat Rev Dis Primers 2015; 1: 15014.
Contactos de autor
Ralph Michael
Institut Universitari Barraquer
Laforja 88
ES-08021 Barcelona (España)
E-Mail [email protected]
Detalles del artículo / Publicación
Recibido: 03 de noviembre de 2016
Aceptado: 18 de enero de 2017
Publicado en línea: 14 de marzo de 2017
Fecha de publicación del número: abril de 2017
Número de Páginas impresas: 5
Número de figuras: 2
Número de tablas: 1
ISSN: 0030-3747 (Impreso)
eISSN: 1423-0259 (En línea)
Para información adicional: https://www.karger.com/ORE
Licencia de acceso abierto / Dosis de medicamentos / Descargo de responsabilidad
Este artículo está licenciado bajo la Licencia Internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0 (CC BY-NC-ND). El uso y distribución con fines comerciales, así como cualquier distribución de material modificado, requiere permiso por escrito. Dosificación de medicamentos: Los autores y el editor han hecho todo lo posible para garantizar que la selección de medicamentos y la dosificación establecidas en este texto estén de acuerdo con las recomendaciones y prácticas actuales en el momento de la publicación. Sin embargo, en vista de la investigación en curso, los cambios en las regulaciones gubernamentales y el flujo constante de información relacionada con la terapia farmacológica y las reacciones a los medicamentos, se insta al lector a que revise el prospecto de cada medicamento para ver si hay cambios en las indicaciones y dosis y advertencias y precauciones adicionales. Esto es particularmente importante cuando el agente recomendado es un medicamento nuevo y/o de uso poco frecuente. Descargo de responsabilidad: Las declaraciones, opiniones y datos contenidos en esta publicación son únicamente de los autores y colaboradores individuales y no de los editores y el editor(es). La aparición de anuncios y / o referencias de productos en la publicación no constituye una garantía, respaldo o aprobación de los productos o servicios anunciados o de su efectividad, calidad o seguridad. El editor y el editor(es) declinan la responsabilidad por cualquier daño a personas o bienes que resulte de cualquier idea, método, instrucciones o productos mencionados en el contenido o los anuncios.