El concepto de calidad de vida ha venido cobrando importancia ya que la mayor sobrevida de la población ha mejorado a expensas de un mayor úmero de personas con algún grado de discapacidad, y de personas con nfermedadesrónicas que padecen los efectos de su enfermedad y del mismo tratamiento. Debido a que la calidad de vida se basa en mediciones blandas con una carga variable de subjetividad, se requiere de métodos de evaluación válidos, reproducibles y confiables. El mejor conocimiento de las evaluaciones para medir calidad de vida permitirá incorporar estos instrumentos en la evaluación integral de individuos, en la conducción de ensayos clínicos y en la investigación de servicios de salud.
Existen múltiples instrumentos que se han diseñado para evaluar las dimensiones que integran las mediciones de salud y de calidad de vida. Se deben considerar algunos conceptos básicos al evaluar calidad de vida ya que, siendo un concepto multidimensional, es difícil decidir qué variables deben incluirse y ello depende de la finalidad del estudio. Los instrumentos para medir la calidad de vida se han diseñado con diversos propósitos. Para conocer y comparar el estado de salud entre poblaciones (aspecto fundamental para estrategias y rogramas en políticas de salud), y para evaluar el impacto de ciertas intervenciones erapéuticas para modificar los síntomas y función física a través del tiempo. La calidad de vida es un fenómeno que se afecta tanto por la enfermedad como por el tratamiento (por sus efectos adversos). Los instrumentos para medir calidad de vida deben verse como herramientas adicionales del clínico en la evaluación integral del paciente y en la onducción de ensayos clínicos.1
El objetivo del presente trabajo es hacer una revisión de los aspectos metodológicos en los que se basa la evaluación de la calidad de vida, así como de proporcionar un inventario de los instrumentos genéricos y específicos disponibles para evaluarla.
Evaluación de instrumentos
Los lineamientos que sirven de referencia para el diseño de un instrumento han sido revisados cuidadosamente por Bombardier y Tugwell.2
Objetivo. Se debe evaluar claramente el objetivo del instrumento: ¿qué enfermedad se va estudiar?, y ¿en qué población se va aplicar? Aunque es muy atractivo elaborar un instrumento nuevo, es importante recordar que la elaboración y validación consumen mucho tiempo y no se tiene la certeza de que será útil. Es por ello que se recomienda usar instrumentos ya existentes; muchos de ellos son adecuados y pueden aplicarse a los propósitos del estudio. No existe el instrumento perfecto, por lo cual debe buscarse su función y aplicación dependiendo del tipo de padecimiento, y población de enfermos.
Función. Hay que definir el instrumento en función de su capacidad de discriminación, escripción y predicción de la calidad de vida. La discriminación es la propiedad que sirve para establecer diferencias entre padecimientos o entre enfermos con una misma enfermedad, y que permite estratificar poblaciones. Idealmente, el instrumento será capaz de describir la evolución del padecimiento y detectar cambios en la calidad de vida a través del tiempo. El instrumento también tendrá la capacidad de predecir el tipo de discapacidad futura y un desenlace poco afortunado. Esta función es útil para decidir la intensidad de tratamiento.
Selección de preguntas. Se asume que los cuestionarios son la forma habitual para medir calidad de vida. Se puede recurrir a un consenso de expertos en el tema, investigadores y pacientes para definir las preguntas relevantes. Una forma de analizar la utilidad de los cuestionarios es empleando técnicas estadísticas. El análisis factorial y de componentes principales es de utilidad para reducir y caracterizar las dimensiones que se están midiendo. Puesto que muchas preguntas en un cuestionario pueden estar correlacionadas y tener equivalencias, el primer paso sería eliminar colinariedad, redundancia y obtener una combinación que, con el mínimo número de variables, mida la misma dimensión. El análisis factorial es un método multivariable, que se emplea para explicar las relaciones entre un número importante de variables correlacionadas e identificar unos cuantos factores independientes, que conceptualmente sean significativos.2
Contenido. Deben incluirse dimensiones importantes como el autocuidado, la actividad física, la comunicación, la interacción social, el descanso, las actividades recreativas y las repercusiones emocionales.
Formas de respuesta formas, tomándose en cuenta que si se suman las calificaciones de las preguntas relacionadas con la actividad física se puede obtener una evaluación representativa de dicha área.
Sentido biológico El instrumento debe comportarse deacuerdo con teorías que se vinculen con la calidad de vida. En la medida en que los instrumentos cumplan con las predicciones clínicas lograrán mayor credibilidad. Estas mediciones representan un complemento para el cuidado integral del paciente.
Factibilidad Este es un aspecto trascendente; estos instrumentos tienen que ser adecuados para las diferentes culturas en las cuales se aplican. tienen que ser adecuados para las diferentes culturas en las cuales se aplican. Se debe buscar que las preguntas se entiendan y se acepten para poderse contestar. Debe recalcarse que el tiempo que consume su aplicación puede limitarla en la práctica clínica.3,4
Validez y consistencia
Es la aproximación que se hace al valor real o “verdadero” de la característica que se quiere medir; más sencillamente, ”medir lo que realmente se quiere medir”. Una característica que debe tener una medición es la consistencia; los datos obtenidos tendrán calidad científica, si durante el proceso de medición pueden ser consistentemente repetibles por el mismo observador u otros.5 La medición será científicamente aceptada cuando tenga consistencia y pueda ser reproducible. Feinstein 6 recomienda usar el término consistencia en el desarrollo de un índice de medición del estado de salud del individuo. Si se tiene consistencia en una medición, la exactitud se podrá obtener estableciendo un estándar de referencia. Este último se obtendrá mediante la utilización de un procedimiento que produzca mediciones objetivas, dimensiones de una entidad, o puede ser la opinión de consenso de un grupo de expertos. Las mediciones de la consistencia, conocidas como duras u objetivas, tienen varias características: a) exactitud, es el procedimiento para obtener una medición que se acerque lo mejor posible a la medición ”real” y comparable con un índice o una medición previamente estandarizada; b) objetividad, se refiere al hecho de que una medición esté libre de juicios humanos; c) dimensionalidad, implica que una medición debe estar referida en escalas estandarizadas de valores numéricos; d) preservabilidad, se refiere a que la medición puede ser reexaminada posteriormente. Los problemas metodológicos que enfrenta la medición de calidad de vida son dos; primero, que se trata de medidas consideradas “blandas”, y segundo, que no hay un valor de referencia o estándar de oro contra el cual se pueda comparar 3,5,7
Validez. Esta se realiza para demostrar la utilidad clínica de un cuestionario, de tal forma que los datos obtenidos sean confiables. Para que una medición se considere con validez debe constar con tres características: a) consistencia, se refiere al hecho de conocer si el índice de medición tiene consistencia, la cual es un proceso intrínseco del proceso de validación de cualquier índice de medición; b) exactitud, se refiere al hecho de comparar el índice o la medición realizada con un índice previamente estandarizado; y c) adecuada, que el índice sea satisfactorio y adecuado para el fin que fue creado. Hay varias formas y conceptos de validez que se definen como sigue:
Validez aparente. Es una evaluación cualitativa, se conocen los componentes y el aspecto grueso del indice
Validez de contenido. Es una valoración cualitativa que se refiere a la evaluación integral que hace el índice del atributo clínico que desea medir
Validez de criterio. Este tipo de validez se lleva a cabo cuando se tiene un índice estandarizado o “estándar de oro”, contra el cual se compara un nuevo índice desarrollado; cuando se tiene índice estandarizado se calculan sensibilidad, especificidad y los valores predictivos positivos y negativos del nuevo índice
Validez de constructo. Aspecto que se evalúa con un juicio cualitativo; se observa si existe relación entre las variables tomadas por el índice y lo que éste quiere evaluar. Para validez de constructo se aplica el índice, se observan los resultados y se corrobora si evalúa lo que queremos conocer.3,5,7,8
Consistencia interna. Con el propósito de validar un instrumento se debe demostrar que es consistente o confiable. La consistencia de una escala de medición compuesta por preguntas múltiples debe ser demostrada, ya que no existe manera de compararla con una variable externa. La consistencia interna tiene dos componentes:
La consistencia de ejecución. Se refiere a la respuesta individual de las preguntas que tiene el índice desarrollado,o la repetición del índice por el mismo usuario. Mide la variabilidad del contenido de las preguntas de un índice y señala su consistencia. Se evalúa mediante la consistencia de la mitad de la prueba, si se obtiene la misma puntuación con la aplicación completa de la prueba y con la aplicación de la mitad de la prueba. En consistencia (Test-retest) se aplica el cuestionario y se repite para evaluar su correlación en diferentes tiempos.
Consistencia de homogeneidad. Evalúa la consistencia total de un índice (dominio); se refiere a la consistencia que se da en las relaciones que tienen las diferentes preguntas (ítems) utilizadas en la construcción de un índice general, con el que se desea conocer determinado atributo. Se utiliza cuando se evalúan variables subjetivas conocidas también como medidas blandas. Puede estar constituido por la suma de una serie de preguntas individuales.9 Para conocer qué tan consistentemente las preguntas que se han incluido miden lo que se quiere medir, se evalúan las interrelaciones de estas variables entre sí. Se refiere a la coherencia de las preguntas y a la interrelación de ellas en la medición de determinado atributo. Para evaluar la homogeneidad interna de una escala que contiene un grupo de preguntas llamada batería, se calcula el coeficiente “alfa de Cronbach”.10 El coeficiente de alfa evalúa la confiabilidad de una escala nominal. Si la presentación de las preguntas es binaria, deberá calcularse el coeficiente de correlación Kuder Richardson.5 Estos coeficientes representan un promedio ponderado de las interrelaciones que existen entre las preguntas de un índice, su valor se encontrará entre 0.1 y 1.0; se considera un buen índice cuando el valor del mismo es de 0.80 y excelente si es superior a 0.90.5
La consistencia externa. Se refiere a la variabilidad externa de la medición cuando se aplica en diferentes ocasiones por el mismo o por diferentes observadores. Es decir, si la medición es consistente al aplicarla externamente, y se obtienen los mismos resultados a pesar de que se realicen mediciones en más de una ocasión. Esta se alcanza cuando se mide un fenómeno o característica clínica mediante: a) observación del fenómeno; b) las observaciones se concentran en un grupo de datos, y c) los datos se convierten en una escala para medir el fenómeno. En la fase a y b deben incluirse especificaciones operacionales para convertir el grupo de datos observados en variables particulares, categorías y otros aspectos para la construcción de un índice de medición. A este proceso se le conoce como “elementos de criterio”. Para la evaluación de la consistencia externa pueden realizarse cálculos indirectos. indirectos de la misma, pudiendo utilizar coeficientes de concordancia y coeficientes de correlación.
Pueden utilizarse los coeficientes de correlación de Pearson, de Spearman o de Tau de Kendal. Estos evalúan tendencia y no concordancia, por lo que no controlan el sesgo sistemático si estuviera presente en los datos.11 Los coeficientes de concordancia toman en cuenta la concordancia que pudiera existir por el azar. Miden concordancia y no la tendencia. Cuando la variable se mide en escala binaria o nominal, y sólo son dos observaciones u observadores, se recomienda utilizar el coeficiente kappa no ponderado (K). Una vez que se tiene el valor de (K), éste se interpreta siguiendo los lineamientos de Landis y Koch.12 Cuando la variable se mide en escala ordinal, y son sólo dos observaciones u observadores, se recomienda utilizar el coeficiente kappa ponderado (Kp). Se acepta que un (Kp) es una concordancia aceptable cuando se tiene un valor entre 0.5 y 0.6. Para conocer la concordancia de dos o más observadores cuando la variable se mide en escala continua, se recomienda la utilización del coeficiente de correlación de intraclase. Este se basa en un análisis de varianza de la variabilidad de las mediciones, tanto de los observadores que miden como la de los residuales. Puede usarse la formula de Brako, la cual acepta como buen índice de concordancia un valor mínimo de 0.75.5,13
Los instrumentos para medir calidad de vida
Los instrumentos para medir calidad de vidase clasifican en instrumentos genéricos y específicos. Los primeros son útiles para comparar diferentes poblaciones y padecimientos, pero tienen el riesgo de ser poco sensibles a los cambios clínicos, por lo cual su finalidad es meramente descriptiva. Los instrumentos específicos se basan en las características especiales de un determinado padecimiento, sobre todo para evaluar cambios físicos y efectos del tratamiento a través del tiempo. Estos nos dan mayor capacidad de discriminación y predicción, y son particularmente útiles para ensayos clínicos.3 Con el propósito de tener un panorama de los instrumentos para medir calidad de vida y que podrían ser aplicados en diferentes edades y poblaciones, en los cuadros I y II, A y B se presenta un análisis de los instrumentos publicados que cuentan con información explícita de los instrumentos en relación con su objetivo, dimensiones y función. El objetivo de la publicación contempla la evaluación de suvalidez y confiabilidad. También se consideró su validación en otro idioma diferente al original y cuando el propósito del estudio era hacer descripción de la calidad de vida. En la columna de validación se incluyeron de validación se incluyeron cuatro tipos de validez: aparente, de contenido, de criterio y de constructo. En la columna de confiabilidad, se consignan cuando se evaluó la consistencia del instrumento con base en una prueba repetida (Test-retest), confiabilidad de la mitad de la muestra y a la consistencia interna. El contenido de los instrumentos se refiere a las dimensiones reportadas en la publicación; entre las más importantes se incluyen actividad física, movilidad, autocuidado, comunicación, interacción social, vitalidad y energía, dolor, actividades recreativas y escolares, así como problemas emocionales y mentales. Finalmente, se reporta la función del instrumento en relación con su capacidad de discriminación entre grupos de pacientes, su finalidad evaluativa, que sirve para detectar cambios a través del tiempo, y la capacidad predictiva del instrumento en relación con el desenlace futuro.
Traducción de los instrumentos
En cuestionarios de diferente idioma se debe hacer una traducción simple, en una primera etapa y, posteriormente, se traduce nuevamente al idioma original (back-translation) para que finalmente se evalúe el cuestionario en la versión traducida al idioma en que se requiere usar (pre-testing) Este proceso permite la aplicación de un cuestionario que sea confiable y comprensible, y que toma en cuenta los aspectos culturales.14 Generalmente la traducción se realiza en varias etapas: en la fase 1, se realiza por investigadores involucrados en el estudio la traducción del documento original en inglés al español; en la fase 2, la versión en español obtiene validez de consenso, validez aparente y validez de contenido, después de que cada uno de los ítems es sometido a revisión por profesionales con experiencia en la atención a pacientes con la enfermedad en estudio; en la fase 3, la versión en español se entrega a un traductor oficial, no relacionado con el equipo del trabajo, para obtener una nueva versión de español a inglés; en la fase 4, el documento original y la traducción hecha por un perito oficial (ambos en inglés), son sometidos a comparación para verificar que no existan discrepancias graves entre la versión original y la traducción.15
Experiencia en México
Existen algunas experiencias en México sobre la aplicación de estos instrumentos.
En 1991, en un tercer nivel de atención, con el fin de investigar el apego al tratamiento en pacientes con padecimientos crónicos de pronóstico fatal, se diseñó un cuestionario, útil y de fácil aplicación, para evaluar las tensiones y molestias que origina su enfermedad en su entorno familiar, escolar y social.16
En 1993, Cardiel y colaboradores validaron la versión en español del cuestionario: The health assessment questionnaire disability index (Spanish HAQ-DI). Se aplicó a 97 pacientes con diagnóstico de artritis reu-matoide, residentes en la Ciudad de México y su área metropolitana; el instrumento demostró ser sensible para detectar cambios así como su utilidad en poblaciones hispanohablantes; la validación y traducción es comparable con la versión original del HAQ-DI.17
La evaluación del impacto de la enfermedad y del tratamiento en la calidad de vida de los pacientes es sumamente importante, pero difícil de cuantificar objetivamente. En 1993, en un hospital de tercer nivel de atención se compararon dos índices clínicos de cambio en calidad de vida: el índice de cambio en función máxima de MacKenzie (ICFM) y de cambio de calidad de vida (ICCV) diseñados por el grupo que realizó el estudio; ambos índices se aplicaron a 23 pacientes con diagnósticos de enfermedad crónica, aguda y subaguda, al inicio y al final de la hospitalización. La reproducibilidad interobservador del ICCV fue mayor que la del ICFM. Ambos índices mostraron aceptable sensibilidad al cambio, así como correlación con la opinión del paciente, sus familiares y del médico tratante. Este estudio demostró que es factible obtener mediciones confiables de los cambios de calidad de vida y que ambos índices podrían usarse en ensayos clínicos.18
En 1994, Abello-Banfi y colaboradores validaron la versión en español del cuestionario: The arthritis impact measurement scales (Spanish-AIMS), se administró a 97 pacientes con diagnóstico de artritis reumatoide con residencia en la Ciudad de México y área metropolitana; los resultados fueron positivos y sólo queda fomentar su difusión y aplicación.19
En 1994 se compararon las condiciones clínicas y la calidad de vida en 25 pacientes diabéticos, con insuficiencia renal terminal, y en programa de diálisis peritoneal continua ambulatoria (DPCA) y diálisis peritoneal continua en hospitalización (DPI); el estudio mostró que la calidad de vida del paciente transferido a DPCA mejoró 52% respecto a sus condiciones previas en DPI.20
En 1995, en un estudio de 100 pacientes con diabetes tipo II no insulino dependientes, se determinó la relación entre el tiempo de evolución de la enfermedad, descontrol metabólico, enfermedades asociadas, complicaciones tardías y la calidad de vida en un primer nivel de atención. El impacto de las complicaciones es enorme; los pacientes presentaron moderada afección en su calidad de vida por la presencia de las complicaciones tardías, seguidas del descontrol metabólico, el tiempo de evolución y las enfermedades asociadas.21
En 1996 se validó el cuestionario COOP-Dartmouth para evaluar el estado funcional biopsicosocial en escolares y adolescentes con enfermedad crónica, encontrando que la calidad de vida se puede22
En 1996, en un tercer de nivel de atención, se determinó la validez de un instrumento como un indicador de calidad de vida para evaluar el estado funcional de pacientes pediátricos con leucemia. Se incluyeron menores de 2 a 16 años de edad. En forma global, 100% de los pacientes obtuvo calificación satisfactoria: el nivel de desempeño diario de actividades de los pacientes fue adecuado, el área escolar fue la más afectada, no se relacionó con la etapa de la enfermedad ni con la fase del tratamiento. El instrumento mostró buena consistencia e identificó adecuadamente el nivel de desempeño diario de los pacientes pediátricos con leucemia.23
En 1998, se evaluó el efecto de una intervención educativa sobre la calidad de vida en el paciente hipertenso; se evaluaron la intervención educativa y la repercusión del estilo de vida en el control de la enfermedad; el estudio mostró que la intervención educativa es efectiva para modificar la calidad de vida del paciente hipertenso.24
En 1999, se realizó otro estudio para evaluar la calidad de vida de pacientes con enfermedades crónicas (asma, diabetes mellitus tipo I, leucemia y VIH/ SIDA), mediante la aplicación de instrumentos genéricos y específicos. La encuesta específica mostró puntuación correspondiente a una buena calidad de vida en pacientes asmáticos y diabéticos; sin embargo, en las encuestas genéricas los pacientes con diabetes controlada obtuvieron mejor puntuación que los pacientes con diabetes mellitus tipo I descontrolada. Los pacientes con leucemia mostraron diferencias según la etapa de tratamiento, presentando una menor puntuación aquellos con inducción a la remisión que los que se encontraban en mantenimiento. Los niños con infección por VIH presentaron diferencias en la encuesta de salud general; aquellos con estadio clínico B obtuvieron una mejor puntuación de calidad de vida, que los pacientes con estadio clínico C. Finalmente, la comparación entre los cuatro grupos de pacientes sugiere que calidad de vida está relacionada con el control del padecimiento de base.25
En otro estudio se aplicó la Encuesta SF-36 en una población en el sureste de México. La encuesta incluye ocho escalas relacionadas con función física, rol físico, dolor corporal, salud general, vitalidad, función social, rol emocional y salud mental. Los resultados obtenidos mostraron que en la población enferma la es cala con más bajo promedio fue la de salud general, y la más alta la del rol físico. En la población sana la escala con más alto promedio fue función física y la más baja salud general. La comparación de promedios de escalas en ambos grupos mostró diferencias significativas en función física, rol físico, dolor corporal, salud general y vitalidad. Los autores concluyen que la encuesta FS-36 cumple en forma satisfactoria con todos los supuestos de validez y confiabilidad.26
Conclusiones
La medición de la calidad de vida presenta retos metodológicos que se han venido resolviendo, y que han permitido desarrollar instrumentos aplicables a diversas enfermedades y poblaciones. Los problemas metodológicos que enfrenta la medición de calidad de vida son dos; primero, que se trata de medidas consideradas “blandas”, y segundo, que no hay un valor de referencia estándar de oro contra el cual se pueda comparar. Las dos pruebas más importantes a las cuales deben someterse estas mediciones son las de validez y consistencia; una vez que cumplan estos atributos podrá aceptarse que las mediciones tengan calidad científica. Es decir, si los instrumentos miden realmente lo que se quiere medir y si esta medición es consistentemente reproducible por el mismo observador o por otros. Actualmente se cuenta con dos tipos de instrumentos: los genéricos, que permiten evaluar grupos y poblaciones con diversos diagnósticos, y los específicos, que son de mayor utilidad para medir el impacto de una enfermedad específica. Los instrumentos para medir la calidad de vida disponibles actualmente son confiables y constituyen una herramienta complementaria para evaluar la respuesta al tratamiento. Estos instrumentos también han sido evaluados en función de su capacidad de discriminación, descripción y predicción de la calidad de vida. Finalmente, hay que reconocer que la mayoría de los instrumentos disponibles han sido desarrollados en el idioma inglés, por lo que su aplicación en países de habla hispana requiere no sólo de métodos de traducción válidos, sino reconocer que son específicos al contexto social, por lo que se debe asegurar que los dominios explorados sean apropiados para la población donde se van a implantar.