Introducción y Justificación

El Cuestionario de Aceptación y Acción–II (AAQ-II; Bond et al., 2011) constituye uno de los instrumentos más ampliamente utilizados en la evaluación de la evitación experiencial y la inflexibilidad psicológica, constructos centrales en la Terapia de Aceptación y Compromiso (ACT). El AAQ-II fue desarrollado como mejora sustancial respecto a su versión anterior (AAQ-I), que presentaba propiedades psicométricas cuestionables, particularmente una estructura factorial compleja y consistencia interna limitada. La versión mejorada demostró una estructura unifactorial clara y consistencia interna sólida en muestras angloparlantes.

La evitación experiencial, definida como el proceso de evitar o escapar de experiencias internas aversivas (pensamientos, emociones, sensaciones), ha sido propuesta como un mecanismo transdiagnóstico común a múltiples trastornos psicológicos. El AAQ-II operacionaliza este constructo mediante siete ítems que evalúan tanto el grado de resistencia a experiencias internas como el impacto funcional de esta inflexibilidad.

Aunque el AAQ-II ha sido traducido a múltiples idiomas, incluyendo español en trabajos previos (Ruiz et al., 2013), existían debates en la literatura científica sobre sus características psicométricas. Algunos autores han señalado la posible contaminación de criterio, argumentando que los ítems incluyen descripciones de afectividad negativa que podrían confundir la medición de evitación experiencial con distress psicológico general. Sin embargo, investigaciones recientes han demostrado que las puntuaciones del AAQ-II explican varianza adicional más allá de medidas de afectividad, mantienen estabilidad temporal pese a fluctuaciones sintomáticas, y predeterminan resultados terapéuticos de manera independiente de síntomas depresivos o ansiosos.

Un aspecto crítico no sistemáticamente explorado previamente era la invariancia de medida del AAQ-II entre muestras clínicas y no clínicas, así como entre géneros. Adicionalmente, no existían datos publicados sobre las propiedades psicométricas del AAQ-II en población colombiana, lo que motivó este estudio.

Objetivos

Objetivo primario: Analizar las propiedades psicométricas y la estructura factorial del AAQ-II versión española en muestra colombiana.

Objetivos secundarios: (1) Examinar la invariancia de medida a través de muestras clínicas y no clínicas, y (2) Evaluar la invariancia de medida entre géneros.

Método

Diseño y Participantes

El estudio adoptó un diseño de validación instrumental con cuatro muestras independientes:

Muestra 1 (N = 762): Estudiantes universitarios de pregrado de siete universidades en Bogotá. Rango etario 18-63 años (M = 21.16, DE = 3.76). El 46% estudiaba Psicología. Composición por género: 62% mujeres. Respecto a historia de tratamiento psicológico/psiquiátrico: 26% habían recibido algún tipo de tratamiento; 4.3% estaban en tratamiento activo; 2.9% consumía medicación psicotrópica.

Muestra 2 (N = 724; 74.4% mujeres): Rango etario 18-88 años (M = 26.11, DE = 8.93). Seleccionada mediante encuesta anónima en línea, todos los participantes residían en Colombia. Prevalencia de tratamiento previo: 45%; tratamiento actual: 8.4%; medicación psicotrópica: 5.4%. Esta muestra representó una población más diversa y con mayor prevalencia de problemas psicológicos que la Muestra 1.

Muestra 3 (N = 277): Pacientes clínicos derivados de consultorio privado en Bogotá. Composición por género: 64% mujeres. Rango etario 18-67 años (M = 28.4, DE = 11.33). Diagnósticos: 88.4% trastornos emocionales (depresivos y ansiosos), 11.6% trastornos sexuales. Medicación psicotrópica: 6.1%.

Muestra 4 (N = 11; 2 hombres): Participantes en estudio de una sesión de ACT para rumiación desadaptativa (RNT, en inglés). Rango etario 18-32 años (M = 22.18, DE = 4.40). Empleada para evaluar sensibilidad al cambio.

Tamaño de muestra total: N = 1,773 para análisis de estructura factorial.

Instrumentos

Cuestionario de Aceptación y Acción–II (AAQ-II): Siete ítems con escala Likert de 7 puntos (1 = nunca es verdadero; 7 = siempre es verdadero). Instruye a los participantes a evaluar acuerdos con proposiciones sobre evitación de experiencias internas e impacto funcional. Rango de puntuación: 7-49, con puntuaciones superiores indicando mayor inflexibilidad psicológica.

Instrumentos de validez convergente y discriminante:

DASS-21 (Depression, Anxiety and Stress Scales–21): Medida de síntomas emocionales.
GHQ-12 (General Health Questionnaire–12): Evaluación de malestar psicológico general.
DAS-R (Dysfunctional Attitude Scale–Revised): Medida de creencias desadaptativas.
SWLS (Satisfaction with Life Scale): Evaluación de satisfacción vital.
MAAS (Mindful Attention Awareness Scale): Medida de conciencia presente.

Se reportaron valores de consistencia interna (α) para todos estos instrumentos en cada muestra.

Análisis de Datos

Análisis factorial confirmatorio (CFA): Realizados con LISREL 8.71 utilizando estimación de mínimos cuadrados ponderados (WLS) con correlaciones policóricas, dado que los datos de Likert se trataron como ordinales. Se compararon dos modelos: (a) unifactorial simple, y (b) unifactorial con términos de error correlacionados para los Ítems 1 y 4, siguiendo especificación de Bond et al. (2011) que identificó una covarianza residual entre estos ítems en muestras anglófonas.

Índices de ajuste evaluados: RMSEA (Error Cuadrático Medio de Aproximación), CFI (Índice Comparativo de Ajuste), NNFI (Índice de Ajuste no-Normativo), ECVI (Índice Esperado de Validación Cruzada). Criterios de buen ajuste: RMSEA < 0.08, CFI > 0.90, NNFI > 0.90.

Comparación de modelos: Mediante prueba de razón de verosimilitud (chi-cuadrada de diferencia).

Invariancia de medida: Análisis de múltiples grupos para examinar invariancia a través de tres muestras independientes (1-3) y entre géneros. Modelos baseline vs. modelos con parámetros restringidos. Criterios de Chen (2007): ΔRMSEA < 0.01, ΔCFI > −0.01, ΔNNFI > −0.01.

Consistencia interna: Cálculo de alfa de Cronbach con intervalos de confianza 95% mediante SPSS 19. Correlaciones corregidas ítem-total.

Validez discriminante: Pruebas t de Student comparando grupos según punto de corte GHQ-12.

Validez convergente: Correlaciones de Pearson con constructos relacionados.

Sensibilidad al cambio: Prueba t pareada pre-post en Muestra 4, con cálculo de tamaño de efecto Cohen's d.

Resultados

Estructura Factorial

Los análisis se realizaron con la muestra combinada (N = 1,759).

Modelo unifactorial simple: RMSEA = 0.097 [IC95%: 0.087–0.110], CFI = 0.97, NNFI = 0.95, ECVI = 0.16 [IC95%: 0.13–0.19], χ²(14) = 247.23. Este modelo mostró ajuste aceptable pero susceptible de mejora, particularmente en el RMSEA.

Modelo unifactorial con errores correlacionados (Ítems 1 y 4): RMSEA = 0.069 [IC95%: 0.059–0.081], CFI = 0.98, NNFI = 0.97, ECVI = 0.087 [IC95%: 0.069–0.110], χ²(13) = 123.18. Mejora sustancial en ajuste, con RMSEA dentro de criterios óptimos.

Diferencia chi-cuadrada: χ²diff = 124.05 (df = 1, p < 0.001), confirmando superioridad estadística del modelo con errores correlacionados.

Cargas factoriales estandarizadas: Todos los ítems presentaron cargas satisfactorias. Rangos: 0.75–0.85. Específicamente, el Ítem 1 (λ = 0.75), Ítem 2 (λ = 0.75), Ítem 3 (λ = 0.78), Ítem 4 (λ = 0.83), Ítem 5 (λ = 0.81), Ítem 6 (λ = 0.80), Ítem 7 (λ = 0.85). El factor latente de evitación experiencial fue fijado a 1.00 para identificación.

Invariancia de Medida

Invariancia entre muestras clínicas y no clínicas (Muestras 1-3):

Modelo baseline múltiples grupos: χ²(39) = 161.59, RMSEA = 0.073, CFI = 0.98, NNFI = 0.97.

Modelo con parámetros restringidos: χ²(53) = 184.88, Δχ²(14) = 23.29 (p > 0.05), ΔRMSEA = 0.008, ΔCFI = 0.00, ΔNNFI = 0.01.

Conclusión: Cumplimiento de todos los criterios de Chen (2007), confirmando invariancia estricta.

Invariancia entre géneros (Muestras 1, 2 y 3 combinadas):

Modelo baseline múltiples grupos: χ²(26) = 134.04, RMSEA = 0.069, CFI = 0.99, NNFI = 0.98.

Modelo con parámetros restringidos: χ²(33) = 140.23, Δχ²(7) = 6.19 (p > 0.05), ΔRMSEA = 0.008, ΔCFI = 0.00, ΔNNFI = 0.00.

Conclusión: Invariancia completa confirmada entre hombres y mujeres.

Consistencia Interna

Muestra 1: α = 0.88 [IC95%: 0.87–0.89]. Puntuación media M = 19.99 (DE = 8.37). Correlaciones corregidas ítem-total: rango 0.63–0.69.

Muestra 2: α = 0.91 [IC95%: 0.90–0.92]. Puntuación media M = 22.86 (DE = 9.51). Correlaciones corregidas ítem-total: rango 0.67–0.78.

Muestra 3: α = 0.90 [IC95%: 0.88–0.92]. Puntuación media M = 29.67 (DE = 10.27). Correlaciones corregidas ítem-total: rango 0.66–0.77.

Muestra total (N = 1,759): α = 0.91 [IC95%: 0.90–0.92]. Puntuación media M = 22.69 (DE = 9.74).

Los coeficientes alfa de todas las muestras superaron 0.88, indicando consistencia interna fuerte.

Diferencias por Género

Muestra 1: Hombres (M = 18.92, DE = 8.04) < Mujeres (M = 20.64, DE = 8.50), t(760) = −2.76, p = 0.006, diferencia significativa.

Muestra 2: Hombres vs. Mujeres, t(722) = 1.22, p = 0.22, sin diferencia significativa.

Muestra 3: Hombres vs. Mujeres, t(275) = −1.52, p = 0.13, sin diferencia significativa.

Validez Discriminante

Muestra 1: Participantes con GHQ-12 ≥ 12 (M = 24.88, DE = 8.25) puntuaron significativamente más alto en AAQ-II que aquellos con GHQ-12 < 12 (M = 16.83, DE = 6.79), t(760) = 14.00, p < 0.001. Diferencia de medias = 8.05 puntos.

Comparación entre muestras: La Muestra 3 (clínica) puntuó significativamente más alto que Muestra 1, t(1037) = −12.33, p < 0.001, y Muestra 2, t(999) = −9.86, p < 0.001, demostrando que el instrumento discrimina adecuadamente entre poblaciones clínicas y no clínicas.

Validez Convergente

Se calcularon correlaciones de Pearson (todos p < 0.001) entre AAQ-II y construcciones relacionadas:

DASS-21: Correlaciones positivas con subescalas de Depresión (r = 0.49–0.73), Ansiedad (r = 0.49–0.73), Estrés (r = 0.49–0.73).
GHQ-12: Correlación positiva r = 0.55–0.60 con malestar psicológico general.
DAS-R: Correlación positiva r = 0.42 con creencias desadaptativas.
SWLS: Correlaciones negativas r = −0.42 a −0.57 con satisfacción vital.
MAAS: Correlación negativa r = −0.31 con conciencia presente.

Todos los patrones de correlación fueron consistentes con hipótesis teóricas sobre evitación experiencial.

Sensibilidad al Cambio

Muestra 4 (N = 11): Evaluación pre-post de intervención ACT de una sesión.

Baseline: M = 29.09 (DE = 6.14)
6 semanas post-intervención: M = 18.82 (DE = 6.57)
Diferencia: Δ M = 10.27 puntos
Prueba t pareada: t(10) = 7.13, p < 0.001
Tamaño de efecto: Cohen's d = 2.16 (efecto muy grande)

El resultado indica que el AAQ-II es sensible a cambios inducidos por intervención terapéutica ACT.

Discusión

Este estudio confirmó que el AAQ-II español presenta excelentes propiedades psicométricas en población colombiana, replicando los hallazgos de la validación original en inglés (Bond et al., 2011) y la validación española previa (Ruiz et al., 2013).

La estructura unifactorial fue claramente confirmada, con la especificación de términos de error correlacionados entre Ítems 1 y 4 proporcionando ajuste superior. Esta correlación residual sugiere algún grado de dependencia entre estos ítems más allá del constructo latente, posiblemente reflejando solapamiento semántico o una dimensión adicional menor no modelada. Independientemente, el modelo demonstró ajuste excelente en todos los índices principales.

La consistencia interna fue excepcionalmente fuerte (α = 0.91), superando incluso los umbrales tradicionalmente considerados óptimos (α > 0.80). Los valores fueron estables a través de muestras clínicas y no clínicas, sugiriendo fiabilidad robusta.

La invariancia de medida fue establecida a través de dos dimensiones importantes: (a) entre muestras clínicas y no clínicas, y (b) entre géneros. Estos hallazgos tienen implicaciones críticas para investigación comparativa y aplicaciones clínicas multiculturales, permitiendo interpretaciones de diferencias de puntuación como reflejando verdaderas diferencias en el constructo subyacente en lugar de artefactos de medida.

La validez discriminante fue robustamente demostrada, con el AAQ-II diferenciando significativamente entre individuos con elevado malestar psicológico (GHQ-12 ≥ 12) y aquellos sin tal malestar, así como entre muestras clínicas y no clínicas. Las diferencias grandes entre Muestra 3 (clínica) y Muestras 1-2 (no clínicas) respaldan utilidad diagnóstica.

La validez convergente fue consistente con la teoría, con correlaciones positivas moderadas a fuertes con medidas de psicopatología (DASS-21, GHQ-12, DAS-R) y correlaciones negativas con bienestar y conciencia presente (SWLS, MAAS). Estos patrones confirman que evitación experiencial covaría apropiadadamente con constructos relacionados pero distintivamente.

La sensibilidad al cambio fue demostrada mediante la evaluación de tamaño de efecto sustancial (d = 2.16) en respuesta a intervención ACT. Aunque la muestra fue pequeña (N = 11), el efecto fue dramático y consistente. Esto respalda que el AAQ-II funciona como mecanismo transdiagnóstico de cambio en ACT, como teorizado.

Limitaciones

Los autores reconocieron varias limitaciones metodológicas: (1) Información diagnóstica sistemática no fue recopilada para la Muestra 3, limitando conclusiones sobre desempeño en trastornos específicos. (2) Los instrumentos de validez convergente/divergente (DASS-21, SWLS, MAAS) no fueron formalmente validados en población colombiana, potencialmente afectando interpretaciones de patrones correlacionales. (3) Las muestras fueron predominantemente jóvenes y educadas, particularmente Muestra 1 (estudiantes universitarios), limitando generalización a poblaciones más diversas y con menor educación formal. (4) La Muestra 4 fue muy pequeña para conclusiones firmes sobre sensibilidad al cambio, aunque los efectos fueron grandes.

Conclusiones e Implicaciones

El AAQ-II demuestra ser instrumento confiable y válido para la medición de evitación experiencial e inflexibilidad psicológica en contexto colombiano. Su estructura unifactorial, consistencia interna excelente, invariancia de medida demoestrada, validez discriminante y convergente, y sensibilidad al cambio lo posicionan como herramienta apropiada para investigación y práctica clínica. Los hallazgos de invariancia de medida tienen implicaciones significativas para estudios transculturales comparativos.

Se recomiendan futuros estudios con muestras diagnósticas específicas, validación formal de medidas relacionadas en Colombia, y evaluaciones en poblaciones más diversas demográficamente.

Psychometric Properties of the Acceptance and Action Questionnaire–II in Colombia

Complete Reference

Ruiz, F. J., Suárez-Falcón, J. C., Cárdenas-Sierra, S., Durán, Y., Guerrero, K., & Riaño-Hernández, D. (2016). Psychometric Properties of the Acceptance and Action Questionnaire–II in Colombia. The Psychological Record, 66, 429-437. DOI: 10.1007/s40732-016-0183-2

Psychometric Properties of the Acceptance and Action Questionnaire–II in Colombia

Autores

Revista

Resumen

Resumen Detallado

Introducción y Justificación

Objetivos

Método

Diseño y Participantes

Instrumentos

Análisis de Datos

Resultados

Estructura Factorial

Invariancia de Medida

Consistencia Interna

Diferencias por Género

Validez Discriminante

Validez Convergente

Sensibilidad al Cambio

Discusión

Limitaciones

Conclusiones e Implicaciones

Psychometric Properties of the Acceptance and Action Questionnaire–II in Colombia

Complete Reference