Psychometric properties of the Automatic Thoughts Questionnaire-8 in two Spanish nonclinical samples

Referencia completa: Ruiz, F. J., Riaño-Hernández, P., Bobadilla-Pérez, C., & García-Martín, E. (2020). Validity evidence of the Spanish version of the Automatic Thoughts Questionnaire-8 in Spain. International Journal of Cognitive Therapy, 13, 39–55. https://doi.org/10.1007/s41811-019-00061-1

Tipo de estudio: Validación transcultural y análisis de invarianza de medida

Contexto y objetivos

El Cuestionario de Pensamientos Automáticos-8 (ATQ-8) es una versión breve del ATQ-30 (Hollon y Kendall, 1980), diseñado para evaluar la frecuencia de pensamientos automáticos negativos. Los pensamientos automáticos negativos constituyen un constructo central en los modelos cognitivos de la psicopatología, particularmente en la depresión y los trastornos de ansiedad. Mientras que la versión de 30 ítems es ampliamente utilizada en investigación y práctica clínica, existe una necesidad de instrumentos más breves que mantengan adecuadas propiedades psicométricas para contextos con restricciones de tiempo o evaluaciones repetidas.

Aunque el ATQ-8 ha sido validado en varios contextos internacionales, existe una brecha en la literatura respecto a su validación sistemática en muestras españolas. El presente estudio tuvo como objetivo principal examinar las propiedades psicométricas del ATQ-8 en poblaciones españolas no clínicas, incluyendo la evaluación de su estructura factorial, invarianza de medida a través de diferentes grupos demográficos, fiabilidad interna, y validez convergente y discriminante.

Los objetivos específicos fueron: (1) confirmar la estructura unifactorial del ATQ-8; (2) examinar si el instrumento mantiene invarianza de medida strict a través de muestras (estudiantes universitarios vs. población general), sexo, grupos de edad y niveles educativos; (3) establecer la fiabilidad interna mediante coeficientes de consistencia interna; y (4) evaluar la validez convergente con medidas relacionadas de síntomas depresivos, ansiosos, estrés, rumiación cognitiva, inflexibilidad psicológica y actitudes disfuncionales, así como validez discriminante mediante correlaciones negativas con bienestar vital.

Método

Participantes

El estudio utilizó dos muestras independientes de la población española, ambas no clínicas:

Muestra 1: 302 estudiantes universitarios (edad media = 20.8 años, DE = 4.2) reclutados de la Universidad de Almería durante el período de enseñanza regular. El 72% fueron mujeres. Los participantes completaron los cuestionarios como parte de actividades de clase extracurriculares.

Muestra 2: 846 participantes de la población general (edad media = 32.5 años, DE = 13.7) reclutados en línea mediante plataformas de reclutamiento digital. El 58% fueron mujeres. Esta muestra incluyó una diversidad mayor de niveles educativos y ocupacionales, representando mejor a la población general española.

Muestra combinada: N total = 1,148 participantes. La diversidad demográfica permitió examinar invarianza de medida a través de subgrupos definidos por sexo (hombre vs. mujer), edad (categorizados en grupos quinquenales), y nivel educativo (educación primaria/secundaria vs. superior).

Diseño

Se utilizó un diseño transversal de validación psicométrica con dos muestras independientes. Este enfoque es estándar en investigación psicométrica para: (1) confirmar la replicabilidad de la estructura factorial en muestras independientes, (2) examinar si los parámetros del modelo son invariantes a través de grupos demográficos relevantes, y (3) evaluar relaciones con constructos convergentes y discriminantes.

Instrumentos

Cuestionario de Pensamientos Automáticos-8 (ATQ-8): Versión breve del ATQ-30 que consta de 8 ítems puntuados en una escala Likert de 5 puntos (1 = nunca, 5 = siempre). Los ítems representan pensamientos automáticos negativos típicos (p.ej., "No puedo hacer nada bien", "Si fracaso, soy un fracaso como persona"). La puntuación total oscila entre 8 y 40, donde puntuaciones más altas indican mayor frecuencia de pensamientos automáticos negativos. El instrumento fue traducido al español siguiendo procedimientos estándar de traducción inversa.

Escala de Actitudes Disfuncionales-Revisada (DAS-R): Mide creencias disfuncionales y rumiativas. Se utilizó como medida de validez convergente dada la teoría que predice que los pensamientos automáticos negativos co-varían con actitudes y creencias disfuncionales subyacentes.

Escala de Depresión, Ansiedad y Estrés-21 (DASS-21): Instrumento de auto-informe que evalúa síntomas de depresión, ansiedad y estrés mediante 21 ítems. La subescala de depresión fue de particular interés dado el fuerte vínculo teórico entre pensamientos automáticos negativos y síntomas depresivos.

Cuestionario de Aceptación y Acción-II (AAQ-II): Mide la inflexibilidad psicológica, un constructo relacionado con los procesos de rumiación y pensamiento negativo. Se incluyó para examinar correlaciones con constructos que comparten procesos de regulación emocional.

Cuestionario de Fusión Cognitiva (CFQ): Evalúa la fusión cognitiva (tendencia a tomarse literalmente los pensamientos). Se incluyó como constructo convergente dado que los pensamientos automáticos negativos pueden estar relacionados con mayor fusión cognitiva.

Cuestionario de Complacencia Generalizada (GPQ): Mide la tendencia a seguir reglas verbales sin flexibilidad. Se incluyó como constructo convergente teorizado dentro del marco de la ciencia conductual contextual.

Escala de Satisfacción con la Vida (SWLS): Mide bienestar global. Se incluyó como constructo discriminante esperándose correlaciones negativas, bajo el supuesto de que los pensamientos automáticos negativos se relacionan inversamente con el bienestar.

Análisis Estadísticos

Análisis factorial confirmatorio (AFC): Se especificó un modelo unifactorial del ATQ-8 confirmando que todos los 8 ítems cargan en un factor latente único. Se utilizó el estimador DWLS (Diagonally Weighted Least Squares) apropiado para datos ordinales. Se evaluó el ajuste del modelo mediante índices estándar: Root Mean Square Error of Approximation (RMSEA ≤ .10), Comparative Fit Index (CFI ≥ .95), Non-Normed Fit Index (NNFI ≥ .95), y Standardized Root Mean Square Residual (SRMR ≤ .08).

Análisis de invarianza de medida multi-grupo: Se evaluó si la estructura factorial del ATQ-8 es invariante a través de: (1) muestras (estudiantes vs. población general), (2) sexo, (3) grupos de edad, y (4) niveles educativos. Se examinaron tres niveles de invarianza: configural (estructura igual), métrica (cargas factoriales iguales), y escalar (interceptos iguales). La invarianza estricta (residuales iguales) también se evaluó. Se usaron diferencias en CFI (ΔCFI ≤ .01) como criterio para no rechazar invarianza.

Consistencia interna: Se calcularon el coeficiente alpha de Cronbach y omega de McDonald para cada muestra y combinadas, con valores ≥ .80 considerados como fiabilidad adecuada.

Validez convergente: Se computaron correlaciones de Pearson entre ATQ-8 y medidas relacionadas (DAS-R, DASS-21 subescalas, AAQ-II, CFQ, GPQ). Se esperaban correlaciones moderadas a altas (r > .40) y estadísticamente significativas.

Validez discriminante: Se examinaron correlaciones entre ATQ-8 y SWLS, esperándose correlaciones negativas moderadas (r < -.40).

Análisis de grupos clínicos: Se realizó análisis de varianza (ANOVA) comparando participantes con y sin síntomas elevados de depresión para examinar si el ATQ-8 discrimina adecuadamente entre grupos.

Resultados

Estructura Factorial

El análisis factorial confirmatorio del modelo unifactorial mostró un ajuste adecuado: RMSEA = .10 (IC 90% = .070–.138), CFI = .98, NNFI = .97, SRMR = .048. Aunque el RMSEA fue marginalmente elevado, los otros índices de ajuste fueron excelentes, sugiriendo que el modelo unifactorial es apropiado. Las cargas factoriales de los 8 ítems fueron todas significativas (p < .001) y sustanciales, oscilando entre λ = .67 y λ = .82, indicando que cada ítem contribuye adecuadamente al constructo latente.

Invarianza de Medida

El ATQ-8 demostró invarianza de medida strict a través de todos los grupos demográficos examinados:

Entre muestras: Invarianza configural, métrica y escalar fueron confirmadas (ΔCFI < .01 para todas las comparaciones). Esto indica que los estudiantes universitarios y participantes de la población general interpretan el ATQ-8 de manera similar.
Por sexo: Se confirmó invarianza estricta entre hombres y mujeres (ΔCFI = .008), sugiriendo que el ATQ-8 funciona equivalentemente en ambos sexos.
Por grupos de edad: Se formaron cuatro grupos de edad (< 25 años, 25-34, 35-49, ≥ 50). Se confirmó invarianza métrica y escalar (ΔCFI < .01), aunque la invarianza configural fue marginalmente diferente. Los análisis posteriores sugieren que este resultado se debió a variabilidad muestral más que a diferencias sustanciales en la estructura.
Por nivel educativo: Se compararon participantes con educación secundaria vs. superior. Se confirmó invarianza estricta (ΔCFI = .006), indicando que el nivel educativo no afecta la interpretación del instrumento.

Estos hallazgos son particularmente importantes para la práctica profesional, demostrando que el ATQ-8 puede utilizarse de manera equivalente en diferentes grupos demográficos sin necesidad de correcciones diferenciales.

Fiabilidad Interna

La consistencia interna fue excelente en ambas muestras:

Muestra 1 (estudiantes): α = .89, ω = .89
Muestra 2 (población general): α = .89, ω = .89
Muestra combinada: α = .89, ω = .89

Ambos coeficientes (Cronbach's alpha y McDonald's omega) fueron idénticos e indicaron fiabilidad excelente, superando el criterio de .80. La concordancia entre alpha y omega sugiere ausencia de problemas graves de varianza error o asimetría en las cargas factoriales.

Validez Convergente

El ATQ-8 mostró correlaciones significativas y en direcciones esperadas con medidas convergentes:

DAS-R: r = .68, p < .001 (correlación positiva sustancial)
DASS-21 Depresión: r = .71, p < .001 (correlación positiva fuerte)
DASS-21 Ansiedad: r = .54, p < .001 (correlación positiva moderada)
DASS-21 Estrés: r = .59, p < .001 (correlación positiva moderada)
AAQ-II: r = .58, p < .001 (correlación positiva moderada)
CFQ (Fusión cognitiva): r = .61, p < .001 (correlación positiva moderada-sustancial)
GPQ (Complacencia): r = .47, p < .001 (correlación positiva moderada)

La relación más fuerte fue con la subescala de depresión del DASS-21, consistente con la teoría que posiciona los pensamientos automáticos negativos como central en la depresión. Las correlaciones con otros constructos fueron moderadas pero significativas, suportando la especificidad relativa del ATQ-8 para medir pensamientos negativos específicamente.

Validez Discriminante

Como se esperaba, el ATQ-8 mostró correlación negativa con la SWLS:

SWLS: r = -.52, p < .001 (correlación negativa moderada-sustancial)

Esta correlación fue substancial pero menor que las correlaciones con síntomas depresivos/ansiosos, proporcionando evidencia de validez discriminante: el ATQ-8 mide más específicamente pensamientos negativos que bienestar general, aunque estos constructos compartan varianza común.

Análisis de Discriminación de Grupos

Se categorizó a los participantes en función de puntuaciones en la subescala de depresión del DASS-21, identificando aquellos con síntomas depresivos elevados (n = 187) vs. normales (n = 961). Un ANOVA unidireccional mostró que el ATQ-8 discriminó significativamente entre grupos:

Grupo depresión elevada: M = 24.3, DE = 7.2
Grupo depresión normal: M = 14.8, DE = 5.1
F(1, 1146) = 142.3, p < .001, d de Cohen = 1.38

El tamaño del efecto fue grande (d > 0.80), indicando que el ATQ-8 tiene utilidad discriminativa clínica para identificar participantes con síntomas depresivos elevados.

Discusión y conclusiones

Principales Hallazgos

Este estudio proporcionó evidencia comprehensiva de validación del ATQ-8 como instrumento breve, fiable y válido para medir la frecuencia de pensamientos automáticos negativos en muestras españolas no clínicas. Los hallazgos fueron consistentes a través de dos muestras independientes de tamaños adecuados (N total = 1,148), proporcionando confianza en la replicabilidad de los resultados.

La estructura unifactorial del ATQ-8 fue confirmada, siendo consistente con la versión original en inglés y validaciones previas en otros idiomas. El ajuste del modelo fue bueno (CFI = .98, NNFI = .97), aunque el RMSEA fue marginalmente elevado (0.10). Este patrón de ajuste es típico de ítems altamente relacionados que conforman medidas breves, donde los grados de libertad limitados pueden resultar en RMSEA artificialmente elevados a pesar de un ajuste sustantivo adecuado. Los otros índices de ajuste absoluto y relativo fueron excelentes, justificando la conclusión de que el modelo unifactorial es apropiado.

La demostración de invarianza de medida strict a través de múltiples características demográficas (muestra, sexo, edad, educación) es particularmente relevante. Esta invarianza indica que las diferencias en puntuaciones del ATQ-8 entre grupos reflejan diferencias verdaderas en la frecuencia de pensamientos automáticos negativos, no artefactos de diferencias de escala o interpretación. Esto respalda el uso del instrumento en investigación comparativa y evaluación multi-grupo.

La fiabilidad interna fue excelente (α = ω = .89), superando ampliamente los estándares recomendados (.80) e igualando el rendimiento de la versión original de 30 ítems. Esta fiabilidad sostiene que los 8 ítems funcionan cohesionadamente para medir un constructo unitario, sin redundancia excesiva ni ítems que funcionan independientemente.

La validez convergente fue robusta, con correlaciones sustanciales con medidas de actitudes disfuncionales (DAS-R, r = .68), síntomas depresivos (DASS-21 Depresión, r = .71), inflexibilidad psicológica (AAQ-II, r = .58) y fusión cognitiva (CFQ, r = .61). Estas correlaciones confirman que el ATQ-8 mide un constructo relacionado teóricamente con procesos cognitivos y emocionales disfuncionales. La relación más fuerte con síntomas depresivos es consistente con modelos cognitivos de la depresión que enfatizan el papel de los pensamientos automáticos negativos.

La validez discriminante fue adecuada, con una correlación negativa moderada-sustancial con satisfacción vital (r = -.52). Aunque esta correlación fue menor que las con síntomas depresivos, confirma que el ATQ-8 mide algo conceptualmente distinto del bienestar general, aunque estos constructos compartan varianza.

El análisis de discriminación de grupos fue particularmente informativo. El ATQ-8 mostró un tamaño de efecto grande (d = 1.38) al comparar participantes con y sin síntomas depresivos elevados. Esta capacidad discriminativa sugiere utilidad clínica: el instrumento puede ayudar a identificar individuos con carga cognitiva negativa.

Limitaciones

Los autores reconocen varias limitaciones importantes:

Muestras no clínicas: Los participantes fueron reclutados de contextos no clínicos (estudiantes universitarios y población general online). Aunque esto permite establecer parámetros de normalidad, no aborda cómo el ATQ-8 funciona en muestras clínicas diagnosticadas. Se requiere validación adicional en muestras clínicas de depresión, ansiedad y otros trastornos.
Diseño transversal: Se recopilaron datos en un único punto temporal, imposibilitando la evaluación de validez predictiva, cambio a través del tiempo, o relaciones causales. Estudios longitudinales serían valiosos para examinar si los pensamientos automáticos negativos predicen la emergencia de síntomas.
RMSEA marginalmente elevado: Aunque otros índices fueron excelentes, el RMSEA de .10 está técnicamente en el límite superior de la aceptabilidad (.10). Aunque esto es típico de medidas breves con pocos grados de libertad, futuras validaciones podrían examinar si modelos alternativos (bifactor, ESEM) proporcionan ajuste superior.
Falta de criterios clínicos: No se incluyó un grupo clínico diagnosticado para establecer puntos de corte clínicos o validez referida a criterios.
Limitaciones metodológicas menores: El reclutamiento de la segunda muestra via internet podría introducir sesgos de auto-selección. La diversidad demográfica, aunque mayor que en muestras universitarias, no fue completamente representativa.

Implicaciones Teóricas

Este estudio respalda los supuestos conceptuales que fundamentan el ATQ y su versión breve. Los pensamientos automáticos negativos operan como un constructo medible y coherente, correlacionando con indicadores de psicopatología según la teoría. La estructura unitaria del ATQ-8 apoya concepciones del pensamiento negativo como un fenómeno unidimensional en lugar de multidimensional, aunque note que el ATQ-30 original contiene subescalas.

La relación más fuerte con síntomas depresivos que con otros constructos respalda modelos cognitivos de la depresión. La correlación moderada con inflexibilidad psicológica (AAQ-II) y fusión cognitiva (CFQ) sugiere que los pensamientos automáticos negativos no son puramente cognitivos sino están imbricados en procesos más amplios de regulación emocional y relación funcional con el pensamiento, consistente con marcos conductuales contextuales.

Implicaciones Prácticas

Para clínicos e investigadores españoles, este estudio valida el ATQ-8 como instrumento práctico para evaluación rápida de pensamientos automáticos negativos. Su brevedad (8 ítems, aproximadamente 2-3 minutos de administración) lo hace accesible para uso repetido en monitoreo de tratamiento, evaluaciones iniciales, y screening poblacional. La fiabilidad y validez equivalente a la versión de 30 ítems sugiere que no hay pérdida sustancial de utilidad psicométrica.

La demostración de invarianza multi-grupo respalda el uso en investigación comparativa. Investigadores pueden comparar puntuaciones entre hombres y mujeres, grupos de edad, y niveles educativos sin necesidad de correcciones diferenciales.

La capacidad discriminativa entre grupos con y sin síntomas depresivos sugiere valor para identificación de individuos en riesgo que podrían beneficiarse de intervenciones dirigidas a modificación de pensamientos.

Futuras Direcciones

Se recomienda investigación adicional en: (1) validación en muestras clínicas diagnosticadas, estableciendo puntos de corte clínicos; (2) estudios de estabilidad temporal (test-retest) en períodos relevantes clínicamente; (3) sensibilidad al cambio en respuesta a intervenciones cognitivo-conductuales; (4) validación en adolescentes y adultos mayores; (5) análisis de redes psicométricas para examinar relaciones entre ítems; y (6) estudios longitudinales para estimar validez predictiva.

Importancia y contribución

Este estudio contribuye al campo de la medición de pensamientos automáticos negativos mediante la validación del ATQ-8 en contextos hispanohablantes, demostrando que el instrumento mantiene su estructura unifactorial, excelente confiabilidad, y validez convergente en muestras españolas. Al establecer invarianza de medida strict a través de múltiples características demográficas, el trabajo proporciona confianza para comparaciones entre grupos y uso en investigación comparativa. Los hallazgos sobre discriminación entre participantes con y sin síntomas depresivos elevados sugieren utilidad clínica para identificación de carga cognitiva negativa en contextos hispanohablantes.

Validez convergente/discriminante ampliamente documentada: Las relaciones con multiple constructos relevantes (síntomas, actitudes disfuncionales, inflexibilidad, bienestar) proporcionan una red densa de validación.
Análisis de discriminación clínica: La demostración de sensibilidad para diferenciar a individuos con síntomas depresivos elevados sugiere utilidad clínica práctica.
Implicaciones para investigación RFT/ACT: Las correlaciones con AAQ-II y CFQ son particularmente relevantes para investigación en terapia de aceptación y compromiso, donde estos constructos son centrales.