Cross-national measurement invariance of the Perseverative Thinking Questionnaire for clinical psychology professionals and trainees
Autores
Ccoyllo-Gonzalez, L., Blancas-Guillen, J., Salazar-Alvarez, G., Valencia, P. D., Ruiz, F. J.
Revista
Revista Latinoamericana de Psicología
Resumen
Muestra de 475 profesionales y estudiantes de psicología clínica de Colombia, México y Perú. El PTQ-CPT (9 ítems) mostró estructura unidimensional con errores correlacionados, invarianza métrica entre países y evidencias de validez: correló positivamente con depresión y ansiedad y negativamente con confianza en habilidades clínicas. Es una medida fiable y válida de PNR para investigación y práctica transcultural.
Resumen Detallado
Título
Invarianza de medición transnacional del Cuestionario de Pensamiento Perseverativo para profesionales y estudiantes de psicología clínica
Referencia Completa
Ccoyllo-Gonzalez, L., Blancas-Guillen, J., Salazar-Alvarez, G., Valencia, P. D., & Ruiz, F. J. (2025). Cross-national measurement invariance of the Perseverative Thinking Questionnaire for clinical psychology professionals and trainees. Revista Latinoamericana de Psicología, 57, 89-97. https://doi.org/10.14349/rlp.2025.v57.9
Tipo de Estudio
Estudio instrumental de validación psicométrica enfocado en la invarianza de medición transnacional (multigrupo) del PTQ-CPT en tres países latinoamericanos. N total = 475 participantes (Colombia n=101; México n=253; Perú n=121).
Contexto y Objetivos
Los profesionales y estudiantes de psicología clínica enfrentan estrés laboral significativo derivado de la exposición a sufrimiento ajeno, manejo de casos complejos y presión por mantener alianzas terapéuticas efectivas. Esta exposición puede conducir a Pensamiento Negativo Repetitivo (PNR), manifestado como dudas persistentes sobre la propia competencia, preocupaciones sobre decisiones clínicas y cuestionamientos sobre la efectividad de las intervenciones. El PNR se considera un proceso transdiagnóstico, factor común de riesgo para trastornos emocionales como ansiedad y depresión, y se asocia con mayor agotamiento emocional, menor satisfacción laboral, deficiencias en el funcionamiento cognitivo y en la calidad de las decisiones clínicas.
El Cuestionario de Pensamiento Perseverativo para Estudiantes de Psicología Clínica (PTQ-CPT) fue desarrollado por Dereix-Calonge et al. (2019b) como adaptación específica del PTQ original (Ehring et al., 2011) para medir PNR en esta población. Aunque estudios previos demostraron que el PTQ-CPT es una herramienta prometedora, no se han realizado análisis psicométricos comprensivos posteriores a 2019, ni se ha examinado si funciona de manera equivalente en diferentes contextos culturales latinoamericanos.
Objetivo: Examinar las propiedades psicométricas del PTQ-CPT y su invarianza de medición transnacional en profesionales y estudiantes de psicología clínica de Colombia, México y Perú, con énfasis en evaluar si la estructura factorial y el funcionamiento del instrumento son equivalentes entre países.
Método
Participantes
Muestra no probabilística de 475 participantes (76.4% mujeres; 23.6% hombres) distribuidos así:
- México: 253 participantes (53.3%)
- Perú: 121 participantes (25.5%)
- Colombia: 101 participantes (21.3%)
Demografía laboral:
- 24.4% estudiantes de pregrado en psicología clínica
- 75.6% profesionales clínicos licenciados
- 84% involucrados en intervenciones clínicas
- 42.2% en actividades de evaluación psicológica
- 41.2% en promoción de la salud y prevención
- 26.5% en triaje y orientación
Supervisión clínica semanal:
- 43.8% sin supervisión
- 41.7% de 0 a 2 horas
- 9.3% de 3 a 5 horas
- 5.3% más de 5 horas
Contexto de práctica: 67.4% sector privado; 17.6% sector público; 14.9% ambos sectores.
El tamaño muestral fue determinado mediante simulación de Monte Carlo basada en parámetros de Dereix-Calonge et al. (2019b), indicando necesidad de al menos 100 participantes por grupo país para analizar invarianza de medición.
Instrumento Evaluado: Perseverative Thinking Questionnaire for Clinical Psychology Training (PTQ-CPT)
Versión y adaptación: Dereix-Calonge et al. (2019b); versión adaptada para el presente estudio.
Estructura: 9 ítems que miden pensamiento perseverativo específicamente relacionado con práctica clínica. Escala de respuesta: 0-4 (desde "nunca" hasta "casi siempre").
Modificación realizada: El ítem 5 fue modificado de "no puedo concentrarme en mis estudios" a "no puedo concentrarme en otras actividades" para aplicabilidad tanto en estudiantes como en profesionales licenciados.
Confiabilidad reportada en validación original: Alfa de Cronbach = .93; estructura unifactorial.
Evidencia de validez anterior:
- Correlaciones positivas con experiencia de evitación, síntomas emocionales y obstrucción de valores
- Correlaciones negativas moderadas con satisfacción vital y progreso de valores
- En estudios longitudinales posteriores, el PTQ-CPT predijo mejor que el PTQ original el aumento de síntomas emocionales en estudiantes de psicología clínica
- Las puntuaciones mediaron el efecto de intervenciones basadas en Terapia de Aceptación y Compromiso (ACT) en la reducción de síntomas emocionales
Otros Instrumentos de Medida
Patient Health Questionnaire-2 (PHQ-2; Kroenke et al., 2003):
- Mide síntomas depresivos en últimas dos semanas
- 2 ítems, escala Likert 0-3
- Consistencia interna en muestras latinoamericanas: ω = .86-.89 (Colombia, México, Perú)
- Evidencia de invarianza de medición entre estos países
Generalised Anxiety Disorder Scale-2 (GAD-2; Kroenke et al., 2007):
- Evalúa síntomas principales de ansiedad en últimas dos semanas
- 2 ítems, respuestas Likert 0-3 (0 a 6 total)
- Consistencia interna en muestras latinoamericanas: ω = .87-.88 (Colombia, México, Perú)
- Evidencia de invarianza de medición entre estos países
Pregunta Ad Hoc de Confianza en Habilidades Clínicas:
- Desarrollada específicamente para este estudio
- Mide confianza percibida en habilidades clínicas como psicólogo o estudiante de psicología
- Escala de respuesta 0-10 ("nada seguro" a "totalmente seguro")
Procedimiento
Recopilación de datos: Encuesta digital mediante Google Forms (marzo-mayo 2022) Coordinación: Asociaciones, instituciones, docentes y estudiantes de Perú, México y Colombia facilitaron difusión a través de redes sociales Consentimiento: Formulario incluyó sección de consentimiento informado explicando objetivos, naturaleza voluntaria y anonimato Aprobación ética: Comité de ética e Investigación de la Escuela de Psicología de la Universidad Autónoma del Perú (26 de junio de 2023)
Análisis de Datos
1. Estadística descriptiva: Examinadas a nivel de ítem (media, desviación estándar, sesgo, curtosis, distribución de opciones de respuesta).
2. Análisis factorial confirmatorio (AFC):
- Método: Variante robusta de máxima verosimilitud (MLR)
- Justificación: Apropiado cuando hay al menos 5 opciones de respuesta
- Criterios de ajuste (valores de buen ajuste entre paréntesis): CFI > .95; TLI > .95; RMSEA < .06; SRMR < .08
- Cálculo de versiones robustas: CFI robusto, TLI robusto, RMSEA robusto (Brosseau-Liard et al., 2012)
- Si ajuste inadecuado: examinación de índices de modificación por país
- Confiabilidad: coeficiente omega (ω)
3. Invarianza de medición (multigrupo):
- Método: AFC multigrupo con restricciones de igualdad secuenciales
- Invarianza métrica: restricciones en cargas factoriales
- Invarianza escalar: restricciones en interceptos
- Criterios de evaluación:
- Criterio estricto: Δχ² (cambio de chi-cuadrado no significativo)
- Criterio pragmático: ΔCFI robusto ≤ .01 (Cheung & Rensvold, 2002)
- Procedimiento adicional: Subsampling de Yoon y Lai (2018) con 10,000 replicaciones para controlar desequilibrio de tamaños de grupo
4. Modelo de respuesta graduada (IRT):
- Modelo de dos parámetros para ítems politómicos dentro del marco de teoría de respuesta al ítem
- Parámetros estimados: discriminación (a) para cada ítem; dificultad (b₁-b₄) para cada nivel de respuesta
- Los parámetros b indican el nivel del constructo latente (θ) en el que la probabilidad de seleccionar una opción de respuesta superior es 50%
- Gráficas de curvas de información del ítem para mostrar niveles de θ donde cada ítem posee mayor capacidad informativa
5. Análisis de validez:
- Correlaciones de Pearson entre puntuaciones PTQ-CPT y: sintomatología depresiva (PHQ-2), sintomatología ansiosa (GAD-2), confianza en habilidades clínicas (pregunta ad hoc)
- Intervalos de confianza al 95%
Software: R versión 4.3.0; paquetes: lavaan (0.6-16), semTools (0.5-6), mirt (1.39)
Resultados
Estadística Descriptiva a Nivel de Ítem
La mayoría de ítems mostró puntuaciones promedio alrededor de 1 a 2:
| Ítem | M | DE | Rango | Mayor Media | Menor Media |
|---|---|---|---|---|---|
| 1. Dudas constantes | 1.98 | 0.90 | Más alto | ||
| 2. No puedo dejar de preocuparme | 1.67 | 1.07 | |||
| 3. No puedo concentrarme | 0.95 | 0.97 | |||
| 4. Pensamientos repetitivos | 1.28 | 1.07 | |||
| 5. Me quedo atascado | 0.81 | 0.91 | |||
| 6. Mismas preguntas | 0.97 | 1.00 | |||
| 7. Pienso todo el tiempo | 0.97 | 1.00 | |||
| 8. No ayudan | 1.11 | 1.15 | |||
| 9. Inseguridad absorbe atención | 0.79 | 0.95 | Más bajo |
La mayoría de distribuciones mostró sesgo positivo leve a moderado (rango g₁ = 0.04 a 1.15), consistente con poblaciones clínicas con PNR moderado-bajo. Curtosis varió de -0.62 a 0.98.
Análisis Factorial Confirmatorio Unidimensional
Modelo inicial (sin modificación):
- χ²(27) = 273.56, p < .001
- CFI = .95; CFI robusto = .95
- TLI = .93; TLI robusto = .95
- RMSEA = .10; RMSEA robusto = .11
- SRMR = .04
Evaluación: Ajuste adecuado según la mayoría de índices aproximados, excepto RMSEA.
Examinación de índices de modificación: Indicó necesidad de permitir covariación residual entre ítems 1 y 2 (ambos relacionados con naturaleza intrusiva de pensamientos).
Modelo final (con correlación de errores entre ítems 1-2):
- χ²(26) = 234.20, p < .001
- CFI = .98; CFI robusto = .98
- TLI = .97; TLI robusto = .97
- RMSEA = .07; RMSEA robusto = .07
- SRMR = .03
Conclusión: Estructura unidimensional considerada modelo final.
Confiabilidad interna: ω = .92 (excelente)
Cargas factoriales estandarizadas (del modelo final):
- Ítem 1: .65
- Ítem 2: .73
- Ítem 3: .83
- Ítem 4: .83
- Ítem 5: .87 (más alta)
- Ítem 6: .77
- Ítem 7: .70
- Ítem 8: .81
- Ítem 9: .81
Invarianza de Medición Entre Países
Enfoque tradicional:
| Modelo | χ² | gl | p | CFI robusto | Δχ² | Δgl | p (Δχ²) | ΔCFI |
|---|---|---|---|---|---|---|---|---|
| 1. Configuracional | 163.28 | 78 | <.001 | .97 | - | - | - | - |
| 2. Métrica | 179.68 | 94 | <.001 | .97 | 14.46 | 16 | .565 | .001 |
| 3. Escalar | 214.63 | 110 | <.001 | .96 | 35.31 | 16 | .004 | -.007 |
Enfoque de Yoon y Lai (2018) con 10,000 replicaciones:
| Modelo | χ² | gl | p | CFI robusto | Δχ² | Δgl | p (Δχ²) | ΔCFI |
|---|---|---|---|---|---|---|---|---|
| 1. Configuracional | 136.71 | 78 | <.001 | .97 | - | - | - | - |
| 2. Métrica | 153.15 | 94 | <.001 | .97 | 15.52 | 16 | .487 | 0 |
| 3. Escalar | 180.79 | 110 | <.001 | .96 | 27.77 | 16 | .034 | -.006 |
Conclusiones sobre invarianza:
- Invarianza métrica: CONFIRMADA (p > .05 ambos enfoques; ΔCFI < .01). Las cargas factoriales no difieren significativamente entre países.
- Invarianza escalar:
- Criterio pragmático (ΔCFI < .01): SOPORTADA (ΔCFI = -.007 en enfoque tradicional; -.006 en Yoon-Lai)
- Criterio estricto (Δχ²): NO SOPORTADA (p = .004 enfoque tradicional; p = .034 Yoon-Lai)
Interpretación: Los autores concluyeron que la invarianza escalar se logró según el criterio pragmático más comúnmente utilizado, aunque el criterio estricto sugiere cierta varianza en los interceptos entre países.
Modelo de Respuesta Graduada (IRT)
Parámetros de discriminación (a) por ítem:
| Ítem | a | Interpretación |
|---|---|---|
| 5. Me quedo atascado | 3.97 | Mejor discriminación |
| 4. Pensamientos repetitivos | 3.26 | |
| 7. Pienso todo el tiempo | 2.91 | |
| 9. Inseguridad | 2.97 | |
| 6. Mismas preguntas | 2.64 | |
| 2. Preocupación | 2.41 | |
| 3. Concentración | 3.15 | |
| 8. No ayudan | 2.19 | |
| 1. Dudas constantes | 2.02 | Menor discriminación |
Parámetros de dificultad (b) indicativos:
- Ítem más "fácil" (requiere menor nivel de PNR): Ítem 2 (b₁ = -1.38)
- Ítem más "difícil" (requiere mayor nivel de PNR): Ítem 6 (b₄ = 2.80)
Curvas de información del ítem (Figura 2):
- Ítem 5 mostró mayor capacidad informativa, especialmente en niveles más altos del constructo RNT (θ > 1)
- Ítems 2 e ítem 1 proporcionan mediciones de mayor calidad en el extremo inferior de la distribución del constructo (θ < -1)
- Otros ítems muestran patrones similares con cobertura informativa en rango medio
Evidencia de Validez: Correlaciones con Otras Variables
Correlaciones de Pearson bidireccionales con puntuaciones PTQ-CPT:
| Variable | r | IC 95% | Magnitud |
|---|---|---|---|
| Síntomas depresivos (PHQ-2) | .45 | [.37, .53] | Moderada positiva |
| Síntomas de ansiedad (GAD-2) | .56 | [.49, .64] | Moderada-alta positiva |
| Confianza en habilidades clínicas | -.58 | [-.64, -.52] | Moderada-alta negativa |
Interpretación: Mayores puntuaciones en PNR se asocian con mayor sintomatología depresiva y ansiosa, y con menor confianza en las propias habilidades clínicas. Estos patrones de asociación son teóricamente esperados y apoyan la validez de constructo del PTQ-CPT.
Discusión y Conclusiones
Hallazgos Principales
El estudio demostró que el PTQ-CPT posee una estructura unidimensional con un par de errores correlacionados que proporciona el mejor ajuste a los datos. Esta estructura se mantiene consistente entre los tres países latinoamericanos evaluados (Colombia, México, Perú). Los resultados son congruentes con la validación original de Dereix-Calonge et al. (2019b), que también encontró estructura unidimensional con buen ajuste y confiabilidad alfa > .90.
La principal diferencia en el presente estudio fue la necesidad de permitir errores correlacionados entre ítems 1 y 2. Aunque esto podría considerarse inicialmente como propiedad indeseable, el hecho de que esta modificación se haya observado independientemente en los tres países estudiados indica robustez y replicabilidad. Existe justificación conceptual: ambos ítems refieren la naturaleza intrusiva de los pensamientos.
Invarianza de Medición Transnacional
La confirmación de invarianza métrica indica que las cargas factoriales del PTQ-CPT son equivalentes entre países. Esto respalda que el constructo fundamental (PNR relacionado con práctica clínica) se mide de manera equivalente en Colombia, México y Perú.
La invarianza escalar, aunque no alcanzó el criterio estricto (Δχ²), fue soportada por el criterio pragmático ampliamente utilizado en la literatura (ΔCFI < .01). Esto sugiere que las comparaciones de medias entre países pueden interpretarse con cierta cautela, aunque se recomienda considerar que puede haber varianza en los interceptos.
Capacidad Informativa de Ítems
El ítem 5 ("Me quedo atascado en mis preocupaciones acerca de la práctica clínica y no puedo concentrarme en otras actividades") demostró la mejor discriminación (a = 3.97) y mayor capacidad informativa en niveles elevados del constructo. Este ítem es especialmente útil para diferenciar entre individuos con alto PNR. Los ítems 1 y 2 proporcionan mejor información en el extremo bajo, sugiriendo cobertura completa del rango del constructo.
Validez de Constructo
Las correlaciones esperadas con depresión (r = .45), ansiedad (r = .56) y confianza clínica (r = -.58) fueron encontradas, confirmando la validez de constructo. El PNR medido por el PTQ-CPT se relaciona positivamente con síntomas emocionales negativos y negativamente con confianza profesional, patrones esperados en la literatura sobre pensamiento perseverativo en poblaciones clínicas.
Limitaciones
- Muestra de conveniencia: Uso de muestra no probabilística puede limitar generalización a otras poblaciones o contextos.
- Sesgo de auto-selección: Participación voluntaria podría introducir sesgos, particularmente relacionados con disponibilidad de tecnología y acceso a internet.
- Medidas de auto-reporte: Susceptibilidad a sesgo de método común e interpretación subjetiva (PTQ-CPT, PHQ-2, GAD-2).
- Diseño transversal: Precluye inferencias causales; no permite establecer relaciones temporales o predictivas entre PNR y otras variables.
- Ausencia de diagnóstico clínico: Las medidas de síntomas depresivos y ansiosos provienen de auto-reporte, no de evaluación diagnóstica clínica estructurada.
- Pregunta ad hoc: La medida de confianza en habilidades clínicas no fue validada previamente.
Importancia y Contribución
Este estudio realiza una contribución importante al campo de la medición transcultural del pensamiento negativo repetitivo en profesionales de la psicología clínica latinoamericana. El PTQ-CPT demostró funcionar equivalentemente a través de tres países (Colombia, México, Perú), lo que valida su uso en contextos de investigación transcultural y práctica clínica en la región. La demostración de invarianza métrica y escalar a través de contextos nacionales diferentes es metodológicamente importante, permitiendo comparaciones válidas de puntuaciones de pensamiento negativo repetitivo entre profesionales en diferentes contextos. El estudio contribuye al campo de la psicología clínica latinoamericana proporcionando una herramienta válida y confiable para evaluar este proceso transdiagnóstico en profesionales y estudiantes de psicología clínica, facilitando tanto investigación como aplicación clínica en poblaciones hispanohablantes.
Conclusiones Finales
El PTQ-CPT demostró propiedades psicométricas adecuadas e invarianza de medición transnacional en profesionales y estudiantes de psicología clínica de Colombia, México y Perú. El instrumento mostró:
- Excelente consistencia interna (ω = .92)
- Estructura unidimensional replicable
- Correlaciones significativas con variables teóricamente relevantes
- Funcionamiento equivalente entre países según criterio pragmático de invarianza
Es una herramienta confiable y válida para evaluar Pensamiento Negativo Repetitivo en contextos de práctica clínica latinoamericanos, apoyando su uso en investigación transcultural y práctica clínica. Los hallazgos sientan base para futuras investigaciones longitudinales sobre implicaciones del PNR en bienestar emocional y desempeño clínico de profesionales en formación y ejercicio.
Este resumen ha sido generado con Inteligencia Artificial y podría contener errores. Se recomienda consultar el artículo original.