Cross-national measurement invariance of the Perseverative Thinking Questionnaire for clinical psychology professionals and trainees

Título

Invarianza de medición transnacional del Cuestionario de Pensamiento Perseverativo para profesionales y estudiantes de psicología clínica

Referencia Completa

Ccoyllo-Gonzalez, L., Blancas-Guillen, J., Salazar-Alvarez, G., Valencia, P. D., & Ruiz, F. J. (2025). Cross-national measurement invariance of the Perseverative Thinking Questionnaire for clinical psychology professionals and trainees. Revista Latinoamericana de Psicología, 57, 89-97. https://doi.org/10.14349/rlp.2025.v57.9

Tipo de Estudio

Estudio instrumental de validación psicométrica enfocado en la invarianza de medición transnacional (multigrupo) del PTQ-CPT en tres países latinoamericanos. N total = 475 participantes (Colombia n=101; México n=253; Perú n=121).

Contexto y Objetivos

Los profesionales y estudiantes de psicología clínica enfrentan estrés laboral significativo derivado de la exposición a sufrimiento ajeno, manejo de casos complejos y presión por mantener alianzas terapéuticas efectivas. Esta exposición puede conducir a Pensamiento Negativo Repetitivo (PNR), manifestado como dudas persistentes sobre la propia competencia, preocupaciones sobre decisiones clínicas y cuestionamientos sobre la efectividad de las intervenciones. El PNR se considera un proceso transdiagnóstico, factor común de riesgo para trastornos emocionales como ansiedad y depresión, y se asocia con mayor agotamiento emocional, menor satisfacción laboral, deficiencias en el funcionamiento cognitivo y en la calidad de las decisiones clínicas.

El Cuestionario de Pensamiento Perseverativo para Estudiantes de Psicología Clínica (PTQ-CPT) fue desarrollado por Dereix-Calonge et al. (2019b) como adaptación específica del PTQ original (Ehring et al., 2011) para medir PNR en esta población. Aunque estudios previos demostraron que el PTQ-CPT es una herramienta prometedora, no se han realizado análisis psicométricos comprensivos posteriores a 2019, ni se ha examinado si funciona de manera equivalente en diferentes contextos culturales latinoamericanos.

Objetivo: Examinar las propiedades psicométricas del PTQ-CPT y su invarianza de medición transnacional en profesionales y estudiantes de psicología clínica de Colombia, México y Perú, con énfasis en evaluar si la estructura factorial y el funcionamiento del instrumento son equivalentes entre países.

Método

Participantes

Muestra no probabilística de 475 participantes (76.4% mujeres; 23.6% hombres) distribuidos así:

México: 253 participantes (53.3%)
Perú: 121 participantes (25.5%)
Colombia: 101 participantes (21.3%)

Demografía laboral:

24.4% estudiantes de pregrado en psicología clínica
75.6% profesionales clínicos licenciados
84% involucrados en intervenciones clínicas
42.2% en actividades de evaluación psicológica
41.2% en promoción de la salud y prevención
26.5% en triaje y orientación

Supervisión clínica semanal:

43.8% sin supervisión
41.7% de 0 a 2 horas
9.3% de 3 a 5 horas
5.3% más de 5 horas

Contexto de práctica: 67.4% sector privado; 17.6% sector público; 14.9% ambos sectores.

El tamaño muestral fue determinado mediante simulación de Monte Carlo basada en parámetros de Dereix-Calonge et al. (2019b), indicando necesidad de al menos 100 participantes por grupo país para analizar invarianza de medición.

Instrumento Evaluado: Perseverative Thinking Questionnaire for Clinical Psychology Training (PTQ-CPT)

Versión y adaptación: Dereix-Calonge et al. (2019b); versión adaptada para el presente estudio.

Estructura: 9 ítems que miden pensamiento perseverativo específicamente relacionado con práctica clínica. Escala de respuesta: 0-4 (desde "nunca" hasta "casi siempre").

Modificación realizada: El ítem 5 fue modificado de "no puedo concentrarme en mis estudios" a "no puedo concentrarme en otras actividades" para aplicabilidad tanto en estudiantes como en profesionales licenciados.

Confiabilidad reportada en validación original: Alfa de Cronbach = .93; estructura unifactorial.

Evidencia de validez anterior:

Correlaciones positivas con experiencia de evitación, síntomas emocionales y obstrucción de valores
Correlaciones negativas moderadas con satisfacción vital y progreso de valores
En estudios longitudinales posteriores, el PTQ-CPT predijo mejor que el PTQ original el aumento de síntomas emocionales en estudiantes de psicología clínica
Las puntuaciones mediaron el efecto de intervenciones basadas en Terapia de Aceptación y Compromiso (ACT) en la reducción de síntomas emocionales

Otros Instrumentos de Medida

Patient Health Questionnaire-2 (PHQ-2; Kroenke et al., 2003):

Mide síntomas depresivos en últimas dos semanas
2 ítems, escala Likert 0-3
Consistencia interna en muestras latinoamericanas: ω = .86-.89 (Colombia, México, Perú)
Evidencia de invarianza de medición entre estos países

Generalised Anxiety Disorder Scale-2 (GAD-2; Kroenke et al., 2007):

Evalúa síntomas principales de ansiedad en últimas dos semanas
2 ítems, respuestas Likert 0-3 (0 a 6 total)
Consistencia interna en muestras latinoamericanas: ω = .87-.88 (Colombia, México, Perú)
Evidencia de invarianza de medición entre estos países

Pregunta Ad Hoc de Confianza en Habilidades Clínicas:

Desarrollada específicamente para este estudio
Mide confianza percibida en habilidades clínicas como psicólogo o estudiante de psicología
Escala de respuesta 0-10 ("nada seguro" a "totalmente seguro")

Procedimiento

Recopilación de datos: Encuesta digital mediante Google Forms (marzo-mayo 2022) Coordinación: Asociaciones, instituciones, docentes y estudiantes de Perú, México y Colombia facilitaron difusión a través de redes sociales Consentimiento: Formulario incluyó sección de consentimiento informado explicando objetivos, naturaleza voluntaria y anonimato Aprobación ética: Comité de ética e Investigación de la Escuela de Psicología de la Universidad Autónoma del Perú (26 de junio de 2023)

Análisis de Datos

1. Estadística descriptiva: Examinadas a nivel de ítem (media, desviación estándar, sesgo, curtosis, distribución de opciones de respuesta).

2. Análisis factorial confirmatorio (AFC):

Método: Variante robusta de máxima verosimilitud (MLR)
Justificación: Apropiado cuando hay al menos 5 opciones de respuesta
Criterios de ajuste (valores de buen ajuste entre paréntesis): CFI > .95; TLI > .95; RMSEA < .06; SRMR < .08
Cálculo de versiones robustas: CFI robusto, TLI robusto, RMSEA robusto (Brosseau-Liard et al., 2012)
Si ajuste inadecuado: examinación de índices de modificación por país
Confiabilidad: coeficiente omega (ω)

3. Invarianza de medición (multigrupo):

Método: AFC multigrupo con restricciones de igualdad secuenciales
Invarianza métrica: restricciones en cargas factoriales
Invarianza escalar: restricciones en interceptos
Criterios de evaluación:
- Criterio estricto: Δχ² (cambio de chi-cuadrado no significativo)
- Criterio pragmático: ΔCFI robusto ≤ .01 (Cheung & Rensvold, 2002)
Procedimiento adicional: Subsampling de Yoon y Lai (2018) con 10,000 replicaciones para controlar desequilibrio de tamaños de grupo

4. Modelo de respuesta graduada (IRT):

Modelo de dos parámetros para ítems politómicos dentro del marco de teoría de respuesta al ítem
Parámetros estimados: discriminación (a) para cada ítem; dificultad (b₁-b₄) para cada nivel de respuesta
Los parámetros b indican el nivel del constructo latente (θ) en el que la probabilidad de seleccionar una opción de respuesta superior es 50%
Gráficas de curvas de información del ítem para mostrar niveles de θ donde cada ítem posee mayor capacidad informativa

5. Análisis de validez:

Correlaciones de Pearson entre puntuaciones PTQ-CPT y: sintomatología depresiva (PHQ-2), sintomatología ansiosa (GAD-2), confianza en habilidades clínicas (pregunta ad hoc)
Intervalos de confianza al 95%

Software: R versión 4.3.0; paquetes: lavaan (0.6-16), semTools (0.5-6), mirt (1.39)

Resultados

Estadística Descriptiva a Nivel de Ítem

La mayoría de ítems mostró puntuaciones promedio alrededor de 1 a 2:

Ítem	M	DE	Rango
1. Dudas constantes	1.98	0.90	Más alto
2. No puedo dejar de preocuparme	1.67	1.07
3. No puedo concentrarme	0.95	0.97
4. Pensamientos repetitivos	1.28	1.07
5. Me quedo atascado	0.81	0.91
6. Mismas preguntas	0.97	1.00
7. Pienso todo el tiempo	0.97	1.00
8. No ayudan	1.11	1.15
9. Inseguridad absorbe atención	0.79	0.95	Más bajo

La mayoría de distribuciones mostró sesgo positivo leve a moderado (rango g₁ = 0.04 a 1.15), consistente con poblaciones clínicas con PNR moderado-bajo. Curtosis varió de -0.62 a 0.98.

Análisis Factorial Confirmatorio Unidimensional

Modelo inicial (sin modificación):

χ²(27) = 273.56, p < .001
CFI = .95; CFI robusto = .95
TLI = .93; TLI robusto = .95
RMSEA = .10; RMSEA robusto = .11
SRMR = .04

Evaluación: Ajuste adecuado según la mayoría de índices aproximados, excepto RMSEA.

Examinación de índices de modificación: Indicó necesidad de permitir covariación residual entre ítems 1 y 2 (ambos relacionados con naturaleza intrusiva de pensamientos).

Modelo final (con correlación de errores entre ítems 1-2):

χ²(26) = 234.20, p < .001
CFI = .98; CFI robusto = .98
TLI = .97; TLI robusto = .97
RMSEA = .07; RMSEA robusto = .07
SRMR = .03

Conclusión: Estructura unidimensional considerada modelo final.

Confiabilidad interna: ω = .92 (excelente)

Cargas factoriales estandarizadas (del modelo final):

Ítem 1: .65
Ítem 2: .73
Ítem 3: .83
Ítem 4: .83
Ítem 5: .87 (más alta)
Ítem 6: .77
Ítem 7: .70
Ítem 8: .81
Ítem 9: .81

Invarianza de Medición Entre Países

Enfoque tradicional:

Modelo	χ²	gl	p	CFI robusto	Δχ²	Δgl	p (Δχ²)	ΔCFI
1. Configuracional	163.28	78	<.001	.97	-	-	-	-
2. Métrica	179.68	94	<.001	.97	14.46	16	.565	.001
3. Escalar	214.63	110	<.001	.96	35.31	16	.004	-.007

Enfoque de Yoon y Lai (2018) con 10,000 replicaciones:

Modelo	χ²	gl	p	CFI robusto	Δχ²	Δgl	p (Δχ²)	ΔCFI
1. Configuracional	136.71	78	<.001	.97	-	-	-	-
2. Métrica	153.15	94	<.001	.97	15.52	16	.487	0
3. Escalar	180.79	110	<.001	.96	27.77	16	.034	-.006

Conclusiones sobre invarianza:

Invarianza métrica: CONFIRMADA (p > .05 ambos enfoques; ΔCFI < .01). Las cargas factoriales no difieren significativamente entre países.
Invarianza escalar:
- Criterio pragmático (ΔCFI < .01): SOPORTADA (ΔCFI = -.007 en enfoque tradicional; -.006 en Yoon-Lai)
- Criterio estricto (Δχ²): NO SOPORTADA (p = .004 enfoque tradicional; p = .034 Yoon-Lai)

Interpretación: Los autores concluyeron que la invarianza escalar se logró según el criterio pragmático más comúnmente utilizado, aunque el criterio estricto sugiere cierta varianza en los interceptos entre países.

Modelo de Respuesta Graduada (IRT)

Parámetros de discriminación (a) por ítem:

Ítem	a	Interpretación
5. Me quedo atascado	3.97	Mejor discriminación
4. Pensamientos repetitivos	3.26
7. Pienso todo el tiempo	2.91
9. Inseguridad	2.97
6. Mismas preguntas	2.64
2. Preocupación	2.41
3. Concentración	3.15
8. No ayudan	2.19
1. Dudas constantes	2.02	Menor discriminación

Parámetros de dificultad (b) indicativos:

Ítem más "fácil" (requiere menor nivel de PNR): Ítem 2 (b₁ = -1.38)
Ítem más "difícil" (requiere mayor nivel de PNR): Ítem 6 (b₄ = 2.80)

Curvas de información del ítem (Figura 2):

Ítem 5 mostró mayor capacidad informativa, especialmente en niveles más altos del constructo RNT (θ > 1)
Ítems 2 e ítem 1 proporcionan mediciones de mayor calidad en el extremo inferior de la distribución del constructo (θ < -1)
Otros ítems muestran patrones similares con cobertura informativa en rango medio

Evidencia de Validez: Correlaciones con Otras Variables

Correlaciones de Pearson bidireccionales con puntuaciones PTQ-CPT:

Variable	r	IC 95%	Magnitud
Síntomas depresivos (PHQ-2)	.45	[.37, .53]	Moderada positiva
Síntomas de ansiedad (GAD-2)	.56	[.49, .64]	Moderada-alta positiva
Confianza en habilidades clínicas	-.58	[-.64, -.52]	Moderada-alta negativa

Interpretación: Mayores puntuaciones en PNR se asocian con mayor sintomatología depresiva y ansiosa, y con menor confianza en las propias habilidades clínicas. Estos patrones de asociación son teóricamente esperados y apoyan la validez de constructo del PTQ-CPT.

Discusión y Conclusiones

Hallazgos Principales

El estudio demostró que el PTQ-CPT posee una estructura unidimensional con un par de errores correlacionados que proporciona el mejor ajuste a los datos. Esta estructura se mantiene consistente entre los tres países latinoamericanos evaluados (Colombia, México, Perú). Los resultados son congruentes con la validación original de Dereix-Calonge et al. (2019b), que también encontró estructura unidimensional con buen ajuste y confiabilidad alfa > .90.

La principal diferencia en el presente estudio fue la necesidad de permitir errores correlacionados entre ítems 1 y 2. Aunque esto podría considerarse inicialmente como propiedad indeseable, el hecho de que esta modificación se haya observado independientemente en los tres países estudiados indica robustez y replicabilidad. Existe justificación conceptual: ambos ítems refieren la naturaleza intrusiva de los pensamientos.

Invarianza de Medición Transnacional

La confirmación de invarianza métrica indica que las cargas factoriales del PTQ-CPT son equivalentes entre países. Esto respalda que el constructo fundamental (PNR relacionado con práctica clínica) se mide de manera equivalente en Colombia, México y Perú.

La invarianza escalar, aunque no alcanzó el criterio estricto (Δχ²), fue soportada por el criterio pragmático ampliamente utilizado en la literatura (ΔCFI < .01). Esto sugiere que las comparaciones de medias entre países pueden interpretarse con cierta cautela, aunque se recomienda considerar que puede haber varianza en los interceptos.

Capacidad Informativa de Ítems

El ítem 5 ("Me quedo atascado en mis preocupaciones acerca de la práctica clínica y no puedo concentrarme en otras actividades") demostró la mejor discriminación (a = 3.97) y mayor capacidad informativa en niveles elevados del constructo. Este ítem es especialmente útil para diferenciar entre individuos con alto PNR. Los ítems 1 y 2 proporcionan mejor información en el extremo bajo, sugiriendo cobertura completa del rango del constructo.

Validez de Constructo

Las correlaciones esperadas con depresión (r = .45), ansiedad (r = .56) y confianza clínica (r = -.58) fueron encontradas, confirmando la validez de constructo. El PNR medido por el PTQ-CPT se relaciona positivamente con síntomas emocionales negativos y negativamente con confianza profesional, patrones esperados en la literatura sobre pensamiento perseverativo en poblaciones clínicas.

Limitaciones

Muestra de conveniencia: Uso de muestra no probabilística puede limitar generalización a otras poblaciones o contextos.
Sesgo de auto-selección: Participación voluntaria podría introducir sesgos, particularmente relacionados con disponibilidad de tecnología y acceso a internet.
Medidas de auto-reporte: Susceptibilidad a sesgo de método común e interpretación subjetiva (PTQ-CPT, PHQ-2, GAD-2).
Diseño transversal: Precluye inferencias causales; no permite establecer relaciones temporales o predictivas entre PNR y otras variables.
Ausencia de diagnóstico clínico: Las medidas de síntomas depresivos y ansiosos provienen de auto-reporte, no de evaluación diagnóstica clínica estructurada.
Pregunta ad hoc: La medida de confianza en habilidades clínicas no fue validada previamente.

Importancia y Contribución

Este estudio realiza una contribución importante al campo de la medición transcultural del pensamiento negativo repetitivo en profesionales de la psicología clínica latinoamericana. El PTQ-CPT demostró funcionar equivalentemente a través de tres países (Colombia, México, Perú), lo que valida su uso en contextos de investigación transcultural y práctica clínica en la región. La demostración de invarianza métrica y escalar a través de contextos nacionales diferentes es metodológicamente importante, permitiendo comparaciones válidas de puntuaciones de pensamiento negativo repetitivo entre profesionales en diferentes contextos. El estudio contribuye al campo de la psicología clínica latinoamericana proporcionando una herramienta válida y confiable para evaluar este proceso transdiagnóstico en profesionales y estudiantes de psicología clínica, facilitando tanto investigación como aplicación clínica en poblaciones hispanohablantes.

Conclusiones Finales

El PTQ-CPT demostró propiedades psicométricas adecuadas e invarianza de medición transnacional en profesionales y estudiantes de psicología clínica de Colombia, México y Perú. El instrumento mostró:

Excelente consistencia interna (ω = .92)
Estructura unidimensional replicable
Correlaciones significativas con variables teóricamente relevantes
Funcionamiento equivalente entre países según criterio pragmático de invarianza

Es una herramienta confiable y válida para evaluar Pensamiento Negativo Repetitivo en contextos de práctica clínica latinoamericanos, apoyando su uso en investigación transcultural y práctica clínica. Los hallazgos sientan base para futuras investigaciones longitudinales sobre implicaciones del PNR en bienestar emocional y desempeño clínico de profesionales en formación y ejercicio.