La
evaluación de la personalidad con metodologías
psicométricas muestra, como toda evaluación de
cualquier otro tipo de variables psicológicas en otros
dominios, una constante evolución. Tales cambios se sustentan
en razones teóricas y prácticas. En primer término,
las modificaciones que se imponen provienen de nuevas evidencias
empíricas recabadas sobre los modelos que sustentan los
instrumentos de evaluación. Esas nuevas evidencias robustecen
o debilitan las hipótesis teóricas que los modelos
emplean para explicar los comportamientos individuales en relación
con los rasgos de la personalidad y producen, así, la
preeminencia de ciertos modelos sobre otros. En segundo lugar, el
diseño de los instrumentos debe adaptarse gradualmente a las
necesidades, variables en el tiempo, que los objetivos de la
evaluación en cada ámbito de trabajo persiguen. En
tercer término, pero no por ello menos importante, también
cambia el modo en que se valoran las fuentes de información
que se adicionan a los tests, tanto desde el exterior -como
materiales de entrevistas, información proveniente de otras
medidas aplicadas más datos aportados por informantes clave-
cuanto inherentes y complementarias a aquellas -como son las escalas
de validez que los instrumentos para evaluar la personalidad suelen
incluir, y a las que se hará referencia más adelante-
(International Test Commission, 2015).
La
Argentina no es ajena a estos cambios -aunque a veces se pongan en
acto algo más tarde que en países con una prolífica
industria de tests- y las necesidades de cada ámbito aplicado
deben compatibilizarse con los desarrollos teóricos vigentes,
los criterios diagnósticos consensuados y los atributos
técnicos que, según normativas internacionales y nuevos
métodos de análisis, se buscan en las pruebas que miden
las distintas dimensiones que componen la personalidad humana. Tales
tendencias globalizadas, junto con algunas viñetas prácticas
a tener en cuenta a la hora de realizar evaluaciones clínicas,
laborales y forenses intentarán, en este capítulo,
mostrar al lector hacia dónde se mueve esta especialidad.
Modelos
para evaluar la personalidad. Una breve reseña
Los
modelos que intentan explicar la personalidad proponen un análisis
sistemático de las especificidades individuales que, en
términos de patrones comportamentales, cogniciones y afectos,
manifiestan las personas (Castro Solano, 2015). No se incluirá
en este capítulo una definición de personalidad ni una
colección de aquellas más importantes puesto que ello
escapa a los objetivos del trabajo, y en virtud de que
deliberadamente se dejan tales definiciones a criterio del lector con
el fin de aludir a cualquier desarrollo teórico posible.
Los
tres abordajes teórico-metodológicos clasificados a
partir de una de las categorizaciones más usuales son el
clínico, idiográfico u holístico, el
experimental y el correlacional o de los rasgos (Pervin, 2000). El
abordaje clínico o idiográfico trabaja mayoritariamente
con análisis de casos únicos, y apunta a identificar
las singularidades o unicidades que hacen a cada persona irrepetible
en el marco de la comprensión de los principios generales de
funcionamiento que son comunes a todos los seres humanos. En esta
corriente se ubican autores clásicos como Freud (1933) o
Rogers (1980), cuyas teorizaciones cobraron mayor auge durante la
primera mitad del siglo pasado. El enfoque experimental busca,
mediante una metodología controlada, formular las leyes
universales que rigen el comportamiento, con especial énfasis
en la aplicación de modelos sobre aprendizaje, psicología
social y psicología cognitiva (Bandura, 1977; Dollard, Miller,
Doob, Mowrer y Sears, 1939; Mischel, 1968). La metodología
correlacional o rasguista, por último, se centra en la
discriminación de conjuntos de datos que permitan aislar
aquellos factores que diferencian a las personas y que, a la vez, se
dirijan a describir la tendencia a comportarse de un modo o de otro
en ciertos contextos generales y bajo determinadas circunstancias.
Este enfoque, también llamado factorial, se sustentaba
inicialmente en un abordaje léxico. Ello implica que, sobre la
base de las respuestas que diversas muestras de individuos brindaban
acerca de sí mismos en instrumentos en modalidad autorreporte
o en listados de adjetivos destinados a la autodescripción
personológica, el objetivo se centraba en aislar factores o
dimensiones que indicaran regularidades en las respuestas dadas a los
distintos ítems que integraban cada autoinforme. Resultado de
esta metodología léxico-factorial es, por ejemplo, el
Modelo de los Cinco Grandes Factores de la Personalidad o Big
Five
(Cattell, Cattell y Cattell, 1993; Costa y McCrae, 1976, 1980, 1985,
1990; Tupes y Christal, 1961) que, hace ya varias décadas,
marca tendencia en cuanto a evaluación de la personalidad.
Según
otra categorización vigente los abordajes para el estudio de
la personalidad pueden ser, en términos generales, mono o
politaxonómicos. Estas categorías se combinan con la
dicotomía empírico/teórico y ello da lugar a
cuatro enfoques: monotaxonómico-empírico,
politaxonómico-empírico, monotaxonómico-teórico
y politaxonómico-teórico (Millon, 1996). El primero
explica las diferencias individuales mediante un número mínimo
o acotado de dimensiones obtenidas por medio de escalas para evaluar
la personalidad antes que a partir de la formulación de nuevos
modelos e hipótesis teóricas; es decir, se trata de un
abordaje parsimonioso que hace hincapié en hallazgos
empíricos, fundamentalmente sustentado en una metodología
factorial que apunta, por definición, a la reducción de
datos. Autores señeros de esta línea han sido, por
caso, Eysenck (1960) y Cattell (1965). El abordaje
prolitaxonómico-empírico también se sustenta en
métodos de factorización aplicados a medidas obtenidas
mediante instrumentos, y busca el refinamiento de esas herramientas
sin atender a hipótesis teóricas, en tanto que asume el
isomorfismo entre el comportamiento y los indicadores autoinformados
sobre aquel. Trabaja fundamentalmente desde una base léxica
que afirma que los adjetivos que las personas emplean para
autodescribirse son capaces de dar cuenta de las dimensiones latentes
que describen la personalidad y sus variaciones. El modelo Big Five
(Costa y McCrae, 1985) encarna el paradigma de esta metodología.
El enfoque monotaxonómico-teórico busca, mediante
desarrollos que incluyen pocas unidades de análisis, construir
modelos a través de la formulación de hipótesis
teóricas acerca de la etiología patológica. Con
su interés centrado en lo clínico, se trata, en su
mayoría, de abordajes dinámicos tales como los de Kohut
(1971) o Kernberg (1984), que se dirigen a una explicación
basada en un único eje explicativo teórico. Finalmente,
los enfoques politaxonómico-teóricos también se
dedican a la formulación de modelos, pero incluyen en ellos la
categorización de dimensiones funcionales y disfuncionales de
la personalidad (Castro Solano, 2015). Los desarrollos de Millon
sobre estilos y trastornos de personalidad, respectivamente, son los
ejemplos más salientes de esta línea.
Hasta
aquí, se ha realizado un sucinto y muy general racconto
de los principales modelos que subyacen a la evaluación
personológica. Como fácilmente puede colegirse a la luz
de la lectura de lo anterior, cada enfoque implica, asimismo, una
metodología distintiva que es, por definición,
inseparable de cada raigambre teórica. En el próximo
apartado se hará referencia, en concreto, a la evaluación
de la personalidad en relación con los instrumentos diseñados
para ese fin.
Instrumentos
psicométricos de evaluación de la personalidad.
Clasificaciones actuales
La
herramienta que inmediatamente aparece, ya desde una perspectiva
intuitiva y, de hecho, la más empleada en la evaluación
de la personalidad, es la entrevista. Ella acerca al evaluador de
modo directo a la problemática e historia personal, a las
circunstancias vitales del evaluado y al grado de afectación
que producen los síntomas, si los hubiere. Asimismo, permite
vincular esta información con el objetivo de la evaluación,
motivo de la consulta, y ámbito de trabajo en el que la
evaluación se solicita. Por otro lado, es el instrumento que
más y mejor información aporta en cuanto a
observaciones de comportamiento puesto que la interacción
planteada en situación de entrevista supera cualquier otra
interacción posible con otra clase de medidas de personalidad
(Fernández Liporace, 2015a).
Pese
a estas ventajas, existe consenso internacional en cuanto a una serie
de desventajas inherentes a las entrevistas. En primer lugar, se
plantean escollos conceptuales sumamente importantes como la falta de
acuerdo sobre las definiciones y descripciones de los trastornos
clínicos que cada modelo hipotetiza por una parte y que cada
evaluador toma en cuenta, por la otra. En segundo término,
pero en el mismo sentido antes planteado, se cuestiona cuáles
son los indicadores patognomónicos y adicionales que cada
evaluador emplea a la hora de poner en juego los criterios
diagnósticos que usa, que no se hallan en todos los casos
libres de influencias culturales y/o de sesgos personales
introducidos por el propio entrevistador (International Test
Commission, 2015).
Desde
la arista metodológica se critica la falta de estandarización
de la metodología de entrevista que, por sus características,
hace que cada evaluador la maneje de un modo diferente y, a la vez,
que cada entrevistado imprima temáticas y estilos de respuesta
– defensividad, simulación, respuestas aquiescentes o no
aquiescentes, libretos culturales que llevan al fenómeno de
deseabilidad social, distorsiones deliberadas en términos de
exageración o minimización de síntomas,
inconsistencia, entre otros estilos - que arborizan al infinito las
posibilidades de estandarizar procedimientos. Claramente, esta
dificultad para acceder a estándares atenta directamente
contra la validez de los resultados obtenidos. Más allá
de que las entrevistas dirigidas intenten cubrir este escollo y de
que, en buena parte, lo logren, la variedad y ampliación de
temáticas y la diversidad de estilos de los entrevistadores no
logran solucionar estos puntos críticos de modo acabado
(American Psychiatric Association, 1980).
Por
lo anterior, la evaluación psicológica se ha planteado
la necesidad y conveniencia de complementar la información
brindada por las entrevistas con medidas de otro tipo, en virtud de
minimizar las dificultades de aquellas y de complementar información
aportada desde otras fuentes que apunten a la evaluación de
los mismos atributos. De esta manera, los instrumentos de autoinforme
se presentan como la alternativa psicométrica más
empleada en la actualidad.
Se
trata de tests que incluyen una variedad de dimensiones de la
personalidad, de acuerdo con el modelo que se operacionalice en cada
una. En general, sus ítems adquieren el formato de
afirmaciones -en este caso se habla de inventarios-, preguntas -aquí
se los nombra como cuestionarios- o listados de adjetivos
-checklists-
que apuntan a la autodescripción. Cualquiera de estos formatos
de medidas se responde mediante escalas ordinales de tipo Likert o
bien, dicotómicas, según se busque que el examinado
disponga de opciones intermedias o se quiera a forzar su decisión
frente a alternativas radicalmente opuestas. Dado que pueden ser
autoadministrables, son aptas para su aplicación individual o
colectiva, por lo que potencialmente permiten la recolección
de una gran cantidad de datos en poco tiempo y en un mismo momento,
característica que también las vuelve especialmente
aptas para tareas de investigación y para evaluaciones
comunitarias en el marco de actividades de prevención (Cohen,
Swerdlik y Sturman, 2012).
Por
tratarse de instrumentos psicométricos, admiten una diversidad
de modelos teóricos como base para la operacionalización
del constructo que intentan medir. En términos generales, y
justamente porque la personalidad es un concepto de alta complejidad
compuesto por dimensiones que la mayoría de los modelos
consideran independientes, permiten obtener tantas puntuaciones
independientes como dimensiones incluyan. Sin embargo, cuando se
habla de facetas y de factores de primero y segundo orden surge la
posibilidad de combinar puntajes. En otros casos, los puntajes que
resultan de la combinación de dimensiones o grupos de ítems
se destinan a proporcionar un resumen global del comportamiento de
las dimensiones o bien de la sintomatología -si es que el test
se dirige a medirla- en términos de gravedad, cantidad o
malestar experimentado, por ejemplo-.
De
todos modos, para comprender mejor sus distintas variantes, resulta
útil recurrir a una serie de criterios clasificatorios de los
autorreportes que sirven para elegir el más conveniente en
cada situación evaluativa. Ya se los ha distinguido en cuanto
a formato de ítems -inventarios, checklists
y cuestionarios- y en cuanto a su modalidad de respuesta -ordinal o
Likert y dicotómica-. También es importante atender a
su diseño, a la metodología empleada para su análisis
de datos, y a los objetivos de la evaluación.
En
cuanto a su diseño, se clasifican en escalas con base racional
y empírica. La base racional supone que los investigadores que
diseñan la prueba se basan en un modelo teórico
referido a un constructo, cuyas dimensiones se operacionalizan en
ítems que luego se agrupan en subtests, subescalas o en la
escala general, según corresponda. El diseño empírico
implica la salida a campo
de los investigadores que, al margen de las hipótesis teóricas
o bien a la luz de ellas, buscan en especialistas y en individuos
concretos la descripción fáctica del fenómeno
que buscan medir mediante el test que van a desarrollar (Anastasi y
Urbina, 1998). En general se trabaja mediante entrevistas en
profundidad, grupos focales, encuestas u otras vías para
recabar información detallada sobre las dimensiones que deben
operacionalizarse según el criterio de los especialistas y/o
de las personas que poseen tal o cual atributo a evaluarse, tal como
cierta configuración sintomatológica o alguna
característica psicológica dada, de cualquier tipo o
naturaleza. Debe destacarse que los criterios de diseño
racional y empírico son independientes pero no necesariamente
excluyentes. De hecho, algunos tests combinan el empleo de ambos,
como por ejemplo los MMPI (Ben Porath y Tellegen, 2009; Butcher,
Dahlstrom, Graham, Tellegen y Kaemmer, 1989; Hathaway y Mc Kinley,
1942).
Categorizar
los instrumentos de personalidad según el método de
análisis de datos que han empleado los psicometristas incluye
dos grupos posibles. Ellos son los métodos de factorización
y de grupos contrastados. En el primer caso, el análisis
factorial se emplea tanto para estudiar la dimensionalidad del modelo
operacionalizado así como para aportar evidencias de validez
de constructo -de tipo exploratorio y confirmatorio y, asimismo,
convergente y discriminante- referidas a los resultados arrojados por
la escala en una muestra o población determinadas (Hair,
Black, Babin, Anderson y Tatham, 2010). En el segundo se busca, por
un lado, analizar la capacidad del test para discriminar entre grupos
con y sin cierta sintomatología y que posean tal o cual rasgo
de manera pronunciada o sutil y, por el otro, poner a prueba en el
plano empírico las hipótesis teóricas
fundamentales del modelo que describe el constructo que se
operacionaliza por la otra. Tampoco se trata de categorías
excluyentes, puesto que los instrumentos admiten ambos tipos de
análisis y, de hecho, la psicometría estimula que se
proceda a realizar todos los estudios factibles (Cohen, Swerdlik y
Sturman, 2012; García Cueto, 1993).
El
último criterio clasificatorio que aquí se contempla se
refiere a los objetivos de evaluación. En primer término,
puede aludirse a la diferenciación entre autorreportes que
apuntan a describir tipos o estilos de personalidad funcional o
adaptativa, como son las escalas Millon de Estilos (Millon, 1997) o
el Big Five Inventory y sus versiones local en modos inventario y
checklist
(Costa
y McCrae, 1992; Cupani, Pilatti, Urrizaga, Chincolla y Richaud de
Minzi, 2014; Ledesma, Sánchez y Díaz Lázaro,
2011), o bien a aquellos que se orientan a la descripción de
dimensiones patológicas de la personalidad, como son los MMPI
(Ben Porath y Tellegn, 2009; Butcher et al., 1989; Hathaway y Mc
Kinley, 1942), las escalas clínicas de Milllon (2012), el
SCL-90-R (Derogatis, 1977/1983/1994), el PAI y el PAI-A (Cardenal,
Ortiz Tallo y Santamaría, 2012; de la Iglesia, Castro Solano y
Fernández Liporace, 2018; Morey, 1991/2007a, 2007b; Stover,
Castro Solano y Fernández Liporace, 2015), o el PID-5, que
operacionaliza el sistema nosológico categorial-dimensional
presentado en el DSM5 (American Psychiatric Association, 2013a,
2013b), por ejemplo. Asimismo, esta segunda categoría, que se
dirige a evaluar aspectos disfuncionales o psicopatológicos de
la personalidad se subdivide en instrumentos de screening
e instrumentos de diagnóstico. Los primeros, también
conocidos como escalas de rastrillaje o cribado, se dedican a la
detección de riesgo que, en caso de resultar positivo, debe
derivarse a una fase ulterior de diagnóstico para dirimir si
se trata de un falso positivo y descartarlo como caso patológico,
o bien confirmar por vía diagnóstica su carácter
de positivo verdadero. Por este motivo las escalas de screening
deben ser breves, para retener el menor tiempo posible al examinado
puesto que la información que se obtendrá no será
concluyente. A la vez, en muchas ocasiones estas tareas de cribado se
llevan a cabo en grandes grupos, en aplicaciones colectivas o
comunitarias, por lo que su brevedad, tanto en la aplicación
como en la puntuación se vuelve aún más
importante. Además, se busca que las herramientas de cribado
tengan una alta sensibilidad y una baja especificidad. La alta
sensibilidad es deseable para que las puntuaciones se eleven
significativamente ante el marcado de poca cantidad y gravedad de
sintomatología, encendiendo la alarma de riesgo ante pocos y
sutiles indicadores. Es preferible detectar por demás casos
falsos positivos que luego se descarten en la fase posterior de
diagnóstico que dejar a un lado positivos verdaderos no
demasiado floridos o llamativos que, con instrumentos menos
sensibles, quedarían subevaluados y nunca serían
detectados. La baja especificidad, por otra parte. obedece a que el
secreening
pesquisa disfuncionalidad difusa sin hacer foco en la identificación
precisa del problema. Hacia allí apunta el diagnóstico
pero no el screening,
que solamente busca riesgo presuntivo, a confirmarse o descartarse
posteriormente (Kessler y Zhao, 1999; MacMahon y Trichopoulos, 2001;
Pedrerira Massa y Sánchez Gimeno, 1992).
Las
herramientas de diagnóstico persiguen la especificidad, es
decir, la identificación de ausencia o presencia de trastorno
y en lo posible, la profundización sobre su tipo, gravedad e
implicaciones comportamentales, sociales, laborales, sexuales,
académicas, entre otras. Por ello son más extensas
puesto que requieren de más ítems, dotados de mayor
especificidad y menor sensibilidad. Esto significa que sus
puntuaciones se elevan ante una marcada cantidad de síntomas y
de gravedad o significación clínica considerable, sin
reaccionar ante síntomas aislados, leves o sutiles, al
contrario de las escalas de screening.
Se pretende no enviar alarmas de riesgo innecesarias sino distinguir
singularidades claras entre funcionamiento adaptativo y trastorno y,
de existir este, establecer un claro diagnóstico diferencial
respecto de otras entidades nosológicas (Castro Solano y
Fernández Liporace, 2017; Hogan, 2007).
Una
vez explicitadas las características generales antes
descriptas, se hará referencia a las particularidades del
trabajo con autorreportes de personalidad en cada ámbito
aplicado de la evaluación.
Ámbitos
de trabajo y especificidades acerca de la evaluación de la
personalidad
Los
autoinformes para evaluar la personalidad se emplean, por supuesto,
mayoritariamente en los ámbitos clínico, laboral y
forense y, en menor medida, en el educativo si ello fuere necesario.
En
el contexto clínico su uso más frecuente se vincula con
la búsqueda de sintomatología con significación
clínica, es decir, signos y síntomas capaces de
producir cierto monto apreciable de malestar y de disfunción
concreta en una o más áreas de la vida de la persona.
Usualmente quienes requieren de una consulta clínica por
motivos sintomáticos se muestran abiertos y son sinceros y
explícitos al referir sus síntomas aunque no en todos
los casos este sea necesariamente el escenario. Los consultantes
suelen tomarse un tiempo, que es requerido para construir el vínculo
de rapport
y confianza con el evaluador así como para bucear algo más
allá de los motivos que les son más sencillos de
presentar en primer término y pasar a motivos más
importantes, tal vez vergonzantes o no concientizados, como son los
motivos de consulta latentes.
En
el ámbito laboral puede elegirse la evaluación de
dimensiones no patológicas, de cara a establecer si la
configuración única de cada postulante encaja en el
perfil de puesto requerido, aunque en otras puede perseguirse ese fin
junto con el de despejar la hipótesis de posibles
psicopatologías que inhabiliten al candidato para el puesto.
Entonces, según el objetivo, es factible utilizar autoinformes
que describan tipos o estilos funcionales de personalidad, o
autorreportes que evalúen dimensiones psicopatológicas.
En
contextos forenses del fuero penal, lo usual es intentar establecer
la imputabilidad o inimputabilidad de un acusado ante la comisión
de un delito. Así, son los inventarios psicopatológicos
los que se imponen -en ocasiones junto con tests de inteligencia si
se alegara demencia desde el punto de vista jurídico-. Lo
mismo sucede cuando el fuero en el que se trabaja es civil y se
pretende evaluar daño psíquico, así como en
tribunales de familia, si se reclama la tenencia de un niño
por razones de incapacidad psíquica de alguno de sus padres,
madres o cuidadores.
El
contexto educativo, que es aquel donde menos comúnmente se
emplean los autoinformes de personalidad, ya que la evaluación
de estilos o de patologías no suele ser una incumbencia
psicoeducativa y, en general, se encarga a una instancia externa si
ello fuere requerido. Dependerá del motivo de la evaluación
si se usa una u otra alternativa, y ello quedará sujeto
también a información y variables intervinientes
adicionales.
En
el ámbito comunitario, donde en general se busca la detección
de casos en riesgo para su ulterior diagnóstico, especialmente
cuando se trabaja con poblaciones numerosas, lo usual es trabajar con
herramientas de cribado en tiempos breves, tanto de aplicación
como de puntuación, para lograr derivar rápidamente a
la instancia de diagnóstico a aquellos individuos
identificados como casos en riesgo. Por ende, se tiende a la
evaluación de disfuncionalidades no específicas, pero
se ubica el foco en la posible patología. Así, los
estilos o tipos funcionales quedarían descartados en tareas
comunitarias, salvo por razones de investigación que se
dirigieran a ello (Fernández Liporace, 2015b).
Las
dos conclusiones inmediatas que surgen aquí son: 1) la
elección del tipo de herramienta deberá ser muy
cuidadosa, y dependerá del ámbito de trabajo, de los
motivos y objetivos de la evaluación y de las características
del examinado; 2) dado que cada uno de estos ámbitos plantea
especificidades, deberá prestarse atención a
recomendaciones técnicas particulares para cada contexto. Por
ejemplo, en el fuero penal del ámbito forense habrá que
suponer que podrá existir una alta prevalencia de casos de
simulación y por ello, deberán buscarse herramientas
que midan este comportamiento, como el MMPI-2-RF (Ben Porath y
Tellegen, 2009). En los juicios de tenencia por incapacidad psíquica
se espera más frecuencia de distorsiones deliberadas,
especialmente como minimización de síntomas en sentido
estricto. Lo mismo sucederá en selecciones laborales puesto
que el candidato desea conseguir un puesto. El ámbito clínico
suele ser el más sencillo para la aplicación de
instrumentos porque las personas tienden a ser más abiertas y
asumir actitudes menos defensivas ante consultas espontáneas o
ante la presencia de sufrimiento psíquico. De todas maneras, y
en común con el resto de los ámbitos y situaciones,
pueden aparecer dificultades para comprender consigna, sistema de
respuestas o contenido de los ítems, dificultades para
concentrarse por motivos diversos -ansiedad incrementada,
bradipsiquia o taquipsiquia, deterioro de la capacidad atencional,
uso de medicación o sustancias que disminuyan el nivel de
conciencia y, por ende, la capacidad atencional, entre otras-, baja
comprensión lectora por razones educativas o bajas habilidades
lectoras, verbales o intelectuales en general, actitudes aquiescentes
o no aquiescentes e, incluso, razones clínicas, entre otras.
Por todo lo anterior, la noción de escalas
de validez
debe introducirse en este punto.
Estas
escalas no aluden a las evidencias de validez de los resultados
aportados por el inventario en determinada muestra poblacional sino a
la validez del protocolo de un examinado en particular, en virtud de
actitudes diversas al responder que aquel puede asumir; ellas pueden
o bien distorsionar el patrón de respuestas al punto tal de
invalidar el perfil o llevar a un diagnóstico errado, o bien
añadir elementos clínicos que ayuden a la
interpretación de un perfil dado. Estas escalas detectan
fenómenos tales como la falta de consistencia en cuanto al
contenido de las respuestas -debido a falta de interés, de
comprensión o de concentración-, la exageración
o minimización de síntomas, su simulación,
patrones de respuesta aquiescentes o no aquiescentes -en virtud de
variables personales o de libretos culturales-, la intención
de brindar una impresión positiva o una negativa, entre otras
escalas posibles (Buela Casal y Sierra, 1997). No todas se incluyen
en todos los inventarios pero según los propósitos
centrales de cada uno se prevé añadir algunas u otras.
Su atento examen en cada caso particular, según la
configuración del perfil, el resto de la información
recabada, los motivos y objetivos de la evaluación y el ámbito
de aplicación donde se desarrolle la evaluación son de
estricta responsabilidad del psicólogo. Jamás sus
puntuaciones y su configuración deben interpretarse a ciegas,
sino teniendo en cuenta todos y cada uno de los parámetros
anteriores. Es fundamental tomar conciencia de semejante
responsabilidad y entrenarse debidamente para realizar
interpretaciones éticas, informadas y acordes a los fines de
la evaluación.
En
el siguiente apartado se proveen algunas viñetas técnicas
vinculadas a las tendencias y lineamientos que en los últimos
años se han consensuado en torno al tema.
Normativas
y tendencias internacionales. Algunas viñetas técnicas
Este
apartado final incluye algunas cuestiones ya tratadas a lo largo de
las secciones precedentes, ahora contemplando algunos cambios de
tendencia que en las últimas décadas se han dado a raíz
de los consensos logrados internacionalmente en cuanto a las
propiedades deseables en los autoinformes.
1. En
relación con la extensión de los tests es importante
destacar que hasta avanzada la década de 1980 se buscaba
construir autoinformes extensos, donde cada dimensión
estuviera representada por un gran número de ítems en
aras de aumentar la fiabilidad de cada escala representativa de cada
dimensión. Actualmente, a partir de las normativas redactadas
por APA/ERA/NCME (2014), la tendencia ha virado hacia el diseño
de instrumentos breves -de cara a contemplar los tiempos más
cortos posibles para su aplicación y evaluación pues
el factor temporal es un valor personal y económico que debe
respetarse y optimizarse en situaciones organizacionales y sociales
en general-. Sin embargo, esta brevedad compensa la menor cantidad
de reactivos con el requerimiento de ítems con propiedades
psicométricas robustas. Ello significa que ya no se pretende
aumentar la fiabilidad mediante el incremento de la cantidad de
reactivos sino que se intenta minimizar su número a costa de
lograr que se retengan aquellos con mejor funcionamiento individual
y conjunto. Esa robustez psicométrica se traduce en
evidencias confirmatorias de validez de constructo que involucren
las siguientes propiedades: a) adecuación entre las hipótesis
referidas a las dimensiones del modelo operacionalizado en el test,
b) ajuste y parsimonia del modelo a los datos, es decir, capacidad
para explicar adecuadamente los comportamientos individuales por
medio de la menor cantidad de ítems y dimensiones posibles,
c) adecuada fiabilidad -en términos de consistencia interna y
estabilidad temporal- de cada una de las dimensiones compuestas por
ítems que muestren una alta capacidad discriminativa y el
mayor porcentaje de varianza explicada posible, d) buena capacidad
de discriminación de diferencias individuales según
corresponda -por grupo clínico o de población general,
por edad, por género, entre otras variables de segmentación
pasibles de contemplarse- (International Test Commission, 2016).
Esta
brevedad combinada con adecuadas propiedades psicométricas se
vuelve especialmente importante en el caso de las escalas de cribado,
donde los tiempos de aplicación y de evaluación deben
ser, necesariamente, mucho más breves e inmediatos pues se
persigue la detección de riesgo. Por esta razón, por
muchos años las escalas para la detección de riesgo no
incluyeron escalas de validez. Actualmente, y justamente gracias a la
brevedad extrema que se traduce en pocos ítems y dimensiones
con óptimas cualidades técnicas, algunas escalas de
screening
han comenzado a incluir escalas de validez, en número acotado
y de modo general, pero con el espíritu de brindar alguna
información sobre la actitud de respuesta, que no es menor en
el caso de los autorreportes, como antes se comentara. Tal es el caso
de la LSB-50 (de Rivera y Abuín, 2012; Castro Solano,
Fernández
Liporace,
de la Iglesia, y Stover, 2018).
2. La
decisión excluyente especificidad
versus
sensibilidad
que hasta hace pocos años era inherente a esa relación
inversa se halla en plena etapa de revisión y cambio. En
tanto que en el screening
la normativa tradicional era baja especificidad y alta sensibilidad,
justamente para optimizar tiempos, hoy en día se trabaja
fuertemente en la construcción de cribados hipersensibles
dotados de la mayor especificidad posible. La idea se sustenta en
orientar el cribado ya desde el primer momento para que, en los
casos en los que se detecte riesgo, la información no muestre
solamente que podría
haber alguna disfuncionalidad o no, y que ello debe confirmarse y
especificarse en la fase ulterior de diagnóstico, sino que
desde el momento en que se establece la presencia de riesgo de
disfunción sea factible elaborar alguna o algunas hipótesis
más específicas acerca del tipo de riesgo o
disfunción, de modo que pueda elegirse ya una batería
o instrumento que lleve al mejor diagnóstico diferencial en
menor tiempo. Esta búsqueda del punto donde ítems y
escalas alcanzan el máximo de sensibilidad y de especificidad
se efectúa mediante el cálculo de curvas ROC, que
permiten detectar los reactivos los mejores funcionamientos
(Reistma, Glas, Rutjes, Scholten, Bosuyt, Zwinderman, 2005). Desde
el lado del diagnóstico, muchas herramientas ya se diseñan
con dos secciones, la de cribado y la de diagnóstico, y
puesto que los tiempos de evaluación se acortan por la
brevedad de ambos pero sobre todo del cribado, y dado que se suma a
ellos la tendencia a informatizar procedimientos de aplicación
y evaluación, en cuestión de pocos segundos se puede
apelar a algoritmos de decisión para finalizar la evaluación
en cierto punto por falta de indicadores de riesgo o de continuarla
hasta llegar al diagnóstico, etapa que también llevará
el menos tiempo a la luz de los comentarios anteriores.
3. Justamente
como resultado de los puntos anteriores, actualmente tanto las
herramientas de screening
como las de diagnóstico se dirigen a la brevedad y a la
superación de la regla inversa de sensibilidad y
especificidad pues se busca en ambas optimizar las tres propiedades
en la medida de lo posible, siempre y cuando sus propiedades
psicométricas no se deterioren. La discriminación no
escapa a esta tendencia. Se pretende lograr precisiones acerca de
las descripciones poblacionales en las que cada instrumento logra la
máxima discriminación, es decir, es capaz de brindar
la información más específica y diferenciada
posible según hayan mostrado las investigaciones
desarrolladas. Por ejemplo, es frecuente que los autorreportes que
evalúan psicopatologías logren mayor discriminación
en los rangos altos del continuo que va desde la salud hasta la
enfermedad, y que tengan más para decir sobre los sujetos que
obtienen puntuaciones elevadas en psicopatología que lo que
pueden describir sobre personas que puntúan en zonas de
puntuaciones bajas y medias. Así, las descripciones de rasgos
menos adaptables al contexto suelen ofrecer más descriptores
-y más floridos- que las descripciones que indican
adaptabilidad y flexibilidad contextual. De todos modos, más
allá de que este escenario sea el más común, es
importante tener en cuenta que, a la hora de elegir emplear un
autoinforme, el evaluador debe tener clara consciencia de si su
capacidad discriminativa es la indicada según las
características sociodemográficas y clínicas
del examinado, y según los objetivos de la evaluación
y el contexto de trabajo. Identificar la mejor herramienta en este
sentido llevará a evaluaciones más específicas,
claras y distintas, con mayor capacidad descriptiva y predictiva y,
en última instancia, con mayor potencial para permitir, en la
instancia que corresponda, un diagnóstico diferencial claro,
operacionalizable en términos de descripción de
comportamientos, y pasible de recibir recomendaciones de
intervención personalizadas y adecuadamente delineadas.
4. También
a la luz de los puntos anteriores, las escalas de validez,
indispensables en todo diagnóstico de personalidad, ya sea de
tipos o de patologías, existen para prestar atención a
la actitud y peculiaridades con que cada evaluado ha respondido al
instrumento que se emplea para el diagnóstico. Años ha
su propósito era establecer la validez o invalidez de cada
perfil por motivos diversos -principalmente falta de consistencia en
el patrón, extremas aquiescencia o no aquiescencia,
minimización o exageración llamativa de síntomas
y alta distorsión deliberada-. Hoy el enfoque es diferente y
el acento ya no se ubica en la validez o invalidez del perfil dado
que la actitud de respuesta es, per
se,
un dato descriptivo que añade mucha información a la
que las escalas personológicas generan. De este modo, se
insiste en lograr la menor invalidación de perfiles posible
en aras de emplear la información derivada de la actitud de
respuesta de manera descriptiva, tanto de los aspectos adaptativos o
saludables de la personalidad como de los clínicos,
sintomatológicos o desadaptativos.
5. La
consideración de los aspectos positivos, es decir, los
recursos saludables o adaptativos con los que cuenta el sujeto son,
hoy en día, objeto de atención principal. Si bien
desde hace décadas se los toma en cuenta, la buena praxis
consensuada en la actualidad lleva a la descripción
exhaustiva de los aspectos funcionales, de modo tal que puedan
servir de apoyos firmes para asentar sobre ellos las bases de
cualquier intervención recomendada para modificar o morigerar
los aspectos disfuncionales o menos flexibles.
6. Finalmente,
aunque no por ello menos con menor nivel de importancia, el
evaluador no debe jamás perder de vista en cada caso los
objetivos de la evaluación, el ámbito de trabajo en el
que se desempeña, las características del examinado y
sus circunstancias vitales -de todo tipo, hasta las más
intrascendentes en apariencia-. En consonancia con lo anterior, la
batería que se elija para realizar la evaluación debe
ser minuciosamente examinada, instrumento por instrumento.
Complementar la información que los autoinformes de
personalidad aportan con otras medidas provenientes del evaluado
-entrevistas, otros tests- y de fuentes externas -informantes
claves, historias clínicas, legajos laborales o expediente
según el ámbito de aplicación- es vital para
formar una guestalt de datos y seleccionar en ella los datos
relevantes -adaptativos y no adaptativos- y los que hacen a
cuestiones secundarias pero que ayudan a la descripción del
caso y a la toma de decisiones en cuanto a qué información
incluir en devolución e informe, de cara al para
qué
de esa inclusión. Es entonces que la elección de cada
herramienta debe ser responsable, basada en un profundo conocimiento
sobre los desarrollos teóricos y técnicos de
vanguardia, y de los consensos logrados en cuanto a tendencias y
estándares. No basta con hallar un instrumento con un nombre
adecuado y una apariencia interesante. Es una regla ética que
hace a la buena praxis del profesional -porque sus decisiones tienen
consecuencias concretas en la vida de las personas evaluadas y su
entorno próximo- en cuanto a información obtenida,
interpretada, devuelta oralmente y vertida en el informe, y en
cuanto a las recomendaciones vertidas en este último. Pero
para llegar al mejor resultado posible debe contarse con formación
de calidad sobre metodologías de análisis psicométrico
y resultados esperables en este tipo de herramientas. El evaluador
responsable debe leer concienzudamente la totalidad de los manuales
de los instrumentos que son candidatos a integrar la batería
y buscar investigaciones locales y recientes realizadas con muestras
representativas integradas por sujetos homogéneos al
examinado en cuanto a características sociodemográficas
y clínicas. Y esas investigaciones, además de
corrección metodológica, deben ofrecer resultados que
muestren adecuadas evidencias de validez de facies,
de contenido, de constructo -exploratoria y confirmatoria,
convergente y discriminante-, de criterio – en principio
convergente y, de ser factible, predictiva-, así como buenos
resultados en cuanto a fiabilidad y capacidad discriminativa.
Asimismo deben cumplirse todos los requisitos de adaptación
regional reciente que recomienda la ITC (2018), y coincidir el
modelo teórico operacionalizado en el test con el que el
psicólogo considera que debe llevar adelante la evaluación
y ser, también, todo ello consistente con el resto de los
instrumentos incluidos en la batería.
La
consistencia teórico-instrumental no es un punto menor ni
anecdótico, así como la adecuada elección de los
instrumentos según los criterios detallados en los puntos
anteriores. Estas decisiones deben ser tomadas por un profesional
debidamente formado en el área de evaluación siempre
desde la premisa de asumir que la responsabilidad ética,
teórica y técnica recae en el evaluador y que es,
precisamente, ese evaluador la mejor herramienta para aunar razonable
y estratégicamente toda la información obtenida a
partir de las distintas fuentes empleadas –tests, entrevistas,
informantes claves y vías institucionales -.
Referencias
American
Psychiatric Association (1980). Diagnostic
and Statistical Manual of Mental Disorders,
3rd.
ed. Washington
D. C.: Autor.
American
Psychiatric Association (2013a). APA.
DSM5. The Personality Inventory for DSM5,
Full Version-Adult.
Recuperado de file:///C:/Users/Downloads/APA_DSM5_The_Personality-Inventory-For-DSM-5-Full-Version-Adult.pdf
el 5 de octubre de 2018. Washington
D. C.: Autor.
American
Psychiatric Association (2013b). Diagnostic
and Statistical Manual of Mental Disorders,
5th
ed. DSM-5.
Washington D.C.: Autor.
American
Psychological Association/American Educational Research
Assocation/National Council for Measurement in Education (2014). The
Standards for Educational and Psychological Testing. Washington D.
C.: Autor.
Anastasi,
A. y Urbina, S. (1998). Tests
Psicológicos.
México, D.F.: Prentice Hall.
Bandura,
A. (1977). Social
Learning Theory.
Englewood Cliffs, New Jersey: Prentice Hall.
Ben
Porath, Y. S. y Tellegen, A. (2009). MMPI-2-RF.
Inventario Multifásico de la Personalidad de Minnesota, 2.
Madrid:
TEA.
Buela
Casal, G. y Sierra, J. L. (1997). Manual de evaluación
psicológica. Fundamentos, técnicas y aplicaciones.
Madrid:
Siglo XXI.
Butcher,
J. N., Dahlstrom, W. G., Graham, J. R., Tellegen, A. y Kaemmer, B.
(1989). Minnesota Multiphasic Personality Inventory-2 (MMPI-2).
Manual for the administration, scoring, and interpretation.
Minneapolis:
University of Minnesota.
Cardenal,
V., Ortiz Tallo, M. y Santamaría, P. (2012). Personality
Assessment Inventory-A. Adaptación española. Versión
Experimental. Madrid: TEA.
Castro
Solano, A. (2015). Concepciones teóricas de la personalidad.
Modelos teóricos y definiciones. En M. Fernández
Liporace y A. Castro Solano (Eds.). Evaluación
de la personalidad normal y sus trastornos. Teoría e
instrumentos (pp.
17-33). Buenos Aires: Lugar.
Castro
Solano, A. y Fernández Liporace, M. (2017). Introducción
a la Segunda Parte. Instrumentos de screening y diagnóstico
para niños. En A. Castro Solano y M. Fernández Liporace
(Eds.). Evaluación
de la personalidad normal y sus trastornos. Teoría e
instrumentos (pp.
89-94). Buenos Aires: Lugar.
Castro
Solano, A., Fernández
Liporace,
M., de la Iglesia, G., & Stover, J. B. (2018). Tipificación
Argentina. Listado de Síntomas Breve. En L. de Rivera. &
M. I. Abuín. LSB-50.
Listado de Síntomas Breve. Manual. 2da. Edición,
revisada y ampliada. Madrid:
TEA. ISBN 978-84-16231-54-6.
Reimpresión por inclusión de la adaptación del
instrumento a población argentina.
Cattell,
R. B. (1965). The
scientific analysis of personality.
Chicago: Aldline.
Cattell,
R. B., Cattell, A. K. y Cattell, H. E. P. (1993). 16PF Fifth Edition
Questionnaire. Campaign II. Glendale, California: Institute for
Personality and Ability Testing.
Cohen,
R. J., Swerdlik, M. & Sturman, E. (2012). Psychological
Testing and Assessment: An Introduction to Tests and Measurement (8ª
ed.).
New York: McGraw-Hill.
Costa,
P. y McCrae, R. (1976). Age
differences in personality structure: A cluster analytic approach.
Journal
of Gerontology, 31(5),
564-570.
Costa,
P. y McCrae, R. (1980). Still
stable after all these years: Personality as a key to some issues in
adulthood and old age. En P. B. Baltes y O. G. Brim Jr. (Eds.).
Life-span development and behavior, Vol. 3
(pp. 65-102). New York: Academic Press.
Costa,
P. y McCrae, R. (1985). The
NEO Personality Inventory Manual.
Odessa, Florida: Psychological Assessment Resources.
Costa.
P. y McCrae, R. (1990). Personality
disorders and the Five Factor Model of personality. Journal
of Personality Disorders, 44,
362-371.
Costa,
P. y McCrae, R. (1992). Professional
Manual for the Revised NEO Personality Inventory (NEO-PI-R) and NEO
Five Factor Inventory (NEO-FFI): Odessa, Florida: Psychological
Assessment Resources.
Cupani,
M. Pilatti, A. Urrizaga, A. Chincolla, A. y Richaud de Minzi, M. C.
(2014). Inventario de Personalidad IPIP-NEO: Estudios preliminares de
adaptación al español en estudiantes argentinos.
Revista Mexicana de Investigación en Psicología, 6(1),
55-73.
de
la Iglesia, G., Castro Solano, A. y Fernández Liporace, M.
(2018). Estandarización argentina del PAI-A. En L. C. Morey
(2018). Invenstario de Evaluación de la Personalidad para
Adolescentes (pp. 237-245). Madrid: TEA.
de
Rivera L. y Abuín, M. R. (2012). LSB-50. Listado
de Síntomas Breve.
Madrid:
TEA.
Derogatis,
L. R. (1977/1983/1994). SCL-90-R.
Sympton Checklist 90-R.
Bloomington, Indiana: Pearson.
Dollard,
J., Miller, N. E., Doob, L. W., Mowrer. O.
H. y Sears, R. R. (1939). Frustration
and aggression. New Haven: Yale University.
Eysenck,
H. (1960). The structure of human personality. London: Routledge &
Keegan Paul.
Fernández
Liporace, M. (2015a). Instrumentos
de evaluación de la personalidad. En M. Fernández
Liporace y A. Castro Solano (Eds.). Evaluación
de la personalidad normal y sus trastornos. Teoría e
instrumentos
(pp. 107-127). Buenos Aires: Lugar.
Fernández
Liporace, M. (2015b). Instrumentos de evaluación de la
personalidad normal y patológica. En M. Fernández
Liporace y A. Castro Solano (Eds.). Evaluación
de la personalidad normal y sus trastornos. Teoría e
instrumentos
(pp. 129-152). Buenos Aires: Lugar.
Freud,
S. (1933). Nuevas
conferencias de introducción al psicoanálisis.
En S. Freud, Obras Completas (Tomo XXII). Buenos Aires: Amorrortu.
García
Cueto, E. (1993). Introducción
a la psicometría. Madrid:
Siglo XXI.
Hair,
J. F., Black, W. C., Babin, B. J., Anderson, R. E. & Tatham, R.
L. (2010) Multivariate
Data
Analysis.
7th
Edition.
Upper Saddle River: Prentice Hall.
Hathaway,
S. R. y Mc Kinley, J. C. (1942). The
Minnesota Multiphasic Personality Schedule.
Minneapolis: University of Minnesota.
Hogan,
T. P. (2007). Psychological
testing. A practical Introduction, 2nd
Edition.
New York: Wiley.
International
Test Commission (ITC) (2015).
Guidelines
for Practitioner Use of Test Revisions, Obsolete Tests, and Test
Disposal. Recuperado
el 5 de octubre de 2018 de
www.intestcom.org/files/guideline_test_disposal.pdf
International
Test Commission (ITC) (2016).
Guidelines
for Translating and Adapting Tests, 2nd
Edition. Recuperado
el 3 de octubre de 2018 de
https://www.intestcom.org/files/guideline_test_adaptation_2ed.pdf
International
Test Commission (ITC) (2018).
Guidelines
for the Large-Scale Assessment of Linguistically and Culturally
Diverse Populations. Recuperado
el 1 de octubre de 2018 de
https://www.intestcom.org/files/guideline_diverse_populations.pdf.
Kernberg,
O. (1984). Severe
personality disorders.
New Haven: Yale.
Kessler,
R. C. y Zhao, S. (1999). Overview of descriptive epidemiology of
mental disorders. En C. S. Anshensel y J. C. Phelan,
Handbook of Sociology of Mental Health
(pp. 127-150). New York: Springer.
Kohut,
H. (1971). The
analysis of self. New
York: International University Press.
Ledesma,
R., D. Sánchez, R. y Díaz Lázaro, C M. (2011).
Adjective
Checklist to assess the Big Five Personality Factors in the Argentine
Population. Journal
Personality Assessment, 93(1),
46-55.
MacMahon,
B. y Trichopoulos, B. (2001). Epidemiología.
Madid: Marbán.
Millon,
T. (1996). Disorders
of personality.
New York: Wiley and Sons.
Millon,
T. (1997). Inventario
Millon de Estilos de Personalidad.
Buenos Aires: Paidós.
Milllon,
T. (2012). MCMI-III.
Inventario Clínico Multiaxial de Millon-III.
Madrid:
Pearson Psycorp.
Mischel,
W. (1968). Personality and assessment. New York: Wiley.
Morey,
L. (1991/2007a). Personality
Assessment Inventory-Adolescents.
Florida: Psychological Assessment Resources.
Morey,
L. (2007b). Personality
Assessment Inventory.
Florida:
Psychological Assessment Resources.
Pedrerira
Massa, J. L. y Sánchez Gimeno, B. (1992). Métodos
de screening de trastornos mentales infanto-juveniles en atención
primaria de la salud. Revista
Española de Salud Pública, 66(2),
1135-5727.
Pervin
(2000). Personality. En A. Kazdin (Ed.).
Encyclopaedia
of Psychology, Vol. 2
(pp. 100-106). Washington D.C.: American Psychological Association.
Reistma,
J. B., Glas, A. S., Rutjes, A. W. S., Scholten, R. J. P. M. Bosuyt,
P. M.y Zwinderman, A. H. (2005). Bivariate analysis of sensitivity
and specificity produces informative summary measures in diagnostic
reviews. Journal
of Clinical Epidemiology, 58(10),
982-990.
Rogers,
C. (1980). A
way of being.
Boston: Houghton
Mifflin.
Stover,
J. B., Castro Solano, A. y Fernández Liporace, M. (2015).
Personality Assessment Inventory: Psychometric Analyses of the
Argentinean Version. Psychological
Reports, (17)3,
799-823.
Tupes,
E. C. y Christal, R. E. (1961). Recurrent
personality factors based on trait ratings. USAF ASD Technical
Report.
Lackland, Texas: United States Air Force.