ENCICLOPEDIA ARGENTINA DE SALUD MENTAL

ISSN 2618-5628

HOME

INDICE

AUTORES

LEGISLACIONES VIGENTES

CONTACTO

Inventario

Evaluación psicológica, Personalidad, Propiedades psicométricas

Evaluación psicométrica de la personalidad: screening, diagnóstico y tendencias actuales

Fernandez Liporace, Mercedes
Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET)
Universidad de Buenos Aires (UBA)

La evaluación de la personalidad con metodologías psicométricas muestra, como toda evaluación de cualquier otro tipo de variables psicológicas en otros dominios, una constante evolución. Tales cambios se sustentan en razones teóricas y prácticas. En primer término, las modificaciones que se imponen provienen de nuevas evidencias empíricas recabadas sobre los modelos que sustentan los instrumentos de evaluación. Esas nuevas evidencias robustecen o debilitan las hipótesis teóricas que los modelos emplean para explicar los comportamientos individuales en relación con los rasgos de la personalidad y producen, así, la preeminencia de ciertos modelos sobre otros. En segundo lugar, el diseño de los instrumentos debe adaptarse gradualmente a las necesidades, variables en el tiempo, que los objetivos de la evaluación en cada ámbito de trabajo persiguen. En tercer término, pero no por ello menos importante, también cambia el modo en que se valoran las fuentes de información que se adicionan a los tests, tanto desde el exterior -como materiales de entrevistas, información proveniente de otras medidas aplicadas más datos aportados por informantes clave- cuanto inherentes y complementarias a aquellas -como son las escalas de validez que los instrumentos para evaluar la personalidad suelen incluir, y a las que se hará referencia más adelante- (International Test Commission, 2015).

La Argentina no es ajena a estos cambios -aunque a veces se pongan en acto algo más tarde que en países con una prolífica industria de tests- y las necesidades de cada ámbito aplicado deben compatibilizarse con los desarrollos teóricos vigentes, los criterios diagnósticos consensuados y los atributos técnicos que, según normativas internacionales y nuevos métodos de análisis, se buscan en las pruebas que miden las distintas dimensiones que componen la personalidad humana. Tales tendencias globalizadas, junto con algunas viñetas prácticas a tener en cuenta a la hora de realizar evaluaciones clínicas, laborales y forenses intentarán, en este capítulo, mostrar al lector hacia dónde se mueve esta especialidad.

Modelos para evaluar la personalidad. Una breve reseña

Los modelos que intentan explicar la personalidad proponen un análisis sistemático de las especificidades individuales que, en términos de patrones comportamentales, cogniciones y afectos, manifiestan las personas (Castro Solano, 2015). No se incluirá en este capítulo una definición de personalidad ni una colección de aquellas más importantes puesto que ello escapa a los objetivos del trabajo, y en virtud de que deliberadamente se dejan tales definiciones a criterio del lector con el fin de aludir a cualquier desarrollo teórico posible.

Los tres abordajes teórico-metodológicos clasificados a partir de una de las categorizaciones más usuales son el clínico, idiográfico u holístico, el experimental y el correlacional o de los rasgos (Pervin, 2000). El abordaje clínico o idiográfico trabaja mayoritariamente con análisis de casos únicos, y apunta a identificar las singularidades o unicidades que hacen a cada persona irrepetible en el marco de la comprensión de los principios generales de funcionamiento que son comunes a todos los seres humanos. En esta corriente se ubican autores clásicos como Freud (1933) o Rogers (1980), cuyas teorizaciones cobraron mayor auge durante la primera mitad del siglo pasado. El enfoque experimental busca, mediante una metodología controlada, formular las leyes universales que rigen el comportamiento, con especial énfasis en la aplicación de modelos sobre aprendizaje, psicología social y psicología cognitiva (Bandura, 1977; Dollard, Miller, Doob, Mowrer y Sears, 1939; Mischel, 1968). La metodología correlacional o rasguista, por último, se centra en la discriminación de conjuntos de datos que permitan aislar aquellos factores que diferencian a las personas y que, a la vez, se dirijan a describir la tendencia a comportarse de un modo o de otro en ciertos contextos generales y bajo determinadas circunstancias. Este enfoque, también llamado factorial, se sustentaba inicialmente en un abordaje léxico. Ello implica que, sobre la base de las respuestas que diversas muestras de individuos brindaban acerca de sí mismos en instrumentos en modalidad autorreporte o en listados de adjetivos destinados a la autodescripción personológica, el objetivo se centraba en aislar factores o dimensiones que indicaran regularidades en las respuestas dadas a los distintos ítems que integraban cada autoinforme. Resultado de esta metodología léxico-factorial es, por ejemplo, el Modelo de los Cinco Grandes Factores de la Personalidad o Big Five (Cattell, Cattell y Cattell, 1993; Costa y McCrae, 1976, 1980, 1985, 1990; Tupes y Christal, 1961) que, hace ya varias décadas, marca tendencia en cuanto a evaluación de la personalidad.

Según otra categorización vigente los abordajes para el estudio de la personalidad pueden ser, en términos generales, mono o politaxonómicos. Estas categorías se combinan con la dicotomía empírico/teórico y ello da lugar a cuatro enfoques: monotaxonómico-empírico, politaxonómico-empírico, monotaxonómico-teórico y politaxonómico-teórico (Millon, 1996). El primero explica las diferencias individuales mediante un número mínimo o acotado de dimensiones obtenidas por medio de escalas para evaluar la personalidad antes que a partir de la formulación de nuevos modelos e hipótesis teóricas; es decir, se trata de un abordaje parsimonioso que hace hincapié en hallazgos empíricos, fundamentalmente sustentado en una metodología factorial que apunta, por definición, a la reducción de datos. Autores señeros de esta línea han sido, por caso, Eysenck (1960) y Cattell (1965). El abordaje prolitaxonómico-empírico también se sustenta en métodos de factorización aplicados a medidas obtenidas mediante instrumentos, y busca el refinamiento de esas herramientas sin atender a hipótesis teóricas, en tanto que asume el isomorfismo entre el comportamiento y los indicadores autoinformados sobre aquel. Trabaja fundamentalmente desde una base léxica que afirma que los adjetivos que las personas emplean para autodescribirse son capaces de dar cuenta de las dimensiones latentes que describen la personalidad y sus variaciones. El modelo Big Five (Costa y McCrae, 1985) encarna el paradigma de esta metodología. El enfoque monotaxonómico-teórico busca, mediante desarrollos que incluyen pocas unidades de análisis, construir modelos a través de la formulación de hipótesis teóricas acerca de la etiología patológica. Con su interés centrado en lo clínico, se trata, en su mayoría, de abordajes dinámicos tales como los de Kohut (1971) o Kernberg (1984), que se dirigen a una explicación basada en un único eje explicativo teórico. Finalmente, los enfoques politaxonómico-teóricos también se dedican a la formulación de modelos, pero incluyen en ellos la categorización de dimensiones funcionales y disfuncionales de la personalidad (Castro Solano, 2015). Los desarrollos de Millon sobre estilos y trastornos de personalidad, respectivamente, son los ejemplos más salientes de esta línea.

Hasta aquí, se ha realizado un sucinto y muy general racconto de los principales modelos que subyacen a la evaluación personológica. Como fácilmente puede colegirse a la luz de la lectura de lo anterior, cada enfoque implica, asimismo, una metodología distintiva que es, por definición, inseparable de cada raigambre teórica. En el próximo apartado se hará referencia, en concreto, a la evaluación de la personalidad en relación con los instrumentos diseñados para ese fin.

Instrumentos psicométricos de evaluación de la personalidad. Clasificaciones actuales

La herramienta que inmediatamente aparece, ya desde una perspectiva intuitiva y, de hecho, la más empleada en la evaluación de la personalidad, es la entrevista. Ella acerca al evaluador de modo directo a la problemática e historia personal, a las circunstancias vitales del evaluado y al grado de afectación que producen los síntomas, si los hubiere. Asimismo, permite vincular esta información con el objetivo de la evaluación, motivo de la consulta, y ámbito de trabajo en el que la evaluación se solicita. Por otro lado, es el instrumento que más y mejor información aporta en cuanto a observaciones de comportamiento puesto que la interacción planteada en situación de entrevista supera cualquier otra interacción posible con otra clase de medidas de personalidad (Fernández Liporace, 2015a).

Pese a estas ventajas, existe consenso internacional en cuanto a una serie de desventajas inherentes a las entrevistas. En primer lugar, se plantean escollos conceptuales sumamente importantes como la falta de acuerdo sobre las definiciones y descripciones de los trastornos clínicos que cada modelo hipotetiza por una parte y que cada evaluador toma en cuenta, por la otra. En segundo término, pero en el mismo sentido antes planteado, se cuestiona cuáles son los indicadores patognomónicos y adicionales que cada evaluador emplea a la hora de poner en juego los criterios diagnósticos que usa, que no se hallan en todos los casos libres de influencias culturales y/o de sesgos personales introducidos por el propio entrevistador (International Test Commission, 2015).

Desde la arista metodológica se critica la falta de estandarización de la metodología de entrevista que, por sus características, hace que cada evaluador la maneje de un modo diferente y, a la vez, que cada entrevistado imprima temáticas y estilos de respuesta – defensividad, simulación, respuestas aquiescentes o no aquiescentes, libretos culturales que llevan al fenómeno de deseabilidad social, distorsiones deliberadas en términos de exageración o minimización de síntomas, inconsistencia, entre otros estilos - que arborizan al infinito las posibilidades de estandarizar procedimientos. Claramente, esta dificultad para acceder a estándares atenta directamente contra la validez de los resultados obtenidos. Más allá de que las entrevistas dirigidas intenten cubrir este escollo y de que, en buena parte, lo logren, la variedad y ampliación de temáticas y la diversidad de estilos de los entrevistadores no logran solucionar estos puntos críticos de modo acabado (American Psychiatric Association, 1980).

Por lo anterior, la evaluación psicológica se ha planteado la necesidad y conveniencia de complementar la información brindada por las entrevistas con medidas de otro tipo, en virtud de minimizar las dificultades de aquellas y de complementar información aportada desde otras fuentes que apunten a la evaluación de los mismos atributos. De esta manera, los instrumentos de autoinforme se presentan como la alternativa psicométrica más empleada en la actualidad.

Se trata de tests que incluyen una variedad de dimensiones de la personalidad, de acuerdo con el modelo que se operacionalice en cada una. En general, sus ítems adquieren el formato de afirmaciones -en este caso se habla de inventarios-, preguntas -aquí se los nombra como cuestionarios- o listados de adjetivos -checklists- que apuntan a la autodescripción. Cualquiera de estos formatos de medidas se responde mediante escalas ordinales de tipo Likert o bien, dicotómicas, según se busque que el examinado disponga de opciones intermedias o se quiera a forzar su decisión frente a alternativas radicalmente opuestas. Dado que pueden ser autoadministrables, son aptas para su aplicación individual o colectiva, por lo que potencialmente permiten la recolección de una gran cantidad de datos en poco tiempo y en un mismo momento, característica que también las vuelve especialmente aptas para tareas de investigación y para evaluaciones comunitarias en el marco de actividades de prevención (Cohen, Swerdlik y Sturman, 2012).

Por tratarse de instrumentos psicométricos, admiten una diversidad de modelos teóricos como base para la operacionalización del constructo que intentan medir. En términos generales, y justamente porque la personalidad es un concepto de alta complejidad compuesto por dimensiones que la mayoría de los modelos consideran independientes, permiten obtener tantas puntuaciones independientes como dimensiones incluyan. Sin embargo, cuando se habla de facetas y de factores de primero y segundo orden surge la posibilidad de combinar puntajes. En otros casos, los puntajes que resultan de la combinación de dimensiones o grupos de ítems se destinan a proporcionar un resumen global del comportamiento de las dimensiones o bien de la sintomatología -si es que el test se dirige a medirla- en términos de gravedad, cantidad o malestar experimentado, por ejemplo-.

De todos modos, para comprender mejor sus distintas variantes, resulta útil recurrir a una serie de criterios clasificatorios de los autorreportes que sirven para elegir el más conveniente en cada situación evaluativa. Ya se los ha distinguido en cuanto a formato de ítems -inventarios, checklists y cuestionarios- y en cuanto a su modalidad de respuesta -ordinal o Likert y dicotómica-. También es importante atender a su diseño, a la metodología empleada para su análisis de datos, y a los objetivos de la evaluación.

En cuanto a su diseño, se clasifican en escalas con base racional y empírica. La base racional supone que los investigadores que diseñan la prueba se basan en un modelo teórico referido a un constructo, cuyas dimensiones se operacionalizan en ítems que luego se agrupan en subtests, subescalas o en la escala general, según corresponda. El diseño empírico implica la salida a campo de los investigadores que, al margen de las hipótesis teóricas o bien a la luz de ellas, buscan en especialistas y en individuos concretos la descripción fáctica del fenómeno que buscan medir mediante el test que van a desarrollar (Anastasi y Urbina, 1998). En general se trabaja mediante entrevistas en profundidad, grupos focales, encuestas u otras vías para recabar información detallada sobre las dimensiones que deben operacionalizarse según el criterio de los especialistas y/o de las personas que poseen tal o cual atributo a evaluarse, tal como cierta configuración sintomatológica o alguna característica psicológica dada, de cualquier tipo o naturaleza. Debe destacarse que los criterios de diseño racional y empírico son independientes pero no necesariamente excluyentes. De hecho, algunos tests combinan el empleo de ambos, como por ejemplo los MMPI (Ben Porath y Tellegen, 2009; Butcher, Dahlstrom, Graham, Tellegen y Kaemmer, 1989; Hathaway y Mc Kinley, 1942).

Categorizar los instrumentos de personalidad según el método de análisis de datos que han empleado los psicometristas incluye dos grupos posibles. Ellos son los métodos de factorización y de grupos contrastados. En el primer caso, el análisis factorial se emplea tanto para estudiar la dimensionalidad del modelo operacionalizado así como para aportar evidencias de validez de constructo -de tipo exploratorio y confirmatorio y, asimismo, convergente y discriminante- referidas a los resultados arrojados por la escala en una muestra o población determinadas (Hair, Black, Babin, Anderson y Tatham, 2010). En el segundo se busca, por un lado, analizar la capacidad del test para discriminar entre grupos con y sin cierta sintomatología y que posean tal o cual rasgo de manera pronunciada o sutil y, por el otro, poner a prueba en el plano empírico las hipótesis teóricas fundamentales del modelo que describe el constructo que se operacionaliza por la otra. Tampoco se trata de categorías excluyentes, puesto que los instrumentos admiten ambos tipos de análisis y, de hecho, la psicometría estimula que se proceda a realizar todos los estudios factibles (Cohen, Swerdlik y Sturman, 2012; García Cueto, 1993).

El último criterio clasificatorio que aquí se contempla se refiere a los objetivos de evaluación. En primer término, puede aludirse a la diferenciación entre autorreportes que apuntan a describir tipos o estilos de personalidad funcional o adaptativa, como son las escalas Millon de Estilos (Millon, 1997) o el Big Five Inventory y sus versiones local en modos inventario y checklist (Costa y McCrae, 1992; Cupani, Pilatti, Urrizaga, Chincolla y Richaud de Minzi, 2014; Ledesma, Sánchez y Díaz Lázaro, 2011), o bien a aquellos que se orientan a la descripción de dimensiones patológicas de la personalidad, como son los MMPI (Ben Porath y Tellegn, 2009; Butcher et al., 1989; Hathaway y Mc Kinley, 1942), las escalas clínicas de Milllon (2012), el SCL-90-R (Derogatis, 1977/1983/1994), el PAI y el PAI-A (Cardenal, Ortiz Tallo y Santamaría, 2012; de la Iglesia, Castro Solano y Fernández Liporace, 2018; Morey, 1991/2007a, 2007b; Stover, Castro Solano y Fernández Liporace, 2015), o el PID-5, que operacionaliza el sistema nosológico categorial-dimensional presentado en el DSM5 (American Psychiatric Association, 2013a, 2013b), por ejemplo. Asimismo, esta segunda categoría, que se dirige a evaluar aspectos disfuncionales o psicopatológicos de la personalidad se subdivide en instrumentos de screening e instrumentos de diagnóstico. Los primeros, también conocidos como escalas de rastrillaje o cribado, se dedican a la detección de riesgo que, en caso de resultar positivo, debe derivarse a una fase ulterior de diagnóstico para dirimir si se trata de un falso positivo y descartarlo como caso patológico, o bien confirmar por vía diagnóstica su carácter de positivo verdadero. Por este motivo las escalas de screening deben ser breves, para retener el menor tiempo posible al examinado puesto que la información que se obtendrá no será concluyente. A la vez, en muchas ocasiones estas tareas de cribado se llevan a cabo en grandes grupos, en aplicaciones colectivas o comunitarias, por lo que su brevedad, tanto en la aplicación como en la puntuación se vuelve aún más importante. Además, se busca que las herramientas de cribado tengan una alta sensibilidad y una baja especificidad. La alta sensibilidad es deseable para que las puntuaciones se eleven significativamente ante el marcado de poca cantidad y gravedad de sintomatología, encendiendo la alarma de riesgo ante pocos y sutiles indicadores. Es preferible detectar por demás casos falsos positivos que luego se descarten en la fase posterior de diagnóstico que dejar a un lado positivos verdaderos no demasiado floridos o llamativos que, con instrumentos menos sensibles, quedarían subevaluados y nunca serían detectados. La baja especificidad, por otra parte. obedece a que el secreening pesquisa disfuncionalidad difusa sin hacer foco en la identificación precisa del problema. Hacia allí apunta el diagnóstico pero no el screening, que solamente busca riesgo presuntivo, a confirmarse o descartarse posteriormente (Kessler y Zhao, 1999; MacMahon y Trichopoulos, 2001; Pedrerira Massa y Sánchez Gimeno, 1992).

Las herramientas de diagnóstico persiguen la especificidad, es decir, la identificación de ausencia o presencia de trastorno y en lo posible, la profundización sobre su tipo, gravedad e implicaciones comportamentales, sociales, laborales, sexuales, académicas, entre otras. Por ello son más extensas puesto que requieren de más ítems, dotados de mayor especificidad y menor sensibilidad. Esto significa que sus puntuaciones se elevan ante una marcada cantidad de síntomas y de gravedad o significación clínica considerable, sin reaccionar ante síntomas aislados, leves o sutiles, al contrario de las escalas de screening. Se pretende no enviar alarmas de riesgo innecesarias sino distinguir singularidades claras entre funcionamiento adaptativo y trastorno y, de existir este, establecer un claro diagnóstico diferencial respecto de otras entidades nosológicas (Castro Solano y Fernández Liporace, 2017; Hogan, 2007).

Una vez explicitadas las características generales antes descriptas, se hará referencia a las particularidades del trabajo con autorreportes de personalidad en cada ámbito aplicado de la evaluación.

Ámbitos de trabajo y especificidades acerca de la evaluación de la personalidad

Los autoinformes para evaluar la personalidad se emplean, por supuesto, mayoritariamente en los ámbitos clínico, laboral y forense y, en menor medida, en el educativo si ello fuere necesario.

En el contexto clínico su uso más frecuente se vincula con la búsqueda de sintomatología con significación clínica, es decir, signos y síntomas capaces de producir cierto monto apreciable de malestar y de disfunción concreta en una o más áreas de la vida de la persona. Usualmente quienes requieren de una consulta clínica por motivos sintomáticos se muestran abiertos y son sinceros y explícitos al referir sus síntomas aunque no en todos los casos este sea necesariamente el escenario. Los consultantes suelen tomarse un tiempo, que es requerido para construir el vínculo de rapport y confianza con el evaluador así como para bucear algo más allá de los motivos que les son más sencillos de presentar en primer término y pasar a motivos más importantes, tal vez vergonzantes o no concientizados, como son los motivos de consulta latentes.

En el ámbito laboral puede elegirse la evaluación de dimensiones no patológicas, de cara a establecer si la configuración única de cada postulante encaja en el perfil de puesto requerido, aunque en otras puede perseguirse ese fin junto con el de despejar la hipótesis de posibles psicopatologías que inhabiliten al candidato para el puesto. Entonces, según el objetivo, es factible utilizar autoinformes que describan tipos o estilos funcionales de personalidad, o autorreportes que evalúen dimensiones psicopatológicas.

En contextos forenses del fuero penal, lo usual es intentar establecer la imputabilidad o inimputabilidad de un acusado ante la comisión de un delito. Así, son los inventarios psicopatológicos los que se imponen -en ocasiones junto con tests de inteligencia si se alegara demencia desde el punto de vista jurídico-. Lo mismo sucede cuando el fuero en el que se trabaja es civil y se pretende evaluar daño psíquico, así como en tribunales de familia, si se reclama la tenencia de un niño por razones de incapacidad psíquica de alguno de sus padres, madres o cuidadores.

El contexto educativo, que es aquel donde menos comúnmente se emplean los autoinformes de personalidad, ya que la evaluación de estilos o de patologías no suele ser una incumbencia psicoeducativa y, en general, se encarga a una instancia externa si ello fuere requerido. Dependerá del motivo de la evaluación si se usa una u otra alternativa, y ello quedará sujeto también a información y variables intervinientes adicionales.

En el ámbito comunitario, donde en general se busca la detección de casos en riesgo para su ulterior diagnóstico, especialmente cuando se trabaja con poblaciones numerosas, lo usual es trabajar con herramientas de cribado en tiempos breves, tanto de aplicación como de puntuación, para lograr derivar rápidamente a la instancia de diagnóstico a aquellos individuos identificados como casos en riesgo. Por ende, se tiende a la evaluación de disfuncionalidades no específicas, pero se ubica el foco en la posible patología. Así, los estilos o tipos funcionales quedarían descartados en tareas comunitarias, salvo por razones de investigación que se dirigieran a ello (Fernández Liporace, 2015b).

Las dos conclusiones inmediatas que surgen aquí son: 1) la elección del tipo de herramienta deberá ser muy cuidadosa, y dependerá del ámbito de trabajo, de los motivos y objetivos de la evaluación y de las características del examinado; 2) dado que cada uno de estos ámbitos plantea especificidades, deberá prestarse atención a recomendaciones técnicas particulares para cada contexto. Por ejemplo, en el fuero penal del ámbito forense habrá que suponer que podrá existir una alta prevalencia de casos de simulación y por ello, deberán buscarse herramientas que midan este comportamiento, como el MMPI-2-RF (Ben Porath y Tellegen, 2009). En los juicios de tenencia por incapacidad psíquica se espera más frecuencia de distorsiones deliberadas, especialmente como minimización de síntomas en sentido estricto. Lo mismo sucederá en selecciones laborales puesto que el candidato desea conseguir un puesto. El ámbito clínico suele ser el más sencillo para la aplicación de instrumentos porque las personas tienden a ser más abiertas y asumir actitudes menos defensivas ante consultas espontáneas o ante la presencia de sufrimiento psíquico. De todas maneras, y en común con el resto de los ámbitos y situaciones, pueden aparecer dificultades para comprender consigna, sistema de respuestas o contenido de los ítems, dificultades para concentrarse por motivos diversos -ansiedad incrementada, bradipsiquia o taquipsiquia, deterioro de la capacidad atencional, uso de medicación o sustancias que disminuyan el nivel de conciencia y, por ende, la capacidad atencional, entre otras-, baja comprensión lectora por razones educativas o bajas habilidades lectoras, verbales o intelectuales en general, actitudes aquiescentes o no aquiescentes e, incluso, razones clínicas, entre otras. Por todo lo anterior, la noción de escalas de validez debe introducirse en este punto.

Estas escalas no aluden a las evidencias de validez de los resultados aportados por el inventario en determinada muestra poblacional sino a la validez del protocolo de un examinado en particular, en virtud de actitudes diversas al responder que aquel puede asumir; ellas pueden o bien distorsionar el patrón de respuestas al punto tal de invalidar el perfil o llevar a un diagnóstico errado, o bien añadir elementos clínicos que ayuden a la interpretación de un perfil dado. Estas escalas detectan fenómenos tales como la falta de consistencia en cuanto al contenido de las respuestas -debido a falta de interés, de comprensión o de concentración-, la exageración o minimización de síntomas, su simulación, patrones de respuesta aquiescentes o no aquiescentes -en virtud de variables personales o de libretos culturales-, la intención de brindar una impresión positiva o una negativa, entre otras escalas posibles (Buela Casal y Sierra, 1997). No todas se incluyen en todos los inventarios pero según los propósitos centrales de cada uno se prevé añadir algunas u otras. Su atento examen en cada caso particular, según la configuración del perfil, el resto de la información recabada, los motivos y objetivos de la evaluación y el ámbito de aplicación donde se desarrolle la evaluación son de estricta responsabilidad del psicólogo. Jamás sus puntuaciones y su configuración deben interpretarse a ciegas, sino teniendo en cuenta todos y cada uno de los parámetros anteriores. Es fundamental tomar conciencia de semejante responsabilidad y entrenarse debidamente para realizar interpretaciones éticas, informadas y acordes a los fines de la evaluación.

En el siguiente apartado se proveen algunas viñetas técnicas vinculadas a las tendencias y lineamientos que en los últimos años se han consensuado en torno al tema.

Normativas y tendencias internacionales. Algunas viñetas técnicas

Este apartado final incluye algunas cuestiones ya tratadas a lo largo de las secciones precedentes, ahora contemplando algunos cambios de tendencia que en las últimas décadas se han dado a raíz de los consensos logrados internacionalmente en cuanto a las propiedades deseables en los autoinformes.

1. En relación con la extensión de los tests es importante destacar que hasta avanzada la década de 1980 se buscaba construir autoinformes extensos, donde cada dimensión estuviera representada por un gran número de ítems en aras de aumentar la fiabilidad de cada escala representativa de cada dimensión. Actualmente, a partir de las normativas redactadas por APA/ERA/NCME (2014), la tendencia ha virado hacia el diseño de instrumentos breves -de cara a contemplar los tiempos más cortos posibles para su aplicación y evaluación pues el factor temporal es un valor personal y económico que debe respetarse y optimizarse en situaciones organizacionales y sociales en general-. Sin embargo, esta brevedad compensa la menor cantidad de reactivos con el requerimiento de ítems con propiedades psicométricas robustas. Ello significa que ya no se pretende aumentar la fiabilidad mediante el incremento de la cantidad de reactivos sino que se intenta minimizar su número a costa de lograr que se retengan aquellos con mejor funcionamiento individual y conjunto. Esa robustez psicométrica se traduce en evidencias confirmatorias de validez de constructo que involucren las siguientes propiedades: a) adecuación entre las hipótesis referidas a las dimensiones del modelo operacionalizado en el test, b) ajuste y parsimonia del modelo a los datos, es decir, capacidad para explicar adecuadamente los comportamientos individuales por medio de la menor cantidad de ítems y dimensiones posibles, c) adecuada fiabilidad -en términos de consistencia interna y estabilidad temporal- de cada una de las dimensiones compuestas por ítems que muestren una alta capacidad discriminativa y el mayor porcentaje de varianza explicada posible, d) buena capacidad de discriminación de diferencias individuales según corresponda -por grupo clínico o de población general, por edad, por género, entre otras variables de segmentación pasibles de contemplarse- (International Test Commission, 2016).

Esta brevedad combinada con adecuadas propiedades psicométricas se vuelve especialmente importante en el caso de las escalas de cribado, donde los tiempos de aplicación y de evaluación deben ser, necesariamente, mucho más breves e inmediatos pues se persigue la detección de riesgo. Por esta razón, por muchos años las escalas para la detección de riesgo no incluyeron escalas de validez. Actualmente, y justamente gracias a la brevedad extrema que se traduce en pocos ítems y dimensiones con óptimas cualidades técnicas, algunas escalas de screening han comenzado a incluir escalas de validez, en número acotado y de modo general, pero con el espíritu de brindar alguna información sobre la actitud de respuesta, que no es menor en el caso de los autorreportes, como antes se comentara. Tal es el caso de la LSB-50 (de Rivera y Abuín, 2012; Castro Solano, Fernández Liporace, de la Iglesia, y Stover, 2018).

2. La decisión excluyente especificidad versus sensibilidad que hasta hace pocos años era inherente a esa relación inversa se halla en plena etapa de revisión y cambio. En tanto que en el screening la normativa tradicional era baja especificidad y alta sensibilidad, justamente para optimizar tiempos, hoy en día se trabaja fuertemente en la construcción de cribados hipersensibles dotados de la mayor especificidad posible. La idea se sustenta en orientar el cribado ya desde el primer momento para que, en los casos en los que se detecte riesgo, la información no muestre solamente que podría haber alguna disfuncionalidad o no, y que ello debe confirmarse y especificarse en la fase ulterior de diagnóstico, sino que desde el momento en que se establece la presencia de riesgo de disfunción sea factible elaborar alguna o algunas hipótesis más específicas acerca del tipo de riesgo o disfunción, de modo que pueda elegirse ya una batería o instrumento que lleve al mejor diagnóstico diferencial en menor tiempo. Esta búsqueda del punto donde ítems y escalas alcanzan el máximo de sensibilidad y de especificidad se efectúa mediante el cálculo de curvas ROC, que permiten detectar los reactivos los mejores funcionamientos (Reistma, Glas, Rutjes, Scholten, Bosuyt, Zwinderman, 2005). Desde el lado del diagnóstico, muchas herramientas ya se diseñan con dos secciones, la de cribado y la de diagnóstico, y puesto que los tiempos de evaluación se acortan por la brevedad de ambos pero sobre todo del cribado, y dado que se suma a ellos la tendencia a informatizar procedimientos de aplicación y evaluación, en cuestión de pocos segundos se puede apelar a algoritmos de decisión para finalizar la evaluación en cierto punto por falta de indicadores de riesgo o de continuarla hasta llegar al diagnóstico, etapa que también llevará el menos tiempo a la luz de los comentarios anteriores.

3. Justamente como resultado de los puntos anteriores, actualmente tanto las herramientas de screening como las de diagnóstico se dirigen a la brevedad y a la superación de la regla inversa de sensibilidad y especificidad pues se busca en ambas optimizar las tres propiedades en la medida de lo posible, siempre y cuando sus propiedades psicométricas no se deterioren. La discriminación no escapa a esta tendencia. Se pretende lograr precisiones acerca de las descripciones poblacionales en las que cada instrumento logra la máxima discriminación, es decir, es capaz de brindar la información más específica y diferenciada posible según hayan mostrado las investigaciones desarrolladas. Por ejemplo, es frecuente que los autorreportes que evalúan psicopatologías logren mayor discriminación en los rangos altos del continuo que va desde la salud hasta la enfermedad, y que tengan más para decir sobre los sujetos que obtienen puntuaciones elevadas en psicopatología que lo que pueden describir sobre personas que puntúan en zonas de puntuaciones bajas y medias. Así, las descripciones de rasgos menos adaptables al contexto suelen ofrecer más descriptores -y más floridos- que las descripciones que indican adaptabilidad y flexibilidad contextual. De todos modos, más allá de que este escenario sea el más común, es importante tener en cuenta que, a la hora de elegir emplear un autoinforme, el evaluador debe tener clara consciencia de si su capacidad discriminativa es la indicada según las características sociodemográficas y clínicas del examinado, y según los objetivos de la evaluación y el contexto de trabajo. Identificar la mejor herramienta en este sentido llevará a evaluaciones más específicas, claras y distintas, con mayor capacidad descriptiva y predictiva y, en última instancia, con mayor potencial para permitir, en la instancia que corresponda, un diagnóstico diferencial claro, operacionalizable en términos de descripción de comportamientos, y pasible de recibir recomendaciones de intervención personalizadas y adecuadamente delineadas.

4. También a la luz de los puntos anteriores, las escalas de validez, indispensables en todo diagnóstico de personalidad, ya sea de tipos o de patologías, existen para prestar atención a la actitud y peculiaridades con que cada evaluado ha respondido al instrumento que se emplea para el diagnóstico. Años ha su propósito era establecer la validez o invalidez de cada perfil por motivos diversos -principalmente falta de consistencia en el patrón, extremas aquiescencia o no aquiescencia, minimización o exageración llamativa de síntomas y alta distorsión deliberada-. Hoy el enfoque es diferente y el acento ya no se ubica en la validez o invalidez del perfil dado que la actitud de respuesta es, per se, un dato descriptivo que añade mucha información a la que las escalas personológicas generan. De este modo, se insiste en lograr la menor invalidación de perfiles posible en aras de emplear la información derivada de la actitud de respuesta de manera descriptiva, tanto de los aspectos adaptativos o saludables de la personalidad como de los clínicos, sintomatológicos o desadaptativos.

5. La consideración de los aspectos positivos, es decir, los recursos saludables o adaptativos con los que cuenta el sujeto son, hoy en día, objeto de atención principal. Si bien desde hace décadas se los toma en cuenta, la buena praxis consensuada en la actualidad lleva a la descripción exhaustiva de los aspectos funcionales, de modo tal que puedan servir de apoyos firmes para asentar sobre ellos las bases de cualquier intervención recomendada para modificar o morigerar los aspectos disfuncionales o menos flexibles.

6. Finalmente, aunque no por ello menos con menor nivel de importancia, el evaluador no debe jamás perder de vista en cada caso los objetivos de la evaluación, el ámbito de trabajo en el que se desempeña, las características del examinado y sus circunstancias vitales -de todo tipo, hasta las más intrascendentes en apariencia-. En consonancia con lo anterior, la batería que se elija para realizar la evaluación debe ser minuciosamente examinada, instrumento por instrumento. Complementar la información que los autoinformes de personalidad aportan con otras medidas provenientes del evaluado -entrevistas, otros tests- y de fuentes externas -informantes claves, historias clínicas, legajos laborales o expediente según el ámbito de aplicación- es vital para formar una guestalt de datos y seleccionar en ella los datos relevantes -adaptativos y no adaptativos- y los que hacen a cuestiones secundarias pero que ayudan a la descripción del caso y a la toma de decisiones en cuanto a qué información incluir en devolución e informe, de cara al para qué de esa inclusión. Es entonces que la elección de cada herramienta debe ser responsable, basada en un profundo conocimiento sobre los desarrollos teóricos y técnicos de vanguardia, y de los consensos logrados en cuanto a tendencias y estándares. No basta con hallar un instrumento con un nombre adecuado y una apariencia interesante. Es una regla ética que hace a la buena praxis del profesional -porque sus decisiones tienen consecuencias concretas en la vida de las personas evaluadas y su entorno próximo- en cuanto a información obtenida, interpretada, devuelta oralmente y vertida en el informe, y en cuanto a las recomendaciones vertidas en este último. Pero para llegar al mejor resultado posible debe contarse con formación de calidad sobre metodologías de análisis psicométrico y resultados esperables en este tipo de herramientas. El evaluador responsable debe leer concienzudamente la totalidad de los manuales de los instrumentos que son candidatos a integrar la batería y buscar investigaciones locales y recientes realizadas con muestras representativas integradas por sujetos homogéneos al examinado en cuanto a características sociodemográficas y clínicas. Y esas investigaciones, además de corrección metodológica, deben ofrecer resultados que muestren adecuadas evidencias de validez de facies, de contenido, de constructo -exploratoria y confirmatoria, convergente y discriminante-, de criterio – en principio convergente y, de ser factible, predictiva-, así como buenos resultados en cuanto a fiabilidad y capacidad discriminativa. Asimismo deben cumplirse todos los requisitos de adaptación regional reciente que recomienda la ITC (2018), y coincidir el modelo teórico operacionalizado en el test con el que el psicólogo considera que debe llevar adelante la evaluación y ser, también, todo ello consistente con el resto de los instrumentos incluidos en la batería.

La consistencia teórico-instrumental no es un punto menor ni anecdótico, así como la adecuada elección de los instrumentos según los criterios detallados en los puntos anteriores. Estas decisiones deben ser tomadas por un profesional debidamente formado en el área de evaluación siempre desde la premisa de asumir que la responsabilidad ética, teórica y técnica recae en el evaluador y que es, precisamente, ese evaluador la mejor herramienta para aunar razonable y estratégicamente toda la información obtenida a partir de las distintas fuentes empleadas –tests, entrevistas, informantes claves y vías institucionales -.

Referencias

American Psychiatric Association (1980). Diagnostic and Statistical Manual of Mental Disorders, 3^rd. ed. Washington D. C.: Autor.

American Psychiatric Association (2013a). APA. DSM5. The Personality Inventory for DSM5, Full Version-Adult. Recuperado de file:///C:/Users/Downloads/APA_DSM5_The_Personality-Inventory-For-DSM-5-Full-Version-Adult.pdf el 5 de octubre de 2018. Washington D. C.: Autor.

American Psychiatric Association (2013b). Diagnostic and Statistical Manual of Mental Disorders, 5^th ed. DSM-5. Washington D.C.: Autor.

American Psychological Association/American Educational Research Assocation/National Council for Measurement in Education (2014). The Standards for Educational and Psychological Testing. Washington D. C.: Autor.

Anastasi, A. y Urbina, S. (1998). Tests Psicológicos. México, D.F.: Prentice Hall.

Bandura, A. (1977). Social Learning Theory. Englewood Cliffs, New Jersey: Prentice Hall.

Ben Porath, Y. S. y Tellegen, A. (2009). MMPI-2-RF. Inventario Multifásico de la Personalidad de Minnesota, 2. Madrid: TEA.

Buela Casal, G. y Sierra, J. L. (1997). Manual de evaluación psicológica. Fundamentos, técnicas y aplicaciones. Madrid: Siglo XXI.

Butcher, J. N., Dahlstrom, W. G., Graham, J. R., Tellegen, A. y Kaemmer, B. (1989). Minnesota Multiphasic Personality Inventory-2 (MMPI-2). Manual for the administration, scoring, and interpretation. Minneapolis: University of Minnesota.

Cardenal, V., Ortiz Tallo, M. y Santamaría, P. (2012). Personality Assessment Inventory-A. Adaptación española. Versión Experimental. Madrid: TEA.

Castro Solano, A. (2015). Concepciones teóricas de la personalidad. Modelos teóricos y definiciones. En M. Fernández Liporace y A. Castro Solano (Eds.). Evaluación de la personalidad normal y sus trastornos. Teoría e instrumentos (pp. 17-33). Buenos Aires: Lugar.

Castro Solano, A. y Fernández Liporace, M. (2017). Introducción a la Segunda Parte. Instrumentos de screening y diagnóstico para niños. En A. Castro Solano y M. Fernández Liporace (Eds.). Evaluación de la personalidad normal y sus trastornos. Teoría e instrumentos (pp. 89-94). Buenos Aires: Lugar.

Castro Solano, A., Fernández Liporace, M., de la Iglesia, G., & Stover, J. B. (2018). Tipificación Argentina. Listado de Síntomas Breve. En L. de Rivera. & M. I. Abuín. LSB-50. Listado de Síntomas Breve. Manual. 2da. Edición, revisada y ampliada. Madrid: TEA. ISBN 978-84-16231-54-6. Reimpresión por inclusión de la adaptación del instrumento a población argentina.

Cattell, R. B. (1965). The scientific analysis of personality. Chicago: Aldline.

Cattell, R. B., Cattell, A. K. y Cattell, H. E. P. (1993). 16PF Fifth Edition Questionnaire. Campaign II. Glendale, California: Institute for Personality and Ability Testing.

Cohen, R. J., Swerdlik, M. & Sturman, E. (2012). Psychological Testing and Assessment: An Introduction to Tests and Measurement (8ª ed.). New York: McGraw-Hill.

Costa, P. y McCrae, R. (1976). Age differences in personality structure: A cluster analytic approach. Journal of Gerontology, 31(5), 564-570.

Costa, P. y McCrae, R. (1980). Still stable after all these years: Personality as a key to some issues in adulthood and old age. En P. B. Baltes y O. G. Brim Jr. (Eds.). Life-span development and behavior, Vol. 3 (pp. 65-102). New York: Academic Press.

Costa, P. y McCrae, R. (1985). The NEO Personality Inventory Manual. Odessa, Florida: Psychological Assessment Resources.

Costa. P. y McCrae, R. (1990). Personality disorders and the Five Factor Model of personality. Journal of Personality Disorders, 44, 362-371.

Costa, P. y McCrae, R. (1992). Professional Manual for the Revised NEO Personality Inventory (NEO-PI-R) and NEO Five Factor Inventory (NEO-FFI): Odessa, Florida: Psychological Assessment Resources.

Cupani, M. Pilatti, A. Urrizaga, A. Chincolla, A. y Richaud de Minzi, M. C. (2014). Inventario de Personalidad IPIP-NEO: Estudios preliminares de adaptación al español en estudiantes argentinos. Revista Mexicana de Investigación en Psicología, 6(1), 55-73.

de la Iglesia, G., Castro Solano, A. y Fernández Liporace, M. (2018). Estandarización argentina del PAI-A. En L. C. Morey (2018). Invenstario de Evaluación de la Personalidad para Adolescentes (pp. 237-245). Madrid: TEA.

de Rivera L. y Abuín, M. R. (2012). LSB-50. Listado de Síntomas Breve. Madrid: TEA.

Derogatis, L. R. (1977/1983/1994). SCL-90-R. Sympton Checklist 90-R. Bloomington, Indiana: Pearson.

Dollard, J., Miller, N. E., Doob, L. W., Mowrer. O. H. y Sears, R. R. (1939). Frustration and aggression. New Haven: Yale University.

Eysenck, H. (1960). The structure of human personality. London: Routledge & Keegan Paul.

Fernández Liporace, M. (2015a). Instrumentos de evaluación de la personalidad. En M. Fernández Liporace y A. Castro Solano (Eds.). Evaluación de la personalidad normal y sus trastornos. Teoría e instrumentos (pp. 107-127). Buenos Aires: Lugar.

Fernández Liporace, M. (2015b). Instrumentos de evaluación de la personalidad normal y patológica. En M. Fernández Liporace y A. Castro Solano (Eds.). Evaluación de la personalidad normal y sus trastornos. Teoría e instrumentos (pp. 129-152). Buenos Aires: Lugar.

Freud, S. (1933). Nuevas conferencias de introducción al psicoanálisis. En S. Freud, Obras Completas (Tomo XXII). Buenos Aires: Amorrortu.

García Cueto, E. (1993). Introducción a la psicometría. Madrid: Siglo XXI.

Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E. & Tatham, R. L. (2010) Multivariate Data Analysis. 7th Edition. Upper Saddle River: Prentice Hall.

Hathaway, S. R. y Mc Kinley, J. C. (1942). The Minnesota Multiphasic Personality Schedule. Minneapolis: University of Minnesota.

Hogan, T. P. (2007). Psychological testing. A practical Introduction, 2^nd Edition. New York: Wiley.

International Test Commission (ITC) (2015). Guidelines for Practitioner Use of Test Revisions, Obsolete Tests, and Test Disposal. Recuperado el 5 de octubre de 2018 de www.intestcom.org/files/guideline_test_disposal.pdf

International Test Commission (ITC) (2016). Guidelines for Translating and Adapting Tests, 2^nd Edition. Recuperado el 3 de octubre de 2018 de https://www.intestcom.org/files/guideline_test_adaptation_2ed.pdf

International Test Commission (ITC) (2018). Guidelines for the Large-Scale Assessment of Linguistically and Culturally Diverse Populations. Recuperado el 1 de octubre de 2018 de https://www.intestcom.org/files/guideline_diverse_populations.pdf.

Kernberg, O. (1984). Severe personality disorders. New Haven: Yale.

Kessler, R. C. y Zhao, S. (1999). Overview of descriptive epidemiology of mental disorders. En C. S. Anshensel y J. C. Phelan, Handbook of Sociology of Mental Health (pp. 127-150). New York: Springer.

Kohut, H. (1971). The analysis of self. New York: International University Press.

Ledesma, R., D. Sánchez, R. y Díaz Lázaro, C M. (2011). Adjective Checklist to assess the Big Five Personality Factors in the Argentine Population. Journal Personality Assessment, 93(1), 46-55.

MacMahon, B. y Trichopoulos, B. (2001). Epidemiología. Madid: Marbán.

Millon, T. (1996). Disorders of personality. New York: Wiley and Sons.

Millon, T. (1997). Inventario Millon de Estilos de Personalidad. Buenos Aires: Paidós.

Milllon, T. (2012). MCMI-III. Inventario Clínico Multiaxial de Millon-III. Madrid: Pearson Psycorp.

Mischel, W. (1968). Personality and assessment. New York: Wiley.

Morey, L. (1991/2007a). Personality Assessment Inventory-Adolescents. Florida: Psychological Assessment Resources.

Morey, L. (2007b). Personality Assessment Inventory. Florida: Psychological Assessment Resources.

Pedrerira Massa, J. L. y Sánchez Gimeno, B. (1992). Métodos de screening de trastornos mentales infanto-juveniles en atención primaria de la salud. Revista Española de Salud Pública, 66(2), 1135-5727.

Pervin (2000). Personality. En A. Kazdin (Ed.). Encyclopaedia of Psychology, Vol. 2 (pp. 100-106). Washington D.C.: American Psychological Association.

Reistma, J. B., Glas, A. S., Rutjes, A. W. S., Scholten, R. J. P. M. Bosuyt, P. M.y Zwinderman, A. H. (2005). Bivariate analysis of sensitivity and specificity produces informative summary measures in diagnostic reviews. Journal of Clinical Epidemiology, 58(10), 982-990.

Rogers, C. (1980). A way of being. Boston: Houghton Mifflin.

Stover, J. B., Castro Solano, A. y Fernández Liporace, M. (2015). Personality Assessment Inventory: Psychometric Analyses of the Argentinean Version. Psychological Reports, (17)3, 799-823.

Tupes, E. C. y Christal, R. E. (1961). Recurrent personality factors based on trait ratings. USAF ASD Technical Report. Lackland, Texas: United States Air Force.

1ra Edición - Diciembre 2018