Mostrando entradas con la etiqueta Pseudoescépticos. Mostrar todas las entradas
Mostrando entradas con la etiqueta Pseudoescépticos. Mostrar todas las entradas

21 de abril de 2024

El "mentirasombroso" Randi y la estafa de su "reto paranormal"

Por Sean Connelly ("Peebrain"), reproducido de PsiPog.net,
https://skepticalaboutskeptics.org


El 29 de enero de 2005 y en la sala virtual de chat, hablábamos sobre el "desafío paranormal" de US$1 millón propuesto por James Randi. Para quienes no lo sepan, la versión breve es que dicho ex-mago está dispuesto a otorgar ese premio a cualquier individuo que constate un hecho o habilidad parapsíquicos. Comúnmente nos preguntan por qué no aceptamos el reto con todo lo que hablamos en PsiPog; claramente podemos ser candidatos, y parece ser dinero fácil. Durante el coloquio, la usuaria Annie observó que el pago era en forma de bonos, no en efectivo, explicando cómo aquéllos pueden "valer" legalmente un millón de dólares, pero en realidad serían del todo inservibles.

Decidí investigar el asunto. Había pensado en "recoger el guante", y sé que algunos de mis amigos también... ¡millones de dólares semejan un dulce muy tentador! Pero al mismo tiempo, he oído que Randi se hizo fama de deshonesto, y como veréis a continuación, el supuesto premio es una estafa.

Empecé enviando un correo electrónico a Randi, y todo fue cuesta abajo desde ese momento. Me llevaría una eternidad precisar los detalles, y serían muy aburridos de leer; por ende, seré conciso. Obviamente estoy sesgado porque jugué un rol clave en esta situación, y no tenéis que confiar en mí por completo. Publicaré los registros de lo sucedido al objeto de confirmar el resumen. Permanezco abierto a cualquier discusión y pregunta; sólo escríbanme por el chat o también a peebrain@psipog.net [N.del T.: se desconoce si la dirección sigue activa].

¿Qué es un bono y por qué es distinto al efectivo? Primero, hay que entender cómo funcionan los bonos. Estaba realmente confundido al inicio, pues si Randi ofrece un millón de dólares, ¿cómo puede ser una recompensa "inútil"? En apariencia es muy claro. Los bonos constituyen certificados de deuda, o básicamente pagarés. Los gobiernos o corporaciones necesitan dinero para financiar proyectos, por lo que acuden a los ricos y les dicen "dennos algo de peculio y les pagaremos intereses; luego de un tiempo, les devolveremos todo su capital”.

Los bonos tienen cuatro elementos clave: el emisor, la tasa de interés, los plazos para devolver el dinero y la cantidad prestada. Veamos un ejemplo. Para su panadería, el señor A. necesita dinero con tal de adquirir un horno, y comienza a percibir ganancias por sus ventas, pero no dispone de fondos para activar los engranajes mayores. Entonces recurre al patrocinador B. y le dice "si me das US$10.000, te pagaré $100 todos los meses durante dos años, y recibirás de vuelta tus 10.000". Esto es atractivo para A. porque puede poner en marcha su empresa y con ello aumentar los ingresos. El trato se cumple, la panadería crece y el dueño está feliz. El rico también está conforme porque le da $10.000 y no tiene que hornear, comprar equipos ni contratar empleados. Vemos así cómo y para qué existen estos lazos: los ricos quieren más dinero y los empresarios pobres desean un negocio exitoso (sé que estoy simplificando todo para que se entienda, y en realidad es un poco más enrevesado).

¿Cómo pueden los bonos implicar dinero legalmente, y a la vez no tener valor? ¿Dónde está el problema? ¿Y si la panadería de A. no tiene éxito y quiebra? ¿Qué pasa con los $10.000? Básicamente, todo se pierde. El rico no recibe sus $100 mensuales y además pierde su caudal.

¿Y cómo se traduce esto en el "desafío" de James Randi? El premio no es en efectivo, sino con bonos que VALEN un millón de dólares. Hubo mucha gente dispuesta a financiar el proyecto y todos dieron pagarés a Randi, que en total suman un millón de dólares. De esta forma, es posible que sean inválidos, pues ¿qué pasa si muchos de ellos son de corporaciones a punto de ir a la bancarrota? ¿Tal vez no tengan que pagar los bonos por otros 40 años? En nuestro ejemplo, A. canceló todo en 24 meses, y a esto se llama "vencimiento" del bono. Algunos títulos prescriben en pocos años y otros luego de décadas. Si Randi otorga un premio que no vence en 40 años, entonces legalmente tengo un millón de dólares, pero no puedo USARLOS hasta que venzan los documentos. Como podéis colegir, hay muchos escenarios diferentes en que los bonos valdrían LEGALMENTE un monto específico, pero en realidad no serían útiles.

El siguiente paso fue averiguar cuánto valen realmente dichos certificados. Envié un email a Randi con la dirección que proporcionó en su sitio; cortésmente señalé el acápite en las Reglas de que la recompensa estaba en bonos, y pregunté qué corporaciones los emitían, y cuáles eran las tasas de interés y fechas de vencimiento. James respondió: "Postule, o váyase".





Le expliqué que buscaba más detalles sobre el premio, lo cual no tenía nada que ver con mis pretensiones, sino sólo eran preguntas encaminadas a obtener datos. Randi escribió: “Inmediatamente convertible en dinero. Eso es todo en lo que me voy a involucrar. Postule o esfúmese”. Mis dudas continuaban igual. "Inmediatamente convertible", pero ¿en cuánto dinero? ¿Y a través de quién?


Escribí de nuevo a Randi, solicitando aclaraciones. No quería ser molestoso, pero de facto no estaban respondiendo. ¿Por qué debía postular en caso que los bonos fueran inválidos? Las Reglas del desafío establecen que eventualmente soy responsable de todos los costos incurridos en la búsqueda del premio, por lo que es muy factible que debiera pasar por una serie de obstáculos engorrosos, gastar mi dinero y quedarme sólo con una pila de certificados vacíos para demostrarlo.

Randi me derivó con un tal Kramer, cuyo trabajo era administrar todas las candidaturas de aserciones paranormales. Se presentaba así en un mensaje: “Randi señaló que me comunique con usted directamente, respecto a sus consultas sobre el desafío de la JREF (...). Me encargo de todas las actividades relacionadas con ello, y podéis escribirme en caso de preguntas”.




De acuerdo. Cortésmente expliqué mi situación a Kramer y formulé las mismas interrogantes. El tipo replicó: “Hasta ahora, estás lleno de mierda. Esa es NUESTRA perspectiva. Postula o lárgate. No tenemos que probarte nada. Si realmente tienes habilidades, las presentarás”. ¡Guau, gracias por la cortesía!






Antes de contactarlos, sospechaba que las cosas se pondrían feas, por lo cual traté de mantenerme dolorosamente educado, lógico y consistente desde el principio. Incluso previo a escribirles, supe que Kramer publicaba conversaciones por email en los foros de su sitio, comentando que un "imbécil" les hacía preguntas. Más tarde encontré el hilo nuevo en dicha página electrónica.

Esperé encontrar un montón de pseudoescépticos burlándose de mí, y así fue. Lo que no imaginaba es que Kramer EDITÓ los correos antes de publicarlos. De improviso, su amable frase "lleno de mierda" quedó como "lleno de tonterías", y el empático "postule o esfúmese" de Randi devino en "tiene sólo dos opciones: participar o abstenerse". También hicieron otros cambios menores para convertir el texto en uno severo, pero cortés.







Ahora bien, ¿es esto un gran problema? En realidad no. Sin embargo, obviamente fue un todo un lío para Kramer, o no se habría tomado el tiempo para elaborar esta manipulación. Por fortuna, mi mensaje aún era transmitido en el registro público del foro. Quizás dicho personaje modificó las entradas para que Randi y él mismo "se vieran mejor", pero mis preguntas seguían ahí. Para mi sorpresa, algunos miembros me apoyaron al corroborar que esas dudas eran legítimas.

Visto que otros usuarios estaban de acuerdo con mi postura, Kramer decidió publicar una respuesta que jamás llegó a mi correo electrónico, y la única razón de haberla descubierto fue porque sabía que él se esforzaba para hacerme quedar como "idiota" en el foro (como hizo con todos los demás que le enviaron mensajes privados). Kramer sostuvo después que el galardón era en EFECTIVO y no bonos. "Vaya", pensé, "esto es una sorpresa". Las reglas establecen: "(...) la JREF pagará al reclamante el resto del premio, por un total de US$1.000.000 (...) en bonos negociables, retenidos por una empresa de inversión en Nueva York". Esto se puede leer de múltiples formas; personalmente, lo interpreto en el sentido de que la recompensa constituye dichos títulos, al tiempo que Kramer decía lo contrario basándose en la cotización del valor. Así que yo era el "idiota", ¿verdad? Por suerte, otros que tal vez no aceptaban la parapsicología eran lo suficientemente cuerdos para ver que mencioné un problema lícito. Si Kramer sostiene que el pago es en efectivo, entonces debieran cambiar la página de reglas.

Durante ese tiempo, comencé a postear en los foros para exponer mi criterio, y señalar también que Kramer había editado las comunicaciones. Los argumentos se veían muy interesantes, pero más lo fue el meollo del asunto: las exigencias no eran transparentes en cuanto a que el premio es en efectivo; y si era en bonos, entonces ¿cuáles son los detalles?

Lo siguiente me dejó totalmente alucinado. Kramer publicó haber "recibido un correo" mío, donde yo "elogiaba su arduo trabajo" y diciéndole que "el malentendido se resolvió". El problema es que jamás acusé recibo de este mensaje. Me quedé en shock. Ahora no se trataba de "ediciones menores" para influir en la gente de un modo u otro, y recurría a una mentira descarada. Pensé que Kramer pudo ser víctima de alguien que se hizo pasar por mí, pero lo cierto es que envié emails a Randi y Kramer desde una cuenta privada, la cual no utilicé para nada más. Nadie en los foros, PsiPog y ni siquiera mis amigos cercanos saben cuál es la dirección. Para que un tercero falsificase el correo, tendría que mandar un mensaje a Kramer desde otra cuenta (lo que debería hacer que éste sospechara), o distorsionar alguno desde la mía (que, nuevamente, conocen sólo yo y los dos interlocutores). Además de eso, Kramer mostró su disposición a manipular correos. Traté de hacer que se investigara el asunto, pero rápidamente se descartó bajo todo tipo de excusas. Y a Kramer no le importaba, por cierto.

La mayoría de foreros acordó que era menester aclarar el tema, porque los detalles no eran convincentes desde el principio; así, alguien ofreció escribir un apartado de FAQs ("Preguntas Frecuentes") sobre el desafío, y publicarlo en el sitio. La idea era que Kramer derivara a los interesados hacia dicho texto y ahorrarle tiempo. En la redacción, su autor planteó una consulta sobre la forma del dinero, y anteriormente ya vimos que era "en efectivo".

El párrafo decía: “Si alguien gana, ¿cómo se le pagará? -Aunque el dinero se mantiene en bonos como forma de mostrar al público que realmente existe, los certificados se convertirán a dólares estadounidenses antes de pagarse. Los primeros $10.000 en metálico se cancelarán con cheque, tal como establecen las reglas. El método común para otorgar una cuantía grande como los $990.000 restantes es mediante transferencia electrónica, y es razonable suponer que así es como se pagará también este premio en metálico”.

Esto es lo que Kramer había estado diciendo todo el tiempo, y eso se identificó como el origen de "mi confusión". Al tipo le encantaron las FAQs y decidió postearlas oficialmente; por supuesto, hizo algunas modificaciones al borrador y dejó el texto de la siguiente forma:

“Si paso la prueba formal y gano el desafío, ¿cómo me pagarán? -Los primeros $10.000 en metálico se pagarán con cheque, como establecen las reglas, inmediatamente después de la demostración exitosa. El dinero se mantiene en forma de bonos, con tal de mostrar al público que el capital realmente existe. Estos certificados convertibles se darán al ganador dentro de los 10 días posteriores a la aprobación del testeo formal. El método de transferencia de dichos bonos quedará a discreción de la JREF y el ganador, de acuerdo con los estándares legales aceptables”.

N.del T.: El 1 de abril de 2007, la JREF presentó el nuevo Reglamento de Postulación, aumentando sus cláusulas de 12 a 16 y manteniendo el aserto que Connelly impugnó.

Y al final, resulta que el premio SON LOS BONOS. Mi suposición original era correcta después de todo, y mis preguntas siguen en el aire. ¿Qué se puede decir? Lo más obvio es que Kramer ciertamente no es digno de confianza. Editó correos electrónicos, dijo a todos que el premio era "en efectivo", y nadie sabe de dónde vino el email falso (Kramer tampoco mostró información para averiguarlo). Al momento de escribir esto, el sujeto no abordó los escollos iniciales que provocaron todo este fiasco (recapitulando, quién emitía los bonos, cuáles eran las tasas de interés y las fechas de vencimiento).

Si bien los integrantes del mencionado foro muestran diversos niveles de incredulidad, Kramer no muestra nada relacionado con el escepticismo verdadero y saludable. Su mente es la de un fundamentalista egocéntrico: él tiene razón, todos los demás se equivocan y "está bien trastocar la verdad" para convencer. Si alguien de ustedes considera participar en el "desafío paranormal" por Randi, sería muy ingenuo al pensar que es "tan claro y simple" como lo describen. Cuando firmes la solicitud, estarás amarrándote a un contrato con ellos. Y si les resulta tan difícil jugar limpio cuando se trata de unos cuantos mensajes, imaginemos cómo actuarán cuando exista un millón de dólares en disputa... suponiendo que los bonos realmente valgan.

17 de febrero de 2023

Tres ejemplos de "investigación" pseudoescéptica

Por Chris Carter, "Science and Psychic Phenomena" (2007), capítulo 8


[N.del T.: los subtítulos se reformularon en esta versión para resumir el contenido].

En su clásico artículo "Rhetoric over Substance", Charles Honorton señaló una distinción importante entre la controversia psi y los altercados científicos más ortodoxos. Los desacuerdos normalmente ocurren entre grupos de investigadores que formulan hipótesis, diseñan experimentos y luego reúnen datos para probar teorías, pero como escribió Honorton: “Por el contrario, la 'reyerta psi' se caracteriza en gran medida por disputas entre un conjunto de pesquisantes, parapsicólogos y un sector de críticos que no realiza averiguaciones experimentales para probar asertos psi, o la viabilidad de sus contrahipótesis” (1).

Dicha ausencia de indagatoria puede sorprender a cualquiera cuya principal fuente informativa haya sido la literatura escéptica "a medias". Por ejemplo, en 1983 Martin Gardner sostuvo: "¿Cómo puede saber el público que, durante cincuenta años, los psicólogos dubitativos han venido haciendo todo lo posible para replicar experimentos psi clásicos, y con un notable fracaso? Es este hecho, más que cualquier otro, lo que ha llevado al estancamiento perpetuo de la parapsicología. La evidencia positiva sigue originándose en un pequeño club de entusiastas, mientras la negativa sale desde conglomerados mucho más grandes de [pseudo] escépticos" (2). Honorton respondió: “Gardner no intenta documentar esa afirmación, y tampoco podría hacerlo. Son sólo patrañas. Busquen acerca de experimentos por escépticos postizos, y verán lo que encuentran”. En su mayor parte, los adversarios simplemente critican desde fuera y no han redituado ningún análisis experimental propio.


Susan Blackmore: del desconcierto a la... ¿honestidad?

Una notable excepción ha sido la psicóloga británica Susan Blackmore. Comenzó su doctorado en parapsicología durante los '70, pero afirmó repetidamente no poder encontrar ninguna evidencia psi. Por ejemplo, hacia 1996 relató: “Cuando decidí convertirme en parapsicóloga, no tenía idea de que eso significaba 20 años sin poder encontrar lo paranormal" (3). Blackmore se forjó carrera como una de las [pseudo] escépticas más famosas del mundo, y en 1988 fue designada miembro del CSICOP (Comité para Investigación Científica de Afirmaciones Paranormales).

En varias publicaciones, Susan expresó que cada vez se tornaba más incrédula sobre la existencia de fenómenos psíquicos, tras "diez años de intensa investigación en parapsicología" (4). Esa postura llevó al especialista Rick Berger a analizar críticamente los experimentos de Blackmore en gran detalle, y descubrió que "el alegato de 'diez años de investigación' en realidad representa una serie de estudios planificados, cumplidos e informados con premura, y dirigidos principalmente en un lapso de dos años" (5). Ni más ni menos, consistieron en un conjunto de experimentos realizados entre octubre de 1976 y diciembre de 1978 para su tesis final de doctorado.

Blackmore informó veintinueve pruebas completadas en esos dos años, de los cuales veintiuno se publicaron como indagatorias separadas en cinco artículos de revistas parapsicológicas. Siete de aquéllas produjeron resultados estadísticamente significativos, pero si bien constituyen la base de su afirmación de tener "fallas en ubicar evidencia paranormal", ¡las probabilidades de que siete éxitos entre veintiún intentos ocurran por casualidad son más de veinte mil a uno!

Entonces, ¿cómo armoniza esto con la salmodia de que "su propia investigación la llevó a convertirse en escéptica"? Como dice Berger, aplicó doble rasero a sus experimentos. Cuando éstos parecían mostrar evidencia psi, los resultados se descartaron por "errores en el proceso", pero si no dejaban entrever constataciones, ella simplemente ignoró la calidad del estudio.

Hay muchas irregularidades de diseño que pueden generar resultados positivos falsos, pero también otras que conducen a falsos negativos, como un tamaño de muestra inadecuado (potencia estadística baja), muestreo inconveniente, etc. Berger escribe: "La base de datos de Blackmore está repleta con ejemplos sobre tales fallas (6) (...) Algunos [incluida ella] argumentan que pueden mantenerse diversos estándares de diseño experimental según el desenlace del estudio: los resultados positivos e importantes deben tener concepciones más estrictas que el mismo testeo con resultado negativo. Esa determinación post hoc de la crítica experimental conduce a la paradoja ejemplificada por el trabajo de Blackmore: si éste último expusiera resultados consistentemente positivos, todos ellos podrían descartarse por haber surgido desde 'fallas de diseño' (...) Las conclusiones negativas según experimentos deficientes no deben tener más peso que las positivas, basadas en los mismos controles viciosos" (7).

En otras palabras, nuestra decisión para invocar errores en el estudio para omitir resultados no debe estar influenciada por nuestras ideas preconcebidas sobre cuál “debería haber sido” la secuela. Pero esto parece ser exactamente lo que hizo Blackmore para justificar sus creencias, e incluso comentó: "(...) si usted no encuentra evidencia de P.E.S [percepción extraensorial], ¿qué va a decir? ¡Que no ha sido capaz de encontrar algo que, según la ciencia, no debió haber estado allí en primer lugar!" (8).

Como veremos, la retórica de Susan es emplear a menudo esta apelación a lo "científico" como un cuerpo inamovible de conclusiones que nos dicen de antemano cómo deberían salir los experimentos. Berger observó: "El argumento de que su base de datos 'no presenta evidencia psi' es infundado, porque la gran mayoría de sus estudios fueron creados, hechos y reportados en forma descuidada, y en su propia evaluación eran individualmente defectuosos. Como tal, no deben extraerse conclusiones de dicha base (...) es muy palabrera al denostar averiguaciones psi en sus escritos, televisión y radio, y ante los camaradas de CSICOP, citando su propio trabajo como soporte para ese firme aplomo" (9).

Y en un artículo posterior, Berger añadía: "Blackmore consiguió un sitio de preeminencia en la comunidad 'escéptica', basada en su conversión de creyente a miembro del CSICOP durante 'diez años de pesquisas negativas'. A pesar de su énfasis en lo contrario, creo que mi repaso a su estudio logró un fin constructivo al indicar que dicha metanoia no mostró base científica en su propia actividad experimental" (10).

El mismo número de la revista también incluye una respuesta de Blackmore a Berger, donde ella reconoció: "Estoy de acuerdo en que uno no puede elaborar conclusiones sobre la realidad psi, basándose en estos experimentos" (11). Hacia el final de su crítica, aquél declaró: “Durante mi metanálisis interrumpido del trabajo publicado por Blackmore, me sorprendieron los patrones de datos que sugerían el funcionamiento del psi (...) Sin un metaestudio serio del material fuente e inédito, completado con ponderación de fallas (...) no puede resolverse el problema de si los ensayos hechos [por Susan] muestran evidencia psi" (12).

Presumiblemente ansiosa por corregir el traspié, Blackmore respondió: "Estoy a tono con su sentencia final: 'Debe considerarse injustificado elaborar cualquier conclusión -positiva o negativa- sobre la realidad psi basada en los experimentos de Blackmore'” (13).

Es interesante examinar los textos de Susan antes y después de la crítica por Berger. Dos años antes, confesaba en un artículo para Skeptical Inquirer titulado “The Elusive Open Mind: Ten Years of Negative Research in Parapsychology”: "¿De qué manera podría comparar mis propios resultados con los de otras personas, teniendo en cuenta que los míos tendían a ser negativos y los otros favorables? Tenía que hallar algún tipo de equilibrio. Los dos extremos eran que simplemente no podía creer en mis resultados e ignorar otros, y viceversa (...) Eso sería aún más inútil. No habrían hecho sentido todos esos años de experimentos si no hubiera tomado en serio mis conclusiones” (14).

En otro artículo exhibido casi al mismo tiempo, reconocía: "Desde luego, el otro gran desafío para un escéptico es que hay evidencia opuesta y positiva en literatura parapsicológica. No podía ignorarlo todo. Y eso plantea una inquietud: ¿cuánto peso puedes o debes dar a los resultados de tus experimentos sobre aquéllos de otras personas? Por un lado, los tuyos deberían ofrecer más consistencia, pues sabes exactamente cómo se obtuvieron (...) Por otro lado, el sector científico necesariamente es una empresa colectiva (...) No podía usar mis fracasos como 'evidencia justificable' de que el psi no es real, y tenía que considerar el éxito de otros. Me pregunté mil veces, como hago ahora: ¿existe una conclusión correcta? No lo sé, y es la única respuesta que puedo dar tras diez años de intensos análisis" (15).

Después de la crítica por Berger, estuvo dispuesta a conceder en una revista académica que "no pueden extraerse inferencias sobre la realidad psi basándose en dichos experimentos", pero sus escritos en la prensa popular no han reflejado esta admisión, conocida en 1989. Comentaba así los ensayos Ganzfeld en un texto de 1996: "Mi corolario está sesgado por mi experiencia. Intenté el primer control Ganzfeld en 1978, cuando el procedimiento era novedoso (...) Por supuesto, los nuevos resultados de Autoganzfeld son aún mejores. ¿Por qué debería ponerlos en duda por causa de eventos pasados? El problema es que mi experiencia entra en conflicto con los éxitos que aparecen en la literatura, y no puedo ignorar ninguna de las partes. La única reacción honesta es decir 'no sé'" (16).

¿No sería más honorable si Blackmore admitiera en público que "no podemos extraer deducciones sobre fenómenos psi" fundamentada en sus experimentos, y que una opinión científica debe apoyarse únicamente en una evaluación crítica de obras por otras personas? Quizás estemos pidiendo mucho; al fin y al cabo, ella obtuvo su Ph.D. para convertirse en una "parapsicóloga famosa" (17). Habiendo fracasado en producir estudios que respaldaran la hipótesis psi, evidentemente trató de hacerse un nombre atacando esa teoría, que en ese momento debió parecerle un blanco fácil. No obstante, en un artículo reciente describe: “Finalmente me di por vencida, y ahora que lo pienso me siento un poco triste. Hace más de tres décadas tuve la impresionante vivencia extracorpórea que me convenció de la realidad de los fenómenos psíquicos (...) Sólo unos pocos años de cuidadosos experimentos cambiaron todo eso. No encontré ningún fenómeno relacionado (...) y me volví escéptica.

Entonces, ¿por qué no me rendí antes? Hay muchas malas razones. Admitir que estás equivocado siempre es difícil, aunque es una habilidad que todo científico necesita aprender. Y comenzar de nuevo, en un ámbito extraño, es una perspectiva desalentadora. También lo es perder todo el rango o influencia de 'ser experto'. Reconozco que disfruté mi conocimiento ganado con tanto esfuerzo (...) Nada de eso lleva a alguna parte, y es una buena causa para retirarse. Pero tal vez el motivo real es que estoy demasiado agotada, sobre todo para conservar una mente abierta. No podía descartar todas esas afirmaciones extraordinarias sin más. Después de todo podrían ser ciertas, y si lo fueran, entonces tendrían que recomponerse algunos sectores de la ciencia".


Richard Wiseman: escondiendo la cabeza bajo el ala

Este es otro psicólogo inglés que continúa el "trabajo" de su predecesora. Wiseman está muy bien financiado por múltiples organizaciones [pseudo] escépticas, es miembro del CSI y aparece con frecuencia en medios británicos para condenar y desacreditar la investigación psi. Fue mencionado anteriormente (...) como uno de los autores del informe que pretendía "desbancar" los corolarios de experimentos Ganzfeld, utilizando una metodología defectuosa y estadísticas chapuceras.

Al igual que Blackmore, Richard es inusual pues en ocasiones sí realiza experimentos, en lugar de sólo criticar desde el margen. Y como aquélla, insiste majaderamente en que "nunca ha encontrado evidencias" (...).

Una de las experiencias más difundidas por él involucra a un perro llamado Jaytee. Su dueña, Pamela Smart, relató que la mascota podía anticipar su llegada a casa, incluso en momentos impredecibles. Era un terrier de raza mixta, adoptado a las pocas semanas de edad y se encariñó mucho con Pam. Cuando trabajó como secretaria en Manchester, dejaba al perro con sus padres jubilados que vivían en una casa colindante, y ellos notaron que en varias jornadas -alrededor de las 16.30 h.- Jaytee solía esperar junto a la ventana cuando Pam estaba de camino. Dado que ésta última laboraba en horas de rutina, los padres asumieron que el comportamiento del can se basaba en algún "sentido del tiempo".

Pamela fue despedida en 1993, y durante un periodo no mantuvo un horario regular. Sin embargo, los ancianos se percataron que Jaytee aún "predecía" el regreso de aquélla, inclusive en momentos repentinos, y por lo visto comenzaba su espera en el instante que la mujer emprendía el recorrido de vuelta.

En abril de 1994 Pam leyó en el Sunday Telegraph sobre una investigación efectuada por Rupert Sheldrake, sobre mascotas que parecían saber cuándo los amos retornaban al hogar. Se puso en contacto y participó como voluntaria en sus pruebas. La primera fase consistía en que los padres llevaran un registro del comportamiento de Jaytee en ausencia de la hija. Entre mayo de 1994 y febrero de 1995 tomaron nota en cien ocasiones cuando estaba fuera; ella también anotó el lugar a donde iba, cuánto tiempo estuvo, qué distancia recorrió y cómo y en qué instante volvió. En 85 instancias el registro señaló que Jaytee esperaba generalmente con diez minutos o más de anticipación.

Cuando Sheldrake analizó la información estadísticamente, descubrió que las conductas de Jaytee estaban muy relacionadas con el momento en que su dueña iniciaba el regreso. Tampoco parecía importar cuán lejos estaba o qué vehículo utilizó, ya fuera su automóvil, una bicicleta o un taxi. Sin embargo, en quince de cien ocasiones el animal no reaccionó; en algunas de ellas los investigadores concluyeron que estaba indispuesto o había una perra en celo en un sector vecino. No hubo explicaciones obvias respecto a tres oportunidades, y así Jaytee no siempre reaccionaba cuando Pam se dirigía a casa y él podía distraerse.

En esta etapa, Sheldrake decidió videograbar las conductas para tener registros más precisos y objetivos. Justo en ese momento fue contactado por la unidad científica de la Televisión Estatal de Austria (ORF), que manifestó interés en divulgar un experimento con el perro. Se diseñó un modelo en que un grupo filmaría continuamente a Jaytee en el departamento de los padres, mientras el otro seguía las actividades externas de Pam.

El ensayo se concretó en noviembre de 1994. Pam salió, y ni ella ni sus padres sabían la hora seleccionada al azar en que le pedirían su regreso, lo cual ocurrió tres horas y 50 minutos más tarde. Cuando se transmitió el experimento la pantalla fue dividida en dos, mostrando a la mujer de un lado y Jaytee del otro en perfecta sincronización temporal. Antes de solicitar a Pam que volviera, la mascota permanece acostada cerca de la señora Smart, y casi inmediatamente después de avisar la partida, el can muestra signos de alerta. Tras once segundos y mientras la dueña camina hacia la parada de taxis, el perro se aproxima al ventanal y espera allí hasta encontrarse con Pam al cabo de 10 minutos.

No había manera de que Jaytee supiera por medios sensoriales y comunes que su ama regresaba, y considerando su respuesta antes que ella subiera al vehículo, parecía haber respondido a sus intenciones. En otras palabras, la respuesta del can pareció ser telepática.

Luego de recibir un subsidio por la Fundación Lifebridge (Nueva York), Sheldrake comenzó sus testeos grabados con Jaytee en mayo de 1995. Desde esa fecha hasta julio de 1996 se realizaron 30 videos de sus conductas normales mientras Pam permanecía fuera. A los padres no se les dijo cuándo regresaría, y por lo común la hija no estaba segura. Los resultados indican que Jaytee esperó mucho más si ella venía en camino que en el caso contrario, lo cual fue estadísticamente significativo (p < 0,000001).

Pronto los investigadores notaron que Jaytee respondía incluso cuando Pam salía en momentos seleccionados al azar. Este fue un descubrimiento relevante, ya que descartaba una explicación basada en "rutinas" o "expectativas" según el comportamiento de los padres. En consecuencia, se registraron doce experimentos más donde la mujer volvía en horas fortuitas, determinadas por lanzamiento de dados tras abandonar el domicilio.

Figura 8.1. Resultantes por Sheldrake (regresos aleatorios), obtenidas en doce controles videograbados. El gráfico muestra con claridad que Jaytee aguardó mucho más tiempo cuando Pam viajaba de vuelta, que durante el período principal de su ausencia (55% vs. 4%). La desemejanza es muy significativa en términos estadísticos, con un valor p de 0,0001, lo que implica probabilidades contra el azar de más de 10.000 a 1.

El patrón general de la respuesta canina puede apreciarse en la figura 8.2, que sintetiza los resultados promedio de ausencias largas, medianas y breves. El eje horizontal muestra las series de diez minutos (p1, p2, etc.) desde que Pam salía hasta su retorno, y el último indica los primeros diez minutos de la trayectoria de vuelta. Esto señala que Jaytee pasó más tiempo en la ventana durante el regreso, y comenzó a esperar poco antes que ella lo iniciara, pues estaba pensando en ir a casa. Tras el experimento difundido por la ORF, aparecieron varios reportes en televisión y periódicos británicos/europeos.

Los periodistas buscaron a Wiseman para analizar las repercusiones, quien sugirió posibles factores como "tiempos habituales de regreso" o "memoria selectiva" que Sheldrake probó y descartó. Sin embargo y en lugar de debatir, éste simplemente invitó a Richard a elaborar pruebas por su cuenta, en tanto que Pam y su familia accedieron gentilmente a colaborar.



Figura 8.2. Serie temporal de esperas por Jaytee en la ventana durante ausencias largas, medias y cortas. Los gráficos representan promedios de once experimentos continuos, siete medianos y seis breves (Sheldrake, Dogs That Know When Their Owners Are Coming Home, p. 61).

En sus cuatro ensayos, Wiseman grabó a Jaytee mientras su asistente Matthew Smith salió con Pam y registraba todo en cámara. Permanecieron en bares u otros sitios a una distancia entre 8 y 20 kms. y regresaban en momentos escogidos al azar por Smith; éste los conocía de antemano, pero no avisaba a Pam hasta cumplirse la hora.

De vuelta en la casa, Wiseman tampoco sabía el instante del retorno. Además, ellos viajaban en taxi o el automóvil de Smith, para eliminar la posibilidad de que Jaytee reconociera el motor de un vehículo familiar. Se realizaron tres experimentos en el domicilio de los padres de Pam, similares a los conducidos por Sheldrake (ver figura 8.3). El cuarto fue practicado donde vivía la hermana de aquélla, pero Jaytee enfermó en el transcurso.

Al igual que en las instancias generadas por Sheldrake, el perro estaba mucho más tiempo en la ventana cuando Pam venía de regreso que durante la fase principal de ausencia (78% vs. 4%). Con sólo tres ensayos, el tamaño de la muestra era pequeño, pero los resultados aún eran estadísticamente significativos, con un valor p de 0,03. En otras palabras, Wiseman había replicado el producto de su contendor.

Figura 8.3. Resultados por Wiseman.

Sin embargo y para asombro de Sheldrake, en el verano de 1996 Richard participó en conferencias sosteniendo "haber rebatido" el fenómeno de la "mascota psíquica", y continuó en TV menospreciando las habilidades de Jaytee. ¿Y cómo justificó sus deducciones? Usó un criterio arbitrario para el éxito del experimento que le permitió ignorar la mayoría de datos reunidos. Si Jaytee iba a la ventana "sin motivo aparente" en cualquier momento de la prueba, Wiseman descartaba el resto de información juzgando la instancia como un "fracaso". Estos “errores” aparecieron durante el 4% del tiempo que el can permaneció en la cristalera mientras Pam se hallaba al exterior. Luego prescindió de otros datos, a pesar de que el animal mostró dicha conducta el 78% del tiempo cuando la mujer emprendía el regreso.

Sheldrake se reunió con Wiseman en septiembre de 1996 y le señaló que sus datos exhibían el mismo patrón que los recopilados previamente. El biólogo dejó en claro que, lejos de cuestionar sus conclusiones, el trabajo de Richard las confirmó, e incluso le otorgó copias de gráficos sobre sus experimentos (la figura 8.4 resume los derivados conseguidos por Wiseman en casa de los padres de Pam).

Según los estándares de Richard, sólo el cuarto test -casa de la hermana- fue un éxito parcial, porque Jaytee miraba a través del vidrio "sin razón aparente" y por primera vez durante la fase en que Pamela volvía (la cinta mostró que su acercamiento al ventanal coincidió exactamente con el retorno). Sin embargo, Wiseman no lo consideró satisfactorio pues el animal no se quedó allí por al menos dos minutos, sino que "se alejó del lugar y vomitó".

Durante los siguientes dos años, Wiseman anunció repetidamente en los medios que había "desacreditado" la facultad del terrier para pronosticar el regreso de su dueña. Por ejemplo, en el programa británico Strange but True aseveró: “En uno de cuatro experimentos respondió en el instante correcto; no fue una tasa de aciertos muy impresionante y podría ser sólo coincidencia" (19; ver ilustración siguiente).



Figura 8.4. Resultados de Wiseman para tres controles en el hogar de Pam. Las flechas indican períodos tras los cuales el psicólogo excluyó datos. Los puntos finales de cada gráfico representan los primeros diez minutos del viaje de regreso, señalados por un círculo negro.

Wiseman subestimó el análisis gráfico de sus datos por Sheldrake, llamándolo "post-hoc" e implicando de alguna manera que "no es científico" evaluar la información obtenida por otra persona. Sin embargo, es importante recordar que Rupert aplicó exactamente el mismo parámetro a su indagatoria, dos meses antes que Richard se entrometiera y durante los dos años siguientes.

(...) El criterio sesgado de Wiseman puede explicarse con una analogía. Supongamos que él quisiera probar la afirmación de que "un tratamiento nuevo y radical para una forma de cáncer es más prometedor que los métodos convencionales"; encuentra que un sujeto en el grupo de control exhibe una mejoría “sin razón aparente” en cualquier fase del experimento, y en consecuencia lo declara "fallido". A la vez, ignora buena parte de sus datos y anuncia a la prensa que, mediante sus "averiguaciones", la nueva terapia no posee un mayor índice de éxitos a pesar de la evidencia a largo plazo que sostiene lo contrario.

Sheldrake hizo dos declaraciones basadas en sus datos: (a) el perro permanecía más tiempo en la cristalera cuando su propietaria venía de vuelta que en el caso opuesto, y (b) la diferencia era estadísticamente representativa. Los resultados de Wiseman muestran igual patrón, y debería ser obvio que si el terrier iba o no a la ventana en algún momento “sin razón ostensible”, no tiene importancia con respecto a la verdad o falsedad de dichos corolarios.

Posteriormente, Blackmore trató de salvar a Richard en un artículo periodístico, asegurando que había un "equívoco fatal" en el trabajo de Sheldrake. Éste último llevó a cabo 12 experimentos donde llamó a Pam en momentos aleatorios para pedirle que regresara. Seguramente Jaytee no podría estar desplegando poderes normales, ¿verdad? Pero hay otro problema simple: cuando ella se va por primera vez, el perro se sienta y no camina hacia el ventanal. Cuanto más tiempo aquélla está fuera, su amigo cuadrúpedo va a observar con más frecuencia (20).

El punto de Blackmore es que Jaytee pasa cada vez más rato junto a la ventana cuanto más tiempo su ama está fuera, y lo mismo mientras ella viaja de regreso, pero "no porque tenga alguna habilidad telepática". Al ver los datos reales acreditamos fácilmente que el comentario de Susan no es cierto. Por ejemplo, la figura 8.2 expone que durante las ausencias cortas, el can pasa la mayor parte del tiempo "en vigilancia" cuando Pamela retorna al domicilio, pero no hay un aumento comparable en el tiempo tomado por aquél en este mismo período durante las ausencias medias y prolongadas. De igual manera, en el periodo n° 11 de ausencias largas no aparece el máximum de tiempo que el perro invierte en dicho sector cuando la mujer vuelve durante las ausencias medias.

Sheldrake también elaboró múltiples videos en las jornadas que Pam no llegaba a casa hasta muy tarde, o se quedaba fuera toda la noche (figura 8.5). Este material sirve como control y expone que Jaytee no iba con más asiduidad a la ventana cuanto más tiempo aquélla permaneció fuera. Nuevamente, un examen minucioso de las pruebas muestra la necesidad de tratar con escepticismo las afirmaciones de estos pretendidos "escépticos".

Figura 8.5. Tiempo que Jaytee estuvo cerca de la cristalera, en las tardes cuando Pam no regresaba a casa durante el experimento, en períodos de diez minutos (promedios de diez noches).

En conferencias públicas y programas televisivos, Wiseman declaró una y otra vez haber opugnado los dones de Jaytee. En abril de 2004 aún exponía dicha "conclusión" en su sitio de internet, pero como señala Sheldrake, "sus presentaciones son deliberadamente engañosas (...) No menciona que el animal espera mucho más en la ventana cuando Pam va de camino a casa, ni tampoco refiere a mis ensayos. Quiere hacernos creer que mis pruebas se fundamentan en una experiencia filmada por una compañía de televisión, en lugar de más de doscientos controles, e insinúa que él ha realizado los 'únicos' testeos científicos y rigurosos sobre las aptitudes del perro. Confieso que estoy asombrado por su persistente malicia" (21).

A pesar de demostrarse que su crítica de los estudios Ganzfeld es claramente errónea, y que sus investigaciones con Jaytee validaron los resultados de Sheldrake, Wiseman todavía dice alegremente a los medios que "nunca se ha encontrado con un experimento paranormal que se pueda replicar” (22).


James Randi: la mitomanía disfrazada de ignorancia

Por lo menos, Blackmore admite que los resultados de experimentaciones destacadas le producen confusión. Pero otro célebre "crítico" simplemente pasó por alto los estudios Ganzfeld; de hecho, su "trabajo" fue tan mediocre para el escudriñamiento serio que, en su mayor parte, los parapsicólogos no le prestaban atención. En su artículo sobre [pseudo] escepticismo, Honorton le dedica sólo un párrafo:

"La contribución de Randi es puramente polémica y no aborda de manera sustancial los temas científicos que subyacen a la controversia psi. Sus comentarios despectivos sobre el metanálisis sugieren que no lo comprende, y desconoce su empleo generalizado en la medicina y las ciencias del comportamiento. La habilidad de Randi como mago es bien conocida, pero a pesar de las afirmaciones muy publicitadas de 'experiencia metodológica', su capacidad para diseñar experimentos psíquicos científicamente adecuados no es del todo evidente al analizar sus esfuerzos públicos. Por ejemplo, ocurren graves debilidades técnicas y errores estadísticos en su libro sobre constancias de percepción extrasensorial, y sus pruebas televisadas de psíquicos" (23).

Esta era la opinión de Randi sobre la libertad académica, extraída del libro Flim Flam!: "La audiencia ha sido mal atendida por científicos que se apoyan en su considerable reputación en otros campos para dar peso a sus declaraciones sobre parapsicología. He visto que poseer una licencia de conducir permite manejar sólo si no se abusa del privilegio, y tal vez los doctorados debieran ser igualmente retractables en ciencias" (24).

Randi, quien no era científico, pensó que cualquier especialista contrario al fundamentalismo del CSICOP debería ser excomulgado por el delito de herejía. Uno de ellos seguramente sería Rupert Sheldrake, quien obtuvo su Ph.D. en bioquímica en la Universidad de Cambridge, y escribe lo siguiente:

"Un ejemplar de la revista Dog World (enero de 2000) incluía un artículo sobre el posible sexto sentido en perros, que analizaba parte de mi investigación. Allí citan a Randi sobre la ESP canina: 'En la JREF [fundación creada por éste] probamos esas declaratorias y no son verdaderas'. No se incluían pormenores de aquéllo, y envié un correo electrónico a Randi para pedírselos. Jamás respondió, y asimismo ignoró un segundo mensaje.

Luego insté a los miembros del Consejo Científico de la JREF que me ayudaran a saber más sobre esta declaración; de hecho, colaboraron aconsejando a James que respondiera. En un e-mail del 6 de febrero de 2000 dijo que las pruebas aludidas no se realizaban en la JREF, sino que databan de 'hace años' y eran 'informales'. Se remitían a dos canes pertenecientes a un amigo suyo, que observó durante dos semanas. Todos los registros se habían perdido, y escribió: 'Exageré mi caso por dudar de la realidad atañente a la percepción extrasensorial en perros, en función de la reducida cantidad de datos que obtuve. Fue insensato e impropio de mi parte'.

Randi también afirmaba desacreditar uno de mis experimentos con Jaytee, parte del cual se mostró en televisión. El perro se acercó a la ventana para esperar a su dueña cuando comenzaba el regreso a casa, y no antes de partir. En Dog World, James declaró: 'Al ver la cinta completa, se aprecia que el animal responde a cada automóvil y persona que transitaba', lo cual simplemente no es verdad, y ahora él reconoce que nunca ha revisado el material" (25).

Randi publicitaba un "desafío" a los psíquicos, en el cual recompensaría con un millón de dólares por cualquier demostración convincente de capacidad análoga, y en circunstancias controladas. El problema es que el propio Randi actuaba como "policía" y "juez", y por sus innumerables comentarios despectivos e insultantes sobre la parapsicología -amén de su participación financiera en esa campaña hostil-, difícilmente se le podía considerar un "observador imparcial". También él decidía quién iba a ser evaluado, y se negó explícitamente a probar al menos un individuo, el homeópata John Benneth. Randi también escapó de un reto lanzado por la doctora Jule Eisenbud, quien apostó US$10.000 a que James no podía duplicar la “fotografía de pensamiento” por Ted Serios, incluso con ayuda de un accesorio en que se escondería un dispositivo truculento (26). Más típicamente, ignoró otras proposiciones como testear al psíquico inglés Chris Robinson por televisión en vivo.

Ocasionalmente, Randi parecía estar de acuerdo con una prueba seria. Dick Bierman, psicólogo por la Universidad de Amsterdam y Ph.D. en física experimental, lleva más de 25 años publicando ampliamente en sus campos de estudio, y aceptó el reto del ilusionista para un control que mostrara una forma de precognición conocida como presentimiento, a lo que Randi contestaba: "Gracias por su respuesta. Entregué el mensaje a mi colega, Andrew Harter, para consideración previa, y eventualmente pasará a varios colaboradores que me darán sus sabias opiniones. Eso no debería tomar mucho tiempo (...) Me mantendré en contacto con usted mientras consideramos su solicitud". Bierman después comentó: "Básicamente, esto fue seguido por otros intercambios irrelevantes entre él y yo, y nunca más volví a escuchar algo sobre mi propuesta" (27).

Randi también insistía en una "prueba preliminar" antes de la comprobación real, y jamás permitió que alguien la superara. Esto implica que el “desafío” no era más que un truco publicitario. Incluso el psicólogo Ray Hyman, miembro del CSI/CSICOP, sostuvo que este “premio” no puede tomarse en serio: “Los científicos no resuelven incógnitas con una sóla pesquisa; e incluso si alguien ganara un premio suculento, esto no va a convencer a nadie. La prueba en ciencia ocurre a través de la replicación, no por experimentos individuales" (28).

Con respecto a su "desafío", se mencionaba a Randi espetando "siempre tengo una salida" (29); sin embargo, fue objeto de varios juicios costosos por sus persistentes difamaciones, y en mayo de 1991 renunció al CSICOP para evitar que fuera imputado en demandas posteriores.

¿Dónde estamos ahora en relación a este conflicto entre semi-incredulidad y los hechos metapsíquicos? El ex miembro del CSICOP Marcello Truzzi resumía así la historia de la parapsicología en laboratorio:

"A medida que los defensores de anomalías generan evidencias más duras, los críticos han ampliado el marco de la portería (...) Para convencer a los científicos de lo que simplemente había sido respaldado por pruebas anecdóticas y generalizadas, aunque débiles, los parapsicólogos trasladaron la investigación psíquica al laboratorio. Cuando se presentaron resultados experimentales, despreciaban los diseños, y al mejorar los protocolos se exigió una 'prueba de fraude' o un 'experimento crítico'. Cuando éstos se mostraron, hubo exigencia de replicaciones, y no contentos con ello los oponentes argumentaban que podrían generarse por 'nuevas formas de error' (como aquél del "cajón de archivos" que podía resultar de estudios negativos no publicados). Luego se recurrió al metanálisis para contrarrestar ese problema, siendo descartado por pseudoescépticos como 'controvertido', y la P.E.S. se redujo a 'un equívoco en algún lugar' actual e impreciso, en la forma de lo que Ray Hyman llamó 'argumento del tubo de ensayo sucio' (es decir, alegar 'contaminación' en el instrumento, haciendo que los fenómenos psi quedaran como meros artefactos). Y en un caso, cuando los burlones no hallaron contraexplicaciones, describían el resultado como 'simple anomalía fútil', proscribiéndolo a un juego de rompecabezas. Ahora los postes del arco se han movido a una zona donde algunos críticos tienen posiciones infalsificables" (30).

Susan Blackmore pareció esconderse en esta trinchera, al menos como señalaba en 1995: "Soy escéptica porque creer en el psi no me lleva a ninguna parte (...) No estoy aguardando por evidencia aún más fuerte (...) [sino a que] la hipótesis psi alcance el punto en que haga más trabajo científico que generar rechazo. No creo que se haya logrado dicho nivel, y en consecuencia estoy conforme con llamarme escéptica" (31).

En otras palabras, Blackmore puede autoproclamarse "incrédula" sin importar las pruebas ofrecidas por investigadores, pues en respuesta siempre afirmará que "creer en ello no me conduce a ningún lado". Esta trivialización de la realidad psi es sorprendente, considerando que proviene de alguien que decía haber pasado treinta años buscando hechos sólidos (...).


Observaciones finales

Esta no es la primera vez que los estudiosos finalmente semejan presentar casos sólidos para la realidad psi. En 1955 el doctor George Price, entonces investigador asociado del Departamento de Medicina en la Universidad de Minnesota, publicó un artículo en la prestigiosa revista Science, manifestando: "Los creyentes en fenómenos psíquicos (...) parecen haber obtenido una victoria decisiva y virtualmente silenciado a la oposición (...) como consecuencia de una experimentación cuidadosa y argumentaciones inteligentes. Docenas de buscadores lograron resultantes positivas en controles de P.E.S., y los procedimientos matemáticos han sido aprobados por estadísticos de renombre (...) Contra toda esa evidencia, casi la única defensa que le queda al [pseudo] escéptico es la ignorancia" (32).

No obstante, Price luego decía que "la P.E.S. es incompatible con la teoría científica actual (...) Si la parapsicología y la ciencia moderna son divergentes, ¿por qué no rechazar a aquélla? (...) La elección está entre creer en algo 'verdaderamente revolucionario' y 'radicalmente contradictorio con el pensamiento contemporáneo', o dar crédito a la ocurrencia de fraudes y autoengaño. ¿Cuál es más razonable?" (33).

Más de cuarenta años después, el archiescéptico Ray Hyman se quedó sin contrargumentos para las resultantes de los últimos ensayos automatizados, pero no se desanima. Al comentar sobre el informe de Jessica Utts, escribe: "Si la conclusión [de ella] es correcta, entonces deben revisarse dramáticamente los principios fundamentales que han guiado con tanto éxito el progreso de la ciencia, desde los días de Galileo y Newton hasta el presente. Ni la teoría de relatividad, ni la mecánica cuántica en sus versiones actuales, pueden hacer frente a un mundo que alberga los fenómenos psíquicos tan audazmente proclamados por Utts y sus colegas parapsicólogos" (34).


Referencias y notas

1. Honorton, “Rhetoric over Substance”, p. 194.
2. Gardner, The Whys of a Philosophical Scrivener, p. 60.
3. Blackmore, “Reply to ‘Do You Believe in Psychic Phenomena?’”
4. Blackmore, “The Elusive Open Mind.”
5. Berger, “Discussion,” p. 140.
6. Ibídem, p. 137.
7. Ibídem.
8. Blackmore, “Confessions of a Parapsychologist”, p. 71.
9. Berger, “Discussion.”
10. Berger, “Reply to Blackmore’s ‘A Critical Response to Rick Berger’”.
11. Blackmore, “A Critical Response to Rick Berger”, p. 145.
12. Berger, “Discussion”, p. 140.
13. Blackmore, “A Critical Response to Rick Berger”, p. 152.
14. Blackmore, “The Elusive Open Mind”.
15. Blackmore, “Confessions of a Parapsychologist”, p. 74.
16. Blackmore, “Reply to ‘Do You Believe in Psychic Phenomena?’”
17. Blackmore, In Search of the Light, p. 163, 187.
18. Blackmore, “Into the Unknown”.
19. Programa televisivo Strange but True, 01-11-1996.
20. Blackmore, “If the Truth Is Out There, We’ve Not Found It Yet”, p. 18.
21. www.sheldrake.org.
22. Crace, “Richard Wiseman: Fortune Teller”. La cita completa es: "He encontrado una plétora de evidencia en aproximaciones no-científicas a los datos, pero jamás un experimento paranormal que pueda replicarse".

23. Honorton, “Rhetoric over Substance”, p. 210.
24. Randi, Flim Flam! Psychics, ESP, Unicorns, and other Delusions, p. 211.
25. www.sheldrake.org/D&C/controversies/wiseman.html (visitado el 10-09-2011).
26. Eisenbud, The Psi Researcher.
27. Correspondencia personal, 27-09-2002.
28. www.skepticalinvestigations.org/Organskeptics/index.html (visitado el 20-11-2010).

29. Rawlins, “Starbaby”, p. 89.
30. Truzzi, “On Some Unfair Practices towards Claims of the Paranormal”.
31. Blackmore, “Which Skeptical Position?”
32. Price, “Science and the Supernatural”, p. 359.
33. Ibídem, p. 367.
34. Hyman, “Evaluation of Program on Anomalous Mental Phenomena”, p. 24.

11 de enero de 2023

Falseamientos "científicos" en "investigaciones" anti-astrología

Reseña de “A Scientific Inquiry Into the Validity of Astrology”
Por Kenneth McRitchie
ISAR International Astrologer, vol. 43, n° 1, abril 2014-31.


Resumen. El experimento de McGrew y McFall pretendía resolver una debilidad que identificaron en la prueba doble ciego de autoselección y coincidencia de cartas astrológicas por Shawn Carlson en 1985. El dueto aseveró que tanto los astrólogos como los sujetos evaluados pudieron no tomar decisiones correctas debido al mismo problema no-astrológico. Elaboraron una réplica, pero añadiendo sus propios problemas y sin reconocer el impacto de sesgos cognitivos en sus resultados. Uno de ellos se basó en la “paradoja del cumpleaños”, que los autores implementaron en sentido contrario como una ilusión opuesta a la intuición que pudo contribuir al exceso de confianza. Otro era la conocida tendencia humana a formar opiniones demasiado positivas sobre nosotros. Los autores introdujeron este sesgo mediante el uso de un cuestionario abierto no estándar, y omitieron medir la capacidad autoselectiva de los participantes cuyas cartas natales utilizaron, ignorando así sus propios criterios de validez y la justificación del experimento. A raíz de estos problemas metodológicos, su investigación debe considerarse inconclusa.

Este artículo ha sido revisado por pares.

Palabras clave: astrología, sesgo, paradoja del cumpleaños, cognición, pseudociencia, pseudoescepticismo, investigación, ciencia, arbitrariedad.


El experimento doble ciego "A Scientific Inquiry Into the Validity of Astrology" por los profesores de psicología John N. McGrew y Richard M. McFall (1990) -denominados en adelante como M&M- ha permanecido durante mucho tiempo como una de las "constataciones definitivas" contra la astrología, y asimismo el investigador holandés Rob Nanninga (1996) dio al ensayo un peso adicional con su exitosa réplica. El estadístico australiano Geoffrey Dean y el psicólogo canadiense Ivan Kelly describieron la prueba y su repetición en el influyente estudio "Is Astrology Relevant to Consciousness and Psi?" (2003). Para ellos, el análisis de M&M fue un ensayo convincente que utilizaron con objeto de respaldar sus argumentos en contra de la astrología.

La ocasión de 1990 pretendía cubrir lo que sus autores consideraban una “insuficiencia metodológica” en la famosa prueba doble ciego por Shawn Carlson (1985), publicada en Nature. Carlson quiso saber si astrólogos de renombre (N= 29) eran capaces de identificar con precisión determinados perfiles del Inventario Californiano de Psicología (CPI) para sujetos de prueba (N= 100+, en su mayoría estudiantes en Berkley). Para la carta natal de cada uno, los astrólogos recibieron el perfil CPI real y otros dos elegidos al azar de otras personas. Se solicitó a los expertos que calificasen las secciones individuales de los tres CPI en comparación con la carta natal, y luego clasificaran su primera, segunda y tercera opción. Al usar el mismo procedimiento para ambas fases, Shawn evaluó si cada sujeto podía distinguir su propio perfil de carta natal, escrito por los astrólogos, que debían escoger entre otros dos. A través de la misma técnica, Carlson pidió a los voluntarios que identificaran sus perfiles CPI respecto a otros dos (1).

En su estudio, el autor descubrió que los astrólogos no realizaban sus tareas mejor que la expectativa del azar. Para las tareas de los sujetos, sospechó de la fase de calificación y desestimó los datos. Los astrólogos nunca supieron qué tan bien se desempeñaron en las secciones individuales de sus perfiles escritos, y aunque los resultados de la labor clasificatoria (primera, segunda y tercera elección) fueron inusuales, Carlson sí aceptó esa información. Esta tarea incluía un grupo de control cuyos miembros no recibieron sus perfiles astrológicos reales, pero eligió con éxito los perfiles preseleccionados con una probabilidad significativamente baja contra el azar (p< 0,01, donde la significancia es p< 0,05), mientras que los sujetos de prueba reales escogieron sus reseñas fortuitamente. Carlson atribuyó el llamativo resultado para el grupo de control a una "fluctuación estadística", determinando asimismo que las personas testeadas no pudieron distinguir sus perfiles CPI mejor de lo que se esperaría por casualidad.

A pesar de estos resultados negativos -tanto para astrólogos como sujetos de prueba-, los datos excluidos y la anomalía estadística, Shawn concluyó: "Ahora estamos en posición de argumentar un caso sorprendentemente sólido contra la astrología natal, según es practicada por individuos de renombre" (Carlson, 425).

El experimento Carlson ha sido controversial, y sus fortalezas y debilidades han sido discutidas en varios artículos (Currey, 2011; McRitchie, 2011; Ertel, 2009; Vidmar, 2008; McGrew & McFall, 1990). Por su parte, M&M argumentaron que como los sujetos de prueba no distinguieron sus reseñas CPI, los especialistas pudieron equivocarse en hacer coincidir cartas natales con aquéllas para el mismo problema no-astrológico. Tanto ellos como los sujetos habrían experimentado dificultades para comprender la terminología y las escalas gráficas que utilizaba el CPI, con tal de describir personalidades y rasgos; por ende y según los autores, la evidencia requerida para validar el experimento de Carlson no fue concluyente (M&M, 76).

En 2009 el psicólogo alemán Suitbert Ertel publicó una revisión crítica del experimento de Carlson, donde planteó el grave contratiempo de que en realidad no probó su teoría, sino calculó incorrectamente el análisis. Examinó la hipótesis establecida usando los datos de Carlson, y en un cambio notable, la evidencia señalaba que los astrólogos habían emparejado con éxito los perfiles CPI con cartas natales en sus dos tareas con una probabilidad estadísticamente significativa (p= 0,054 marginal y p= 0,037). Hasta la fecha, la reevaluación de Ertel y los hechos expuestos no han sido cuestionados, y como ejemplo intrigante de inversión científica, el test de Carlson se convirtió desde entonces en uno de los principales estudios científicos en apoyo de la astrología.


Evitando algunos sesgos, pero no otros

Las vicisitudes del experimento por Carlson ocurrieron años después que M&M llevaran a cabo su versión y los autores no podían anticipar las consecuencias. Estaban intranquilos por una debilidad particular en aquel ensayo, y concibieron una investigación presentada como "independiente" sobre si la astrología es válida en términos científicos. El vuelco en la evidencia hallada por Carlson no afectó directamente la pesquisa de M&M, y es por eso que su probación merece un estudio crítico.

Para analizar el defecto encontrado, M&M, al igual que Carlson, reclutaron astrólogos (N= 6) y sujetos de prueba (N= 23), pero a diferencia de aquél sólo tantearon las habilidades de identificación de los primeros, y pudiendo hacerlo, no evaluaron si los individuos eran capaces de distinguir sus perfiles de cartas natales confeccionadas por dichos especialistas. Carlson entendió que tal prueba estaría cerca de lo que los astrólogos realmente hacen en la práctica y ello aseguraría la validez de su experimento; por ello, es decepcionante que M&M no replicaran esta sección del mismo, y en especial porque Carlson había rechazado ese cúmulo de datos, excepto porque contuvo un gran error: el experimento de los autores no probó una técnica que se aproximara a la labor astrológica real y no intentaron resolver el problema -lo cual representó un sesgo contra la disciplina-, y no dieron razones para que los sujetos de prueba quedaran sin ser ponderados.

El dúo realizó su protocolo experimental con la participación y aprobación de los seis profesionales, todos miembros de la Federación de Astrólogos de Indiana. Se pidió a cada uno que hiciera coincidir cartas natales de los 23 sujetos con 23 paquetes de información que incluían fotografías de rostros. Para eliminar las pistas de edad, estas personas tenían de 30 a 31 años, y ese rango significaba que había cierta similitud en sus horóscopos, lo que haría ardua su diferenciación. El bloque de datos para cada tema era amplio, incluidas las respuestas a 61 preguntas personales y abiertas, cuya creación M&M solicitaron a los astrólogos. Además de las fotografías y el cuestionario, dicho lote incluía episodios de vida importantes y resultados de dos pruebas psicológicas estandarizadas. Los autores llamaron al conjunto de información final como Resumen de Características Personales e Historia de Vida (PCLHS).

Las 61 preguntas en el PCLHS inquirían sobre características personales del estilo de vida que pueden interesar a los astrólogos, que incluyen "pasatiempos, intereses, creencias religiosas, rasgos físicos, talentos y logros personales, antecedentes familiares, fechas de muerte de padres o hermanos, fechas de mudanzas a través del país, problemas de salud, actitudes hacia la autoridad, sexo y compromiso, manías, colores favoritos, puntualidad, confiabilidad y variaciones en el ciclo de energía personal” (M&M, 77).

En la experiencia realizada por los autores o cualquier prueba doble ciego sobre astrología, hay que tener cuidado de asegurar que las ideas preconcebidas con respecto a esta disciplina no condicionen los resultados, una precaución válida tanto para experimentadores como sujetos de prueba. Sin embargo y a diferencia de Carlson -quien aisló su propia influencia y eligió cuidadosamente a personas con opiniones firmes sobre astrología-, M&M no siguieron un protocolo similar y tampoco evitaron su sesgo de muestreo cuando seleccionaron individuos a partir de candidatos que respondieron a su anuncio en periódicos.

En vez de probar a los elegidos para detectar inclinaciones especiales, M&M se basaron en una "historia de tapadera", pero ese método fue inconsistente y proporcionó pistas llamativas. Los autores explicaron a sus sujetos que la investigación trataba sobre los posibles efectos de niveles hormonales asociados con el ciclo diurno durante el nacimiento y desarrollo posterior en niños (M&M, 79), por cuanto cada individuo de prueba tenía que suministrar documentación certificada de fecha, hora y lugar precisos de nacimiento. Las 61 interrogantes pedían que detallaran información muy personal y eventos de vida del tipo que les hubiera resultado familiar en columnas de astrología popular. Refiriéndose a estas preguntas, los autores sostienen que “ni el CPI ni ningún otro instrumento psicológico estándar contiene esa clase de información” (M&M, 77). Cuando se consultó a las 23 personas luego de finalizar el test, dos de ellas adivinaron que el experimento era sobre astrología (M&M, 79), y a todas luces la "portada" no representó un "biombo" fiable para posibles sesgos.


Una quimera estadística

Aparte de los defectos mencionados, un problema más grave fue que el diseño del experimento incluía una peculiaridad estadística que puede sesgarlo, ya sea que el contenido sea de astrología u otro tema. En el trabajo de Carlson y sus antecesores, los participantes intentaron equiparar cada horóscopo con un conjunto de sólo dos o tres descripciones de personalidad (Clark, 1961; Marbell, 1981; Carlson, 1985). La expectativa probabilística para cada elección fue siempre la misma y no disminuyó, mientras que el protocolo de emparejamiento por M&M ocupó una ilusión matemática como sesgo cognitivo.

Al seleccionar específicamente 23 sujetos, los autores parecieron estar conscientes de un efecto contrario a la intuición llamado "problema/paradoja del cumpleaños" (Ma, 2010). Debido a un sesgo cognitivo, no esperamos que de los 365 días anuales haya al menos un 50 % de posibilidades de encontrar cumpleaños coincidentes en cualquier grupo de sólo 23 personas. Sin embargo, si adoptamos el enfoque opuesto, parece intuitivamente fácil unir con confianza al menos el 50% de un grupo de 23 a otro con igual número, donde sabemos que todos los integrantes de ambos presentan coincidencias. La probabilidad real de establecer la mitad de ellas no es de 50%, sino casi cero; de este modo, M&M alentaron dicho exceso de confianza ilusoria al decidir que sólo había “23 posibilidades” en su experimento (M&M, 82).

La razón de este equívoco es que los problemas de concordancia -donde cada intento elimina un miembro de cada grupo- caen en una distribución de Poisson. En un modo diferente a la intuición, la chance de encontrar similitudes converge rápidamente en probabilidades muy reducidas y análogas, independiente del número de pares que se corresponderán, ya sea 10, 23 ó 200. La probabilidad de hallar 1 coincidencia es aproximadamente 0,37; para 2 es 0,18; 0,06 de 3; 0,015 de 4 y 0,0000001 en el caso de 10 (Ma, 2010). Existe una gran sensibilidad al error que aumenta con rapidez a cada empeño, y así las ocasiones de hacer concurrir los 23 pares son extremadamente nimias. Para que los resultados alcanzaran el nivel de significación estadística, suponiendo que la significancia era de p< 0,05, los astrólogos necesitaban emparejar un promedio de poco más de tres cartas natales. Aún sabiéndolo, M&M no sugirieron que su método creaba exceso de confianza, no advirtieron a los especialistas y tampoco se dieron razones para cambiar el diseño utilizado por Carlson y otros, donde esta ilusión no era posible.


Estrategias idiosincrásicas

Todos los astrólogos trabajaron sólo para unir cada uno de los 23 horóscopos con sus 23 PCLHS correspondientes. Los autores no publicaron tablas ni gráficos sobre los datos de sus pruebas y no es posible analizar los valores medios de coincidencias correctas. En cambio, informaron que éstas últimas oscilaron entre cero y tres, con valor medio de una coincidencia, y ninguno de los profesionales se desempeñó mejor que el azar (M&M, 80), aún cuando ellos determinaron su confianza en el promedio del 73,5%, lo que implicaba efectuar al menos seis concordancias exitosas. La compatibilidad entre sus aciertos y nivel de convencimiento no se mostró relevante (r= 0,03), y según el análisis, los resultados entre expertos fueron inconsistentes en emparejamientos precisos e incorrectos, con un valor medio de sólo 1,4 acuerdos para los 23 casos, lo que no era significativo (M&M, 81). Como señalan los autores, es importante destacar que los astrólogos emplearon recursos idiosincrásicos, lo que se demuestra por la mezcolanza de preguntas que proporcionaron al PCLHS y su falta de acuerdo para establecer coincidencias (M&M, 81).

Esta observación es crucial para comprender los resultados. Uno debe preguntarse por qué los astrólogos se apartaron tan poco de su práctica habitual. Los textos de astrología contienen descripciones de personalidad y desarrollo potencial en diversas configuraciones de cartas natales, siendo así parámetros muy estandarizados, y normalmente los especialistas aplican estos indicadores al interpretarlas. Sin embargo, M&M no pidieron a los astrólogos que explicaran sus gráficos, sino sólo que los emparejaran. Y si ellos no interpretaban personalidades en las cartas, entonces ¿de quién eran las habilidades que se estaban probando?

Es normal que un astrólogo simplemente diga a los clientes cuáles pueden ser sus personalidades, desarrollo de carácter, logros y otros potenciales, según lo establecido en la literatura análoga. Es posible que se haya actuado o no sobre estas áreas de potencial, y depende del cliente reconocer sus patrones de comportamiento y estilo de vida a través del proceso de consulta. Sin embargo, no es común solicitar a las personas que describan sus capacidades, ni que los astrólogos utilicen un cuestionario para inquirir sobre el particular. La astrología aplicada no asume que alguien conozca sus talentos a profundidad, por lo que el ensayo de M&M fue en contra de la disciplina habitual y ello representó un sesgo hacia sus practicantes.

El diseño experimental invirtió los roles de consultor y cliente, situando el trabajo interpretativo en la parte equivocada. Los sujetos de prueba debían reseñar sus capacidades (normalmente hecho por el profesional), respondiendo un cuestionario ad hoc que M&M encargaron a los propios astrólogos; después, éstos juzgaban la exactitud y utilidad de las descripciones recibidas (proceso que suele llevar a cabo el consultante).

La astrología se centra en ayudar a descubrir talentos personales y dar orientaciones de cómo tomar el mejor camino en diferentes etapas de vida. Este no es el mismo tipo de información que generan las pruebas psicológicas, que comúnmente sólo evalúan las dimensiones en rasgos de personalidad. Los astrólogos en el experimento de M&M pudieron tener las mejores intenciones, pero se les asignó una tarea enorme. En su intento de crear un cuestionario que abarcara todo el espectro del potencial humano, fueron proclives a utilizar estrategias idiosincrásicas y recurrieron a preguntas abiertas, tal vez con la esperanza de que los sujetos de prueba otorgaran suficiente información a través de sus narrativas.

El problema con esto es que se introdujo un desvío cognitivo adicional que las lecturas de cartas astrales suelen evitar. Los estudios psicológicos han demostrado que las personas tienden a albergar ilusiones positivas e irrealistas sobre sí mismas (Taylor y Brown, 1988); por ejemplo, casi el 80% de conductores se autoclasifica como parte del 50% superior en términos de habilidades viales (McCormick, Walkey y Green, 1986), lo que por cierto no es matemáticamente factible. Las pretensiones "gratificantes" de autoimagen en casi todas las áreas de la vida no son lo que los astrólogos quisieran escuchar, pero estos fueron muy probablemente los tipos de respuestas obtenidas al formular preguntas abiertas y no estandarizadas sobre talentos e intereses personales. En consecuencia, la metodología de investigación por M&M implementó un error sistemático que funcionó en contra de los astrólogos.


Discusión

Dado que los especialistas accedieron a la sugerencia por M&M de crear un cuestionario ad hoc, terminaron adoptando una metodología defectuosa y comprometiéndose con el diseño de prueba establecido. Los autores no les avisaron que su lista de preguntas se exponía al sesgo de autoilusión positiva, y junto con el efecto matemático de Poisson representaron aspectos contraintuitivos. Estos desvíos no surgieron en diseños previos de experimentos astrológicos doble ciego, incluido el de Carlson y que los autores replicaban en esa oportunidad.

A diferencia del cuestionario abierto e idiosincrásico de M&M, el testeo de Carlson empleó sólo el CPI estandarizado. La reevaluación por Ertel (2009) sobre aquélla constató que los astrólogos fueron capaces de utilizar perfiles CPI para vincular horóscopos con una probabilidad estadísticamente significativa. Aunque ellos no suelen echar mano de cuestionarios psicológicos modelo, los resultados positivos en el ensayo de Carlson apuntan a que los astrólogos de M&M habrían tenido más éxito si hubieran restringido sus evaluaciones a los datos de ambas pruebas psicológicas incluidas en el PCLHS y depuesto su propio cuestionario. Los listados prototípicos de opción múltiple compelen a tomar decisiones específicas, y por lo tanto reducen las ilusiones de autoimagen. A juzgar por la reevaluación de Ertel, es concebible que los sistemas de prueba específicos puedan mostrar correlaciones entre algunos patrones de cartas astrales y perfiles de cuestionarios estándar sobre personalidad.

Aunque los astrólogos utilizaron información de los dos cuestionarios psicológicos para identificar las cartas, M&M no pidieron a sus sujetos de prueba que distinguieran sus perfiles, como se había hecho anteriormente en experimentos doble ciego. Este protocolo de validación ausente devela un escollo serio para los autores, porque no está claro cuánto confiaron los astrólogos -o deberían haber confiado- en dichas reseñas, y asimismo aparece la incertidumbre de "inadecuación metodológica" que los autores localizaron en la tarea de su predecesor. Los astrólogos podrían haber fallado en su cometido por las mismas razones no astrológicas que antes, y sorprendentemente, al no evaluar los sujetos de prueba, ¡M&M no intentaron resolver el problema de validación psicológica que usaron para justificar su proyecto! En consecuencia y por su propio razonamiento, tendrían que catalogar este examen como inconcluso.


Lecciones por aprender

M&M finalizan su artículo con una racionalización extrema: "Puesto que cada individuo es único, en la vida real un astrólogo debe usar la información de nacimiento para 'seleccionar' la única interpretación correcta y que coincida sólo con esa persona entre casi innumerables posibilidades, y no sólo entre 23. Por lo tanto, nuestro trabajo puede verse como una simplificación de aquél que los astrólogos realizan a diario” (M&M, 81-82).

Esto invierte la complejidad del quehacer astrológico normal, en comparación con sus tareas en ese experimento. Es una falsía sostener que los astrólogos en la práctica deben “seleccionar” un "golpe único" entre innumerables posibilidades de rasgos en cartas combinadas, pues lo cierto es que ellos leen dichos gráficos como cualquier otra clase de "mapa" que tenga puntos de referencia claros, destinos previstos e indicadores de oportunidades y peligros. Como se sobreentiende, hay muchas formas de interpretar mapas y alcanzar una meta. No era sencillo hacer coincidir 23 pares, y los autores expusieron una afirmación engañosa. Sólo había 23 chances siempre que cada emparejamiento se realizara de modo correcto, por lo que el número de posibles desajustes fue asombroso y cognitivamente increíble.

En 1996 se elaboró una repetición de la prueba por M&M. El holandés Rob Nanninga modeló su "Astrotest" doble ciego directamente en base al primero -y contenía todos los mismos fallos-, donde retó a 50 astrólogos connacionales a equiparar correctamente siete cartas natales con siete conjuntos de información personal. De manera similar al experimento previo, desarrolló su formulario de preguntas abiertas no estándar a partir de ideas recopiladas de los astrólogos participantes. La lista cubría detalles como educación, tendencias vocacionales, pasatiempos, intereses, objetivos primarios, personalidad, relaciones, salud, religión, etc., además de fechas sobre eventos importantes. A todo ello, el autor sumó 24 preguntas de opción múltiple tomadas de una prueba estándar de personalidad (Nanninga, 1996/97), y no hace falta decir que los astrólogos no pudieron igualar las cartas mejor que en el caso de M&M.

Los astrólogos, estudiantes e investigadores críticos pueden aprender del ejemplo por M&M. Éstos parecían seguir una "metodología científica estricta" al presentar un análisis impresionante de sus datos, pero no implementaron protocolos básicos contra los sesgos añadidos a través de su selección para sujetos de prueba, la técnica comparativa de Poisson y un cuestionario ad hoc. Los autores no lograron sopesar la validez metodológica de su testeo, siendo éste el mismo problema que detectaron como "inadecuación" en el experimento de Carlson y utilizado para justificar su pesquisa. Por estas razones, el empeño de M&M puede considerarse irresoluto, y también un ejemplo notable de sesgo cognitivo en un experimento científico.

En retrospectiva, es esclarecedor ver cómo los autores desarrollaron una "prolongada fase de gestiones" para obtener el acceso y la confianza de los astrólogos escépticos en un comienzo, mostrando al menos cierta empatía: “(...) comprensiblemente, recelaban participar en investigaciones que pudieran estar sesgadas en su contra o que no les brindaran ninguna oportunidad de éxito” (M&M, 77).

Agradecimientos a: David Cochrane y Mark Urban Lurain por su ayuda con el "problema del cumpleaños" y las distribuciones de Poisson, e International Astrologer para la revisión crítica por pares, que brindó oportunas aclaraciones y sugerencias.

Se enviaron borradores de este artículo a los profesores Ivan Kelly y Christopher French para que hicieran comentarios, pero no hubo respuesta.


Notas

1. El testeo llamado "autoselección de perfil" y concebido por Neil Marbell en 1981 -precursor de Carlson- aspiró a estandarizar sistemáticamente las interpretaciones astrológicas presentadas a sujetos de prueba, y de una forma que Carlson no consideró: “Las reseñas de personalidad fueron compuestas por astrólogos individuales sólo a partir de datos de nacimiento, utilizando todos los factores ptolemaicos básicos para explicación de horóscopos. Luego, cada perfil fue revisado por un comité de cinco astrólogos que no conocía los temas. Este chequeo fue necesario con tal de evaluar las interpretaciones y normalizar dichos perfiles en estilo, contenido y presentación general” (Marbell, 1981, p. 4).

El autor manifestó que su ensayo fue inequívoco en resultados exitosos, con un alto índice de personas que seleccionó sus interpretaciones de las tres presentadas. A pesar de los elevados guarismos, las probabilidades estadísticas para dos pruebas no fueron significativas (asumiendo significancia en p< 0,05), debido al menos en parte al número muy pequeño de sujetos de prueba (N= 5 ó 6). El control se dividió en las siguientes partes:

-Primera (utilizando perfiles rigurosos en laboratorio): N= 5, con 100% de respuestas correctas y p< 0,000001.

-Segunda (perfiles menos detallados, remitidos por correo a los hogares de los sujetos): N= 6, con 66 2/3% de respuestas correctas y p= 0,1.

-Tercera ("historia de portada" sobre biorritmo, utilizando elementos de perfil rigurosos y menos detallados, en entornos laborales de los sujetos): N= 5, con un 75% de respuestas correctas y p= 0,111.

El experimento de Marbell se destacó por su participación interdisciplinaria, que involucró el diseño y revisión por astrólogos y académicos notables, escépticos prominentes e incluso representantes del Congreso estadounidense.


Referencias

Carlson, Shawn (1985). "A double-blind test of astrology", Nature (318, diciembre), p. 419-425.

Clark, Vernon (1961). “Experimental astrology", Search, p. 102-112.

Clark, Vernon (1970). “An investigation of the validity and reliability of the astrological technique”, Aquarian Agent (n° 1, octubre), p. 2-3.

Currey, Robert (2011). "Shawn Carlson’s Double Blind Astrology Experiment: U-Turn in Carlson’s Astrology Test?", Correlation, 27 (2), p. 7-33.

Currey, Robert (2013). "Research Sceptical of Astrology: McGrew & McFall, 'A Scientific Inquiry into the Validity of Astrology'” (visitado el 13-03-2013).

Ivan W. Kelly y Dean Geoffrey (2003). "Is Astrology Relevant to Consciousness and Psi?", Journal of Consciousness Studies, 10 (6-7), p. 175-198.

Dobyns, Zipporah P. (1976). “Results of the Vernon Clark experiment”, Astrology Now, 1 (65, abril), p. 81.

Ertel, Suitbert (2009). "Appraisal of Shawn Carlson’s Renowned Astrology Tests", Journal of Scientific Exploration, 23 (2), p. 125-137.

Hippel, William von y Robert Trivers (2011). "The evolution and psychology of self-deception", Behavioral and Brain Sciences, 34, p. 1-56.

Joseph, R. A. (1975). “A Vernon Clark model experiment distinguishing exceptionally gifted high performance from profoundly retarded low performance children”, Journal of Geocosmic Research, 1, p. 55-72.

Klayman, Joshua y Young-Won Ha (1987). "Confirmation, disconfirmation, and information in hypothesis testing", Psychological Review, 94 (2), p. 211-28.

Marbell, Neil (1981). “Profile Self-selection: A test of astrological effect on human personality”, Synapse Foundation (monografía), republicado (1986-1987) en NCGR Journal, p. 29-44.

Ma, Dan (2010). "More about the matching problem: A Blog on Probability and Statistics", 2 de mayo, visitado el 18-09-2013.

Mannes, Albert y Don Moore (2013). “I know I’m right! A behavioural view of overconfidence”, Significance, agosto, p. 10-14.

McCormick, Iain A., Frank H. Walkey y Dianne E. Green (junio de 1986). “Comparative perceptions of driver ability— A confirmation and expansion”, Accident Analysis & Prevention, 18 (3), p. 205–208.

McGrew, John H. y McFall, Richard M. (1990). "A Scientific Inquiry Into the Validity of Astrology", Journal of Scientific Exploration, 4 (1), p. 75-83.

McRitchie, Kenneth (2011). "Support for astrology from the Carlson double-blind experiment", ISAR International Astrologer, 40 (2), p. 33-38.

McRitchie, Kenneth (2006). "Astrology and the Social Sciences: Looking inside the black box of astrology theory", Correlation, 24 (1), p. 5-20.

Nanninga, Rob (1996-1997). "The Astrotest: A tough match for astrologers", Correlation, 15 (2), p. 14-20.

Nickerson, Raymond S. (1998). "Confirmation bias: A ubiquitous Phenomenon in many guises", Review of General Psychology, 2 (2), p. 175-270.

Rogers, Paul y Soule, Janice (2009). “Crosscultural differences in the acceptance of Barnum profiles supposedly derived from Western versus Chinese astrology”, Journal of Cross-Cultural Psychology, 40 (4), p. 381-389.

Taylor, Shelley E. y Jonathan D. Brown (1988). "Illusion and well being: A social psychological perspective on mental health", Psychological Bulletin, 103, p. 193-210.

Taylor, Shelley E. y Jonathan D. Brown (1994). "Positive Illusions and Well-Being Revisited", Psychological Bulletin, vol. 116 (1), p. 21-27.

Vidmar, Joseph (2008). "A Comprehensive Review of the Carlson Astrology Experiments", Correlation, 26 (1).