El tiempo en Jerez
Frío en Nochebuena y Navidad

El algoritmo que detecta el cáncer con un análisis de sangre y duerme en un cajón

Dos investigadores andaluces, Isabel Apolonia Yeste Sánchez y Pablo José Suárez Pedrajas, desarrollan un modelo con inteligencia artificial premiado por Samsung que es capaz de predecir la enfermedad con un simple análisis de sangre.

Cuando tu móvil sabe demasiado: la demanda contra Google que afecta a 37 millones de usuarios de Android en España

Isabel Apolonia Yeste Sánchez y Pablo José Suárez Pedrajas
Susana C. Gómez

SEVILLA, 23 de diciembre 2025 - 06:59

Isabel Apolonia Yeste Sánchez no imaginaba, cuando hacía sus prácticas de Psicología en la Asociación Española Contra el Cáncer, que años después estaría enseñando a una máquina a detectar la enfermedad. Tampoco Pablo José Suárez Pedrajas, biomédico sevillano premiado por sus investigaciones en mieloma múltiple, pensaba que acabaría calculando riesgos de mercado en el Banco Santander.

Entre ambos hay un proyecto común: un algoritmo de inteligencia artificial que predice la presencia de cáncer analizando solo ocho proteínas en sangre y la edad del paciente. Un trabajo reconocido hace unos meses en los Premios Nacionales de IA de Samsung pero que ahora está guardado en un cajón metafórico, esperando datos y recursos que nunca llegan.

"Necesitaríamos colaboración con otras entidades porque nosotros solos no podemos", resume Pablo. La frase condensa esta historia de dos investigadores que han tenido que aparcar un proyecto que podría, literalmente, salvar vidas.

Un giro profesional en plena pandemia

La reconversión profesional de Isabel Yeste tiene el sello de su generación: estudió Psicología, trabajó con enfermos de cáncer en la AECC de Baza, se especializó en neurociencia. Cuando llegó la pandemia y el mercado laboral se congeló, tomó una decisión drástica.

"Dije: bueno, es el momento de cambiar un poco el rumbo de mi ámbito profesional. Puedes estudiar informática, pensé, porque veía que se estaba digitalizando todo". Completó un ciclo de Desarrollo de Aplicaciones Web, descubrió una vocación inesperada y ganó un premio con su primer proyecto.

Ese éxito la llevó al programa Samsung Innovation Campus, un curso de inteligencia artificial donde conoció virtualmente a Pablo Suárez. El sevillano traía un bagaje distinto pero convergente: graduado en Biomedicina Básica y Experimental, había sido premiado por la AECC por un proyecto de inmunoterapia.

Durante el máster en Investigación Biomédica descubrió “el análisis de datos, los modelos predictivos, todo eso. Minería de datos clínicos", recuerda.

Pero Pablo también abandonó la Academia. "Me desvinculé un poco de la ciencia y de la Academia porque no me siento identificado con la cultura que se maneja ahí dentro. Lo que se dice siempre es verdad: los sueldos no son buenos, la gente está muy maltratada". Cuando Isabel se trasladó temporalmente a Sevilla, se conocieron en persona y decidieron trabajar juntos en el curso de Samsung. El tema lo propuso Pablo: detección temprana de cáncer mediante inteligencia artificial.

La brecha entre el diagnóstico precoz y tardío

Los números que maneja Pablo son rotundos. En cáncer de pulmón, la supervivencia a cinco años en estadios avanzados ronda el 5%. En estadios tempranos, supera el 65%. "Hay una necesidad tremenda de detectar el cáncer en estadios tempranos", explica.

La mamografía ha demostrado su eficacia en cáncer de mama. Pero otros tumores, como el de pulmón, carecen de métodos equivalentes de detección precoz no invasivos.

Existen pruebas, sí: colonoscopias, citologías vaginales, el antígeno prostático específico (PSA) para próstata. Todas comparten un problema: son invasivas, costosas o específicas de un solo tipo de tumor. "Nuestra idea era generar un modelo que pudiera predecir si un paciente podía tener cáncer en etapa temprana, no a través de pruebas tan invasivas sino a través de la sangre", resume Pablo.

Ocho proteínas y un algoritmo

El punto de partida fue una base de datos publicada en una revista científica de alto impacto. Contenía información de pacientes con y sin cáncer: concentraciones de 39 proteínas plasmáticas, un "omega score" que estima la probabilidad de mutaciones en ADN circulante, más datos clínicos como edad, sexo y etnia. En total, unas 43 características.

El desafío era reducir ese conjunto. "Nuestra idea del modelo, para hacerlo lo más económico posible, era intentar reducir al máximo el número de características que son necesarias para hacer la predicción", explica Pablo. Mediante métodos matemáticos y estadísticos, lograron algo notable: con sólo ocho proteínas plasmáticas y la edad del paciente, su modelo discriminaba entre presencia y ausencia de cáncer con "muy alta precisión". Más aún: superaron la precisión del propio autor del estudio original, usando menos variables.

"Lo importante es el patrón que refleja el cambio de la enfermedad", aclara Pablo. No se trata de medir un marcador tumoral específico, sino de que la inteligencia artificial identifique patrones en el comportamiento conjunto de varios biomarcadores. Es una lógica distinta a la de las pruebas tradicionales, que analizan parámetros de forma aislada.

Isabel, por su parte, desarrolló una interfaz gráfica. Una aplicación sencilla donde un médico introduce las concentraciones de las ocho proteínas y la edad del paciente. El sistema devuelve un resultado: "cáncer" o "no cáncer". "Que no se quedara en un análisis de código", explica Isabel. "Simplemente un formulario: metes los datos, le das a enter, sale la ventana emergente: cáncer, no cáncer". Probaron el sistema recreando casos clínicos reales del conjunto de datos. El modelo predecía correctamente.

El muro de la validación clínica

Pero un modelo entrenado con datos existentes no es, todavía, una herramienta clínica. "El siguiente paso que yo daría sería hacer una validación clínica con ese modelo, a ver cómo predice con datos diferentes a aquellos con los que se ha entrenado", explica Pablo. Ahí está el muro. "Lo más limitante de hacer un modelo predictivo son los datos", resume. Y los datos cuestan dinero, colaboraciones institucionales, acceso a hospitales o centros de investigación.

Intentaron contactar con empresas y asociaciones, pero sin éxito. "Necesitaríamos algún tipo de colaboración con instituciones privadas, administraciones públicas o empresas", dice Pablo. Isabel añade: "Necesitaríamos datos y también más facilidades para poder ir desarrollando nosotros dos".

Ninguno de los dos está vinculado a una universidad. Ninguno tiene tiempo completo para dedicar al proyecto. Isabel trabaja actualmente en la Junta de Andalucía, desarrollando una plataforma de gestión de subvenciones de digitalización; Pablo, en el área de riesgo de mercado del Banco Santander, un campo que le gusta por su componente matemático. Ambos reconocen que el desarrollo del proyecto les supuso "sacrificar horas de sueño". Seguir requeriría, dicen, "un fuerte respaldo" y "facilidades".

Una segunda fase que nunca llegó

El modelo actual clasifica en binario: cáncer o no cáncer. La segunda fase, que nunca se desarrolló, consistiría en un segundo algoritmo que identificara el tipo específico de tumor en los casos positivos. ¿Por qué no se hizo? "Falta de tiempo y recursos", responde Pablo. Y un problema técnico: al dividir los casos por tipos de cáncer, el número de instancias por categoría disminuye drásticamente. "Se requeriría carta libre de datos para avanzar con robustez", explica.

Pablo insiste en otro aspecto que considera crucial: entender por qué el modelo falla. "Intentamos interpretar por qué el modelo se equivocaba, dónde se equivocaba, por qué acertaba, dónde acertaba". No basta con cuantificar el error; hay que comprenderlo. Pero eso también requiere tiempo y datos que no tienen.

El modelo, además, es extrapolable. No solo a otros tipos de cáncer, sino a otras enfermedades: Alzheimer, esclerosis lateral amiotrófica, esclerosis múltiple. "El modelo te está diciendo cuáles son las características definitorias de una enfermedad", explica Pablo. Es, en esencia, una búsqueda matemática de biomarcadores que luego deberían validarse en laboratorio. "Se puede adaptar a cualquier tipo de enfermedad, solamente tienes que tener datos", resume Isabel.

La paradoja de la innovación

La historia de Isabel Yeste y Pablo Suárez ilustra una paradoja conocida en el sistema español de I+D. Dos investigadores formados, con ideas validadas y reconocimiento institucional -Samsung les premió en septiembre-, pero sin estructura que sostenga el salto del prototipo a la aplicación clínica. Pablo lo resume con una reflexión sobre la cultura universitaria: "En la universidad se prioriza publicar; las farmacéuticas financian más". Pero la presión por publicar en revistas de alto impacto no siempre coincide con el objetivo de implementar herramientas prácticas.

Isabel mantiene la esperanza: "A mí me gustaría mucho seguir con el proyecto. Si hay respaldo, de cabeza". Pablo es más cauteloso, pero no cierra la puerta, ambos están abiertos a colaboraciones.

Mientras, el algoritmo espera, en un servidor, aguardando datos que validen lo que las ecuaciones ya sugieren: un modelo capaz de analizar patrones en sangre, democratizar la detección temprana, reducir costes y tiempos de diagnóstico.

Una herramienta que, en teoría, podría utilizarse con menos recursos sanitarios y evitar alguno de esos diagnósticos de cáncer que llegan más tarde de lo que deberían, quizás demasiado tarde.

No hay comentarios

Ver los Comentarios

También te puede interesar

Lo último