Ein Forschungsteam des Instituts für Künstliche Intelligenz der MedUni Wien und des CeMM Forschungszentrum für Molekulare Medizin unter der Leitung von Matthias Samwald und Christoph Bock konnte zeigen, dass ein großes Sprachmodell wie GPT-4, bekannt durch seine Anwendung in ChatGPT, effektiv als Simulator für biologische Systeme eingesetzt werden kann. In der Studie wurde die Hypothese getestet, dass die schrittweise Simulation biologischer und medizinischer Prozesse mit GPT-4 zu besseren Ergebnissen führt.
Die Forscher:innen entwickelten "SimulateGPT" – eine wissensbasierte Simulationsmethode durch strukturierte Eingaben in GPT-4. Sie wurde in verschiedenen Szenarien wie Mausexperimenten, Unterstützung bei der Behandlung von Sepsis, Vorhersage von essentiellen Genen in Krebszellen und progressionsfreiem Überleben von Krebspatient:innen getestet und von Expert:innen validiert. Die Methode ist jedoch für die Grundlagenforschung konzipiert und nicht für den klinischen Einsatz vorgesehen.
Um bestimmte Aufgaben zu erledigen oder Probleme zu lösen, werden Sprachmodelle wie GPT-4 durch Texteingaben, so genannte "Prompts", gesteuert. Diese Modelle antworten direkt auf einfache Fragen, haben allerdings Schwierigkeiten, komplexere Szenarien zu lösen, wie sie in der Biomedizin häufig vorkommen. Die Wissenschafter:innen konfigurierten GPT-4 mit strukturierten Eingaben und gezielten Anweisungen so, dass es vorgegebene Szenarien detailliert mit Text simulierte. Dabei zeigte die Studie, dass dieser GPT-4-basierte Simulator deutlich bessere Ergebnisse erzielte. Biomedizinische Expert:innen bevorzugten in den Experimenten die Vorhersagen von SimulateGPT gegenüber direkten GPT-4-Antworten. SimulateGPT verbesserte zudem, im Vergleich zu herkömmlichen GPT-4-Antworten, die Genauigkeit sowohl bei der Bestimmung essentieller Gene in Krebszellen als auch bei der Vorhersage der progressionsfreien Überlebenszeit von Krebspatient:innen.
"Diese Studie zeigt, dass große Sprachmodelle wie GPT-4 eine neue Klasse von biomedizinischen Simulatoren ermöglichen könnten", so Samwald. "Textbasierte Simulationen sind besonders geeignet, um lebende Systeme zu modellieren und zu verstehen, da Text und Sprache die Flexibilität und Interpretierbarkeit mitbringen, die notwendig sind, um die Komplexität der Biologie zu beschreiben."
Die Studie wurde im Journal "Computers in Biology and Medicine" veröffentlicht.
Schaefer et al. (2024). GPT-4 as a biomedical simulator. Computers in Biology and Medicine, 178, 108796. https://doi.org/10.1016/j.compbiomed.2024.108796