Direkt zum Inhalt

Wie ein Open-Source-Chatbot die Forschung am Mount Sinai beschleunigt

In Zusammenarbeit mit dem Mount Sinai Health System und dem Hasso Plattner Institut bauen wir eine sichere, skalierbare und transparente LLM-Infrastruktur für die klinische Forschung auf.

Gesundheitsdaten bergen ein enormes Potenzial – aber nur, wenn sie zugänglich, verständlich und verwertbar sind. Hier setzt unser neuestes KI-Projekt mit Mount Sinai an: Ein lokal gehosteter Open-Source-Chatbot, der Forscher bei der Datenauswertung, Literaturrecherche und Dokumentation unterstützt – schneller, einfacher und stets sicher.

Das Mount Sinai Health System ist eines der renommiertesten Forschungskrankenhäuser weltweit. In Zusammenarbeit mit dem Hasso-Plattner-Institut unterstützt Data4Life den Aufbau und die Erweiterung von AIR·MS – einer sicheren Forschungsumgebung für den strukturierten Zugriff auf anonymisierte Gesundheitsdaten.

Unsere neueste Ergänzung: ein Chatbot auf Basis eines Large Language Model (LLM), der in das System integriert ist und Forscher und Kliniker direkt in ihren Arbeitsabläufen unterstützt.

Entwickelt für die Forschung, nicht für den Profit.

Anstatt auf kommerzielle Dienste zurückzugreifen, haben wir einen Chatbot entwickelt, der vollständig auf Open-Source-Tools und Open-Weight-Sprachmodellen basiert.

Wie ein Open-Source-Chatbot die Forschung am Mount Sinai beschleunigt

Dies gewährleistet vollständige Transparenz, lokale Datenhoheit und maximale Einhaltung der Sicherheitsstandards des Krankenhauses. Der Chatbot nutzt eine Kombination aus Ollama, Open WebUI und Modellen wie LLaMa, Mistral und gpt-oss, die in die Azure-basierte Infrastruktur von Mount Sinai integriert sind. Diese Architektur ist nicht nur technisch robust, sondern auch speziell auf die besonderen Herausforderungen der Gesundheitsforschung zugeschnitten.

Überblick auf einen Klick.

Ein zentraler Anwendungsfall ist die Zusammenfassung von Literatur. Forscher müssen oft Dutzende von Studien oder klinischen Leitlinien lesen, bevor sie eine Schlussfolgerung ziehen können. Mit dem Chatbot können sie lange Dokumente oder Suchanfragen einfügen und erhalten innerhalb von Sekunden präzise, strukturierte Zusammenfassungen – das spart Zeit und kognitive Belastung.

Ein weiteres praktisches Szenario ist die Beantwortung von Fragen zu klinischen Datenmodellen. Viele Datensätze folgen dem OMOP-Standarddatenmodell, dessen Navigation komplex sein kann. Der Chatbot hilft Benutzern zu verstehen, wie ein bestimmtes Konzept (z. B. „Krankenhausaufenthalt wegen Herzinsuffizienz“) definiert ist, wie es Codes zugeordnet wird und wo es in den Daten vorkommt.

Unterstützung der strukturierten Datenanalyse

Der LLM-Assistent wird auch in Data2Evidence integriert, unser Analyse-Tool innerhalb von AIR·MS. Hier kann der Chatbot Aufgaben wie das Erstellen von Kohortendefinitionen, das Generieren von SQL-Abfragen und das Erklären von ETL-Prozessen unterstützen. Dadurch wird die Plattform für klinische Forscher, die möglicherweise keinen technischen Hintergrund haben, zugänglicher – und die Abhängigkeit von Ingenieurteams wird verringert.

Das Ziel: Die Hürden für datengesteuerte Forschung senken und mehr Menschen die Möglichkeit geben, sinnvolle Fragen zu stellen – und sinnvolle Antworten zu erhalten.

Integrierte Privatsphäre, für Skalierbarkeit ausgelegt

Sicherheit hatte von Anfang an oberste Priorität. Der Chatbot ist in die AIR·MS Application Tier integriert, die mithilfe von Containern eine zuverlässige Anwendungsumgebung schafft, und nutzt Single Sign-On (mit Microsoft Entra). Bei einer unabhängigen Penetrationstest-Übung wurden keine kritischen Schwachstellen festgestellt, was die Robustheit der Architektur bestätigt.

Bislang haben etwa 100 Early Adopters aus verschiedenen Abteilungen des Mount Sinai den Chatbot in ihrer täglichen Arbeit getestet. Ihre Anwendungsfälle reichen von der Überprüfung von Dokumentationen über die Vorbereitung von Forschungsprotokollen bis hin zur Identifizierung relevanter Publikationen in PubMed. Ihr Feedback fließt aktiv in die nächsten Entwicklungsschritte ein – darunter die Integration von mehr medizinischem Wissen, die Verfeinerung der Benutzeroberfläche und die Möglichkeit, mit strukturierten Datensätzen (wie Laborergebnissen oder Diagnosen) in natürlicher Sprache zu interagieren.

Vom Pilotprojekt zum Forschungsbegleiter

Der AIR·MS-Chatbot ist mehr als nur eine Funktion – er ist die Grundlage einer umfassenderen KI-Strategie. Für die Zukunft planen wir, seine Fähigkeiten in folgenden Bereichen zu erweitern:

  • automatisierte Bildannotations-Workflows unter Verwendung der Visian-Plattform,
  • Verfolgung von Machine-Learning-Experimenten mit MLflow
  • und eine tiefere Integration mit translationalen

Unsere gemeinsame Vision mit Mount Sinai ist klar: KI sollte die Wissenschaft unterstützen, ohne das Vertrauen zu beeinträchtigen. Mit einer sicheren, lokal gehosteten Open-Source-Infrastruktur bauen wir genau das auf.

Sie wollen AIR·MS näher kennenlernen?

AIR·MS steht Forschern offen, die etwas bewegen möchten. Wenn Sie mit klinischen Daten arbeiten, reale Evidenz untersuchen oder Modelle für bessere Gesundheitsergebnisse entwickeln, bietet Ihnen AIR·MS einen sicheren, strukturierten Zugang zu einem der umfangreichsten anonymisierten Krankenhausdatensätze in den USA – mit direkter Unterstützung, modernen Tools und Raum für Wachstum.

Schreiben Sie uns
Data4Life

Digitale Lösungen für eine gesündere Welt