Sie sind hier: Startseite » Markt » Studien

Symptom-Checker-Apps deutlich hilfreicher


Neue Studien der TU Berlin zeigen Stärken und Schwächen von KI-gestützten Tools zur digitalen Gesundheitsberatung wie ChatGPT oder Symptom-Checker-Apps
Nutzer übernehmen Empfehlungen nicht unkritisch, sondern mit anderen Quellen wie Google-Suche, dem Rat von Freunden oder weiteren Apps abgleichen


Patienten greifen immer häufiger auf digitale Tools zurück, um Krankheiten zu erkennen und Handlungsempfehlungen zu erhalten. Zwei aktuelle Studien der TU Berlin haben nun die Qualität und Wirksamkeit solcher digitalen Gesundheitsempfehlungen untersucht. Die Ergebnisse zeigen sowohl Potenziale als auch Risiken auf. Die Studien sind in den Fachzeitschriften Journal Scientific Reports und npj Health Systems Journal erschienen.

In der ersten Studie entwickelte ein Team um Dr. Marvin Kopka aus dem Fachgebiet Arbeitswissenschaft an der TU Berlin eine neue Testmethode, um die Genauigkeit von Gesundheitsempfehlungen durch ChatGPT und andere KI-Modelle wie Meta’s LLaMa sowie speziell entwickelte Symptom-Checker-Apps, die Symptome abfragen und darauf basierend Handlungsempfehlungen geben, zu bewerten. Während frühere Tests auf idealisierten Lehrbuchfällen basierten, die in der Realität so kaum vorkommen, setzt die neue Methode auf echte Patientenfälle, mit denen die Wissenschaftler der TU Berlin verschiedene digitale Tools testeten. Dadurch lässt sich realistischer einschätzen, wie präzise und hilfreich die digitalen Tools in der Praxis sind. "Man kann unsere standardisierte Methode als eine Art ‚Stiftung Warentest‘ ansehen, da wir mit ihr die Genauigkeit von verschiedenen Apps vergleichen können, aber auch ihre Stärken und Schwächen finden", sagt Studienleiter Marvin Kopka.

Die Ergebnisse der neu entwickelten Bewertungsmethode zeigen, dass Symptom-Checker-Apps für Laien deutlich hilfreicher sind als ChatGPT, insbesondere wenn es um die Unterscheidung zwischen harmlosen und ernsten Symptomen geht. Während ChatGPT fast jeden Fall als Notfall oder hochdringlich einstuft, können die spezialisierten Apps in den meisten Fällen fundierte und angemessenere Empfehlungen geben. Was auch schon andere Studien belegen: ChatGPT kann Krankheiten gut diagnostizieren, wenn Laborwerte oder Untersuchungsergebnisse vorliegen. Da diese zu Hause meist fehlen, bleibt die Diagnose aber oft ungenau und die vom Modell vorgeschlagene Liste mit mehreren möglichen Erkrankungen hilft Laien wenig. Entscheidender sind Handlungsempfehlungen wie "Geh zum Arzt" oder "Ruf die 112" – hier schneidet ChatGPT jedoch schlecht ab, da es fast jeden Fall als behandlungsbedürftig einstuft, selbst bei harmlosen Symptomen.

Was die Forscher auch herausfanden: Laien erkennen medizinische Notfälle meist zuverlässig und rufen in ernsten Fällen, wie bei einer schweren Kopfverletzung mit Erbrechen und Schwindel, den Rettungsdienst. Schwerer fällt es ihnen jedoch, harmlose Symptome richtig einzuschätzen. So neigen viele dazu, bei leichten Beschwerden wie kurzfristigem Durchfall oder einer kleinen Hautveränderung vorschnell ärztliche Hilfe in Anspruch zu nehmen, obwohl dies oft nicht nötig wäre. "Dass immer mehr Menschen ChatGPT für medizinische Ratschläge nutzen, ist schädlich für das Gesundheitssystem. Die KI motiviert die Nutzer häufig dazu, bei den kleinsten Symptomen sofort einen Arzt oder die Notaufnahme aufzusuchen. Das kann zu einer massiven Überlastung führen", warnt Studienleiter Dr. Marvin Kopka.

Nutzer übernehmen digitale Empfehlungen nicht unkritisch
Die zweite Studie verglich nicht nur Menschen und Technik, sondern untersuchte, wie genau Menschen die Empfehlungen von ChatGPT und Symptom-Checker-Apps in ihre eigenen Entscheidungen einbeziehen. Dabei zeigte sich, dass Nutzer die Empfehlungen nicht unkritisch übernehmen, sondern mit anderen Quellen wie Google-Suchen, dem Rat von Freunden oder weiteren Apps abgleichen. "Auf der anderen Seite gibt es auch Fälle, in denen Patienten zu viele und teils unverständliche Informationen von den digitalen Tools bekommen, die sie nicht einordnen können. Das erzeugt Angst und sie suchen dann den Expertenrat in der Notaufnahme oder beim Hausarzt – auch bei harmlosen Beschwerden, so wie es ihnen ChatGPT empfiehlt", so Kopka.

Vor einer quantitativen Untersuchung mit 600 Probanden wurden in der zweiten Studie zunächst 24 Personen bei der Nutzung beobachtet und anschließend ein Modell aufgestellt, wie sie Entscheidungen mit Hilfe von ChatGPT und Apps treffen. Die Auswertung ergab erneut, dass ChatGPT die Selbstversorgung erschwert und die Zahl unnötiger Arztbesuche erhöht. Demgegenüber konnten gut funktionierende Symptom-Checker-Apps dazu beitragen, dass Nutzer sich in passenden Fällen für die Selbstversorgung entschieden und so zur Entlastung des Gesundheitssystems beitrugen. "ChatGPT hat viele sinnvolle Anwendungsfälle, aber zur Entscheidung, ob ich zum Arzt gehen sollte, ist es nicht geeignet – dafür ist es viel zu ungenau", resümiert Kopka. "Wir sollten uns eher fragen, ob eine App uns hilft, gute Entscheidungen zu treffen, statt von ihr Perfektion zu erwarten. Denn Menschen treffen bereits jetzt in den meisten Fällen sichere und vernünftige Entscheidungen. In einigen Situationen können Sie jedoch von den Apps profitieren."

Die Studien verdeutlichen, dass digitale Tools sinnvoll eingesetzt werden können, um Patienten in ihrer Entscheidungsfindung zu unterstützen. Speziell entwickelte Symptom-Checker-Apps erweisen sich dabei aktuell als hilfreicher als generative KI-Modelle wie ChatGPT. Dennoch bleibt laut der Wissenschaftler ein kritischer Umgang mit digitalen Empfehlungen entscheidend, um Fehleinschätzungen und eine unnötige Belastung des Gesundheitssystems zu vermeiden. (Technische Universität Berlin: ra)

eingetragen: 04.05.25

TU Berlin: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.


Meldungen: Studien

  • GenAI wird deutlich schneller angenommen

    Nutanix, Spezialistin für Hybrid Multicloud Computing, hat die Ergebnisse der siebten Ausgabe seiner jährlichen Studie Enterprise Cloud Index (ECI) für den Gesundheitssektor vorgestellt. Mit der weltweiten Umfrage misst der Anbieter die Verbreitung der Cloud-Nutzung in der Branche. Demnach nutzen aktuell bereits 99 Prozent der befragten Unternehmen und Institutionen im Gesundheitswesen Anwendungen oder Workloads generativer künstlicher Intelligenz (GenAI) - der höchste gemessene branchenspezifische Wert überhaupt.

  • Stand der SaaS-Datensicherung

    Unternehmen auf der ganzen Welt setzen Software-as-a-Service-Anwendungen (SaaS) für eine Vielzahl geschäftskritischer Workflows ein. Kleine und mittlere Unternehmen nutzen im Durchschnitt mehr als 200 SaaS-Anwendungen. Branchenanalysten gehen davon aus, dass die Verbreitung von SaaS weiter zunehmen wird.

  • IT-Beratung und Systemintegration

    Die 25 führenden mittelständischen IT-Beratungs- und Systemintegrations-Unternehmen in Deutschland blicken auf ein herausforderndes Jahr 2024 zurück: Ihre Umsätze sind im Durchschnitt nur um 2,2 Prozent gestiegen, während sie in den letzten zehn Jahren im Durchschnitt um 10 Prozent pro Jahr gewachsen sind. Ursachen hierfür sind Kostensparprogramme ihrer Kunden, gestoppte, verschobene oder geringer als geplant ausgefallene Digitalisierungsprogramme, aber auch Effekte aufgrund von Lieferantenkonsolidierungen seitens der Kunden.

  • Wirtschaft ruft nach einer deutschen Cloud

    In der deutschen Wirtschaft wächst die Sorge vor einer zu hohen Abhängigkeit von Cloud-Diensten aus dem Ausland. Fast zwei Drittel (62 Prozent) der Unternehmen in Deutschland würden ohne Cloud-Dienste stillstehen. Zugleich halten mehr als drei Viertel (78 Prozent) Deutschland für zu abhängig von US-Cloud-Anbietern, 82 Prozent wünschen sich große Cloud-Anbieter, sogenannte Hyperscaler, aus Deutschland oder Europa, die es mit den außereuropäischen Marktführern aufnehmen können. Und jedes zweite Unternehmen (50 Prozent), das Cloud Computing nutzt, sieht sich aufgrund der Politik der neuen US-Regierung gezwungen, die eigene Cloud-Strategie zu überdenken.

  • Absicherung hybrider Umgebungen zentrales Thema

    Die Netzwerk- und Sicherheitsdienstleisterin GTT Communications, hat die Ergebnisse einer neuen Studie zu Cloud-Nutzung und Management-Trends veröffentlicht. Die von Hanover Research durchgeführte Umfrage zeigt: Die Nutzung privater Cloud-Umgebungen nimmt durch steigende Anforderungen an Datenschutz, Sicherheit und Compliance zu - wobei KI-Workloads (künstliche Intelligenz) zunehmend als treibende Kraft dieser Entwicklung in Erscheinung treten.

  • Generative KI ist nicht länger ein Konzept

    Nutanix hat die Ergebnisse der siebten Ausgabe seiner jährlichen Studie "Enterprise Cloud Index" (ECI) für den Öffentlichen Sektor vorgestellt. Mit der weltweiten Umfrage misst der Anbieter die Verbreitung der Cloud-Nutzung in der Branche. Der diesjährige Bericht fördert zu Tage, dass 83 Prozent der Organisationen im Öffentlichen Sektor eine Strategie zu generativer künstlicher Intelligenz (GenAI) verfolgen, 54 Prozent diese bereits aktiv umsetzen und 29 Prozent deren Implementierung vorbereiten.

  • Beschleunigung der Private Cloud-Dynamik

    Private Clouds hinken nicht mehr hinterher und öffentliche Clouds sind nicht mehr der Standard: Unternehmen richten ihre Cloud-Strategien neu aus. Dieser "Cloud-Reset" ist das wichtigste Ergebnis des Berichts "Private Cloud Outlook 2025", einer detaillierten Umfrage unter 600 IT-Führungskräften in der Region EMEA (davon 200 in Deutschland), die Illuminas in Zusammenarbeit mit Broadcom durchgeführt hat.

  • KI am Arbeitsplatz wird überschätzt

    GoTo veröffentlichte ihren Forschungsbericht "The Pulse of Work in 2025": Trends, Wahrheiten und die praktische Anwendbarkeit von KI. Die Studie entstand in Zusammenarbeit mit Workplace Intelligence und basiert auf einer Umfrage unter 2.500 Arbeitnehmern und IT-Führungskräften weltweit. Ein überraschendes Ergebnis: Obwohl KI die Produktivität steigern soll, fühlen sich die meisten Mitarbeiter von den Versprechungen durch die Technologie enttäuscht. 59 Prozent glauben, dass KI deutlich überbewertet wird.

  • Praktische Strategien zur Risikominderung

    Tenable hat ihren "Cloud Security Risk Report 2025" veröffentlicht. Die Untersuchung ergab, dass 9 Prozent der öffentlich zugänglichen Cloud-Speicher sensible Daten enthalten, von denen 97 Prozent als geheim oder vertraulich eingestuft sind. Derartige Sicherheitsschwächen erhöhen das Risiko eines Missbrauchs, insbesondere wenn sie zusammen mit Fehlkonfigurationen oder eingebetteten Secrets auftreten.

  • Eindämmung von SaaS-Sprawl

    Man kann nur managen, was man auch sieht. IT-Teams kämpfen weiterhin mit mangelnder Transparenz über ihren gesamten Technologie-Stack hinweg. Obwohl immer mehr Unternehmen Software in die Cloud verlagern, bleibt die Übersicht dort lückenhaft - insbesondere bei SaaS (Software-as-a-Service) und BYOL (Bring Your Own License). Das zeigt der aktuelle State of ITAM Report 2025 von Flexera.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen