Anzeige

Digitalisierung

Künstliche Intelligenz in der zahnmedizinischen Diagnostik: Was ändert sich wirklich?

Künstliche Intelligenz (KI) wird in der Zahnmedizin häufig als „nächste Stufe“ der digitalen Diagnostik diskutiert. Der Fokus liegt dabei meist auf technischen Kennzahlen: Sensitivität, Spezifität, AUC, Übereinstimmung mit dem Referenzbefund usw. Diese Perspektive ist notwendig, aber unvollständig; der klinisch relevante Umbruch entsteht weniger dort, wo ein Algorithmus ein Bild „genauer“ analysiert, sondern dort, wo sich diagnostische Arbeit als Praxis verschiebt. In diesem Zusammenhang geht der folgende Artikel daher der Frage nach, wie sich Entscheidungsmuster verändern, wenn algorithmische Vorschläge zum Normalfall werden.

AI Logo Prostock-studio/AdobeStock
Getting your Trinity Audio player ready...

Diagnostik in der Zahnmedizin ist kein rein technischer Akt. Sie ist eine organisierte Form des Umgangs mit Unsicherheit: Befunde werden erhoben, in einen Kontext gestellt, mit Erfahrungswissen und Leitlinien abgeglichen, mit Patientenzielen und Risikoannahmen verknüpft – und am Ende muss gehandelt werden, obwohl die Lage im Einzelfall selten „eindeutig“ ist. Genau in diese Struktur greift KI ein. Dabei ist es jedoch weniger entscheidend, wie gut sie eine bestimmte Pathologie detektieren kann, sondern vielmehr wie sich Diagnostik verändert, wenn KI systematisch in Wahrnehmung, Bewertung und Wissenszugang eingebunden wird.

Diagnostik als klinische Praxis – und warum KI daran mehr ändert als die Digitalisierung zuvor

Die Digitalisierung der Zahnmedizin hat in den letzten Jahrzehnten vor allem die Datenerhebung und Dokumentation transformiert: digitales Röntgen, DVT, Intraoralscanner, strukturierte Anamnese-Tools, elektronische Patientenakte. Diese Technologien haben Datenqualität, Erhebungsgeschwindigkeit und Reproduzierbarkeit erhöht. Die zentrale diagnostische Arbeit – das Interpretieren, Integrieren, Gewichten und Entscheiden – blieb jedoch überwiegend beim Menschen.

Mit KI verschiebt sich diese Arbeitsteilung. Systeme zur radiologischen Befundunterstützung übernehmen Teile der Mustererkennung und Klassifikation, also Tätigkeiten, die historisch eng an klinische Erfahrung gekoppelt waren. Auch wenn dies nur ein Teilschritt der diagnostischen Kette ist, ist die Änderung strukturell bedeutsam: Wahrnehmung wird vorselektiert. Was markiert ist, wird wahrscheinlicher gesehen, was nicht markiert ist, wird wahrscheinlicher übersehen oder als weniger wichtig eingestuft. KI wird damit nicht nur ein Werkzeug „nach“ der Befunderhebung, sondern Teil des Wahrnehmungsapparats. Gleichzeitig wird Diagnostik dadurch implizit standardisiert: Der Befundraum wird in jene Kategorien übersetzt, die das Modell gelernt hat und zuverlässig abbilden kann – und umgekehrt teilweise eingeengt, wenn nicht gelernte Befunde nicht mehr durch den Menschen ergänzt werden (siehe unten).

Was KI bislang tatsächlich verändert hat

Die Evidenzlage zur Wirkung von KI in der zahnmedizinischen Diagnostik ist bislang überschaubar, aber konsistent. KI-gestützte Systeme erhöhen beispielsweise die Sensitivität bei der Detektion approximaler Kariesläsionen und reduzieren die interindividuelle Streuung der Befundung [1]. Diese Effekte betreffen primär die Wahrnehmungsebene. Sie verändern, was gesehen wird, wie früh Befunde ins Blickfeld geraten und welche als plausibel erscheinen.

Demgegenüber ist bislang kaum systematisch untersucht, inwieweit KI diagnostische oder therapeutische Entscheidungen verändert oder patientenrelevante Outcomes verbessert. Eine präzisere Befundung führt nicht automatisch zu einem anderen Handeln, da Therapieentscheidungen weiterhin vom klinischen Kontext, vom Risikoprofil, von Patientenpräferenzen und von den verfügbaren therapeutischen Optionen abhängen.

Gleichwohl gibt es erste Hinweise darauf, dass KI sehr wohl Entscheidungsprozesse beeinflusst. In randomisierten kontrollierten Studien aus der Zahnmedizin [2–4] zeigte sich, dass Behandlerinnen und Behandler mit KI-Unterstützung andere Therapieentscheidungen treffen als ohne KI – etwa hinsichtlich Invasivität oder Behandlungszeitpunkt. Diese Effekte bleiben bislang randständig in der zahnmedizinischen Literatur, sind aber konzeptionell bedeutsam, weil sie darauf hinweisen, dass KI nicht nur Wahrnehmung, sondern auch Entscheidungslogiken beeinflusst. Ein Blick in andere medizinische Disziplinen bestätigt diese Effekte. Ein Beispiel ist der schwedische MASAI-Trial. Hier wurde KI nicht als „besserer Befunder“ im Rahmen von Mammografie Screenings getestet, sondern als Bestandteil einer neuen Screening-Architektur. Untersuchungen wurden anhand eines KI-basierten Risikoscores triagiert: Niedrigrisiko-Fälle wurden durch nur eine Expertin oder einen Experten gelesen, höher eingestufte Fälle durch zwei – ergänzt durch KI-basierte Detektionshinweise. Der zentrale Effekt lag weniger in der Frage, ob einzelne Läsionen besser erkannt wurden, sondern in der veränderten Allokation von Aufmerksamkeit und Ressourcen. Expertenzeit wurde gezielter eingesetzt, die Befundungsarbeitslast sank deutlich (weil die Doppeltbefundung der Standard ist, auch in Deutschland), während die Detektionsleistung sich verbesserte [5]. KI fungierte hier nicht primär als diagnostische Instanz, sondern als organisatorisches Element, das den diagnostischen Prozess neu strukturiert. Ein anderes, für die Diskussion diagnostischer Praxis lehrreiches Feld ist die KI-assistierte Koloskopie. Hier greift KI in Echtzeit in die Wahrnehmung ein, indem potenzielle Polypen während der Untersuchung markiert werden. Randomisierte Studien zeigen konsistent, dass solche KI-Systeme die Detektionsleistung erhöhen. Klinisch entscheidend ist jedoch nicht allein die höhere Detektionsrate, sondern die daraus resultierende Entscheidungskaskade [6]. Jede zusätzlich detektierte Läsion verlangt eine Entscheidung über Resektion, Histologie, Follow-up und Risikokommunikation. KI erzeugt damit mehr Ereignisse, die klinisch verarbeitet werden müssen (bei der Koloskopie stieg die Anzahl der Resektionen von schlussendlich nichtneoplastischen Läsionen signifikant an). Der primäre Effekt liegt folglich nicht in einer automatisierten Diagnose, sondern in der Verschiebung von Aufmerksamkeit und in einer höheren Dichte entscheidungsrelevanter Situationen (mit dem Risiko, unnötig zu intervenieren). Für die Zahnmedizin ist dieser Mechanismus relevant, da auch hier Detektionsgewinne zwangsläufig Schwellenentscheidungen beeinflussen – etwa bei der Detektion von schmelzbegrenzten Läsionen auf Röntgenbildern. Noch näher an der Frage, wie KI diagnostische Arbeit reorganisiert, sind Workflow-Studien aus der Echokardiografie. In einer randomisierten Crossover-Untersuchung [7] wurde der Einsatz von KI-basierter automatisierter Bildanalyse im klinischen Alltag getestet. Die KI generierte Messwerte und Befundvorschläge, während sich die Untersucherinnen und Untersucher auf die Überprüfung, Korrektur und finale Bewertung konzentrierten. Die diagnostische Tätigkeit verlagerte sich von der primären Quantifizierung hin zur Validierung und Ausnahmebehandlung. Begleitend wurden Effekte auf Effizienz, Durchsatz und mentale Belastung beschrieben. Diese Studien sind für die Zahnmedizin deshalb relevant, weil sie exemplarisch zeigen, dass KI nicht zwingend die Entscheidung selbst verändert, aber die Rolle des Menschen im diagnostischen Prozess.

Diese Beispiele verdeutlichen ein gemeinsames Muster: Der wesentliche Effekt von KI liegt nicht darin, Diagnosen zu „ersetzen“, sondern darin, Wahrnehmung, Priorisierung und Entscheidungsarchitekturen zu verändern. Diagnostik wird dadurch nicht automatisiert, sondern neu organisiert.

Risiken: Automatisierungsbias, Deskilling und implizite Standards

Die Integration von KI in diagnostische Prozesse ist nicht nur mit potenziellen Effizienz- und Qualitätsgewinnen verbunden, sondern auch mit spezifischen Risiken, die weniger in spektakulären Fehlentscheidungen als in subtilen, systematischen Verschiebungen diagnostischer Urteilsbildung liegen. Diese Risiken betreffen nicht einzelne Fehlklassifikationen, sondern die Art und Weise, wie Entscheidungen vorbereitet, plausibilisiert und abgesichert werden (Tab. 1).

Chancemöglicher klinischer NutzenRisiko
erhöhte Detektionssensitivitätweniger übersehene Befunde, frühere Identifikation pathologischer VeränderungenÜberdiagnostik, erhöhte Interventionsrate
standardisierte Befundungreduzierte interindividuelle Variabilität, reproduzierbarere BefundungVerlust individueller Perspektiven, geringere Kontextsensitivität
EntscheidungsunterstützungEntlastung bei komplexen Befundlagen, strukturierte EntscheidungsvorbereitungAutomatisierungsbias, reduzierte kritische Distanz
Quantifizierung von UnsicherheitSichtbarmachung gradueller Risiken und Befundwahrscheinlichkeitentrügerische Präzision, normative Schwellen nicht bestimmt
verbesserter Wissenszugangkontextsensitiver Abruf von Leitlinien und EvidenzRisiko algorithmisch bereitgestellter Standards
Workflow-EffizienzZeitgewinn, bessere Allokation ärztlicher AufmerksamkeitDeskilling
Tab. 1: Chancen und Risiken von KI in der Diagnostik. Die Tabelle stellt zentrale Potenziale und korrespondierende Risiken KI-gestützter Diagnostik gegenüber. Die Effekte sind nicht zwingend gegensätzlich, sondern treten häufig gleichzeitig auf und erfordern bewusste Gestaltung diagnostischer Prozesse.

Ein zentrales Phänomen ist der sogenannte Automatisierungsbias [8]. Er beschreibt die Tendenz von Menschen, algorithmischen Empfehlungen überproportional zu vertrauen, insbesondere dann, wenn diese Systeme als zuverlässig, objektiv oder „State of the Art“ wahrgenommen werden. Empirisch ist gut belegt, dass unter dem Einfluss automatisierter Entscheidungshilfen widersprüchliche Informationen seltener berücksichtigt und eigene Zweifel weniger konsequent verfolgt werden. Dieser Effekt tritt nicht nur bei unerfahrenen Anwenderinnen und Anwendern auf, sondern auch bei hochqualifizierten Fachkräften. Er ist keine Frage mangelnder Kompetenz, sondern eine Folge veränderter Aufmerksamkeitsökonomie: Was ein System markiert oder hervorhebt, erhält Priorität; was es nicht markiert, gerät leichter aus dem Blick.

In der diagnostischen Praxis bedeutet dies, dass KI nicht nur unterstützt, sondern implizit lenkt. Ein markierter Befund erscheint plausibler, ein nicht markierter Befund weniger relevant – selbst dann, wenn die klinische Situation Anlass zu Skepsis geben würde. Die Gefahr liegt dabei nicht nur in der unkritischen Übernahme einzelner Vorschläge als in der schleichenden Veränderung diagnostischer Routinen. Wenn algorithmische Hinweise zunehmend unkritisch akzeptiert werden, verschiebt sich der Ausgangspunkt klinischer Überlegungen: Diagnostik beginnt nicht mehr mit einer offenen Befundung, sondern mit der Reaktion auf vorgegebene Signale.

Eng damit verbunden ist die Diskussion um Deskilling, wobei der Begriff häufig missverständlich verwendet wird. Es geht nicht primär um einen vollständigen Verlust diagnostischer Fähigkeiten, sondern um deren Umstrukturierung. Mit zunehmender Nutzung von KI verschiebt sich die menschliche Rolle von der primären Mustererkennung hin zur Plausibilisierung und Entscheidung innerhalb eines vorstrukturierten Optionsraums. Diese Verschiebung kann effizient sein und kognitive Belastung reduzieren, birgt jedoch das Risiko, dass der regelmäßige Umgang mit diagnostischer Unsicherheit und Grenzfällen abnimmt. Gerade in der Zahnmedizin, in der viele Befunde graduell und verlaufsabhängig sind, ist diese kontinuierliche Auseinandersetzung zentral für die Entwicklung und Aufrechterhaltung diagnostischer Urteilskraft.

Ein weiterer, häufig unterschätzter Aspekt betrifft die Veränderung von Fehlerlandschaften. Klassische menschliche Diagnosefehler entstehen häufig durch Ermüdung, Aufmerksamkeitsdefizite oder heuristische Abkürzungen. KI-Fehler hingegen resultieren aus strukturellen Grenzen der Modelle: unvollständigen oder verzerrten Trainingsdaten, unklar definierten Referenzstandards, eingeschränkter Kontextintegration oder Artefaktanfälligkeit. In der klinischen Praxis entstehen daraus hybride Fehlerformen, bei denen algorithmische Fehlannahmen nicht erkannt oder nicht ausreichend hinterfragt werden, weil sie in eine scheinbar objektive, konsistente Darstellung eingebettet sind. Das Risiko liegt dann weniger im isolierten KI-Fehler als in dessen unkritischer Übernahme. Hinzu kommt ein organisationsbezogener Effekt, der insbesondere in regulierten Versorgungssystemen relevant ist. KI-Systeme erzeugen implizite Standards. Wenn ein Algorithmus routinemäßig Befundvorschläge liefert, wird die Übereinstimmung mit diesen Vorschlägen zur Normalform. Abweichungen werden erklärungsbedürftig – nicht notwendigerweise, weil sie medizinisch problematisch sind, sondern weil sie vom dokumentierten Systemoutput abweichen. Damit verschiebt sich die Begründungslast diagnostischer Entscheidungen. Das ärztliche Urteil bleibt formal als letzte Instanz bestehen, wird jedoch stärker exponiert und muss sich gegenüber algorithmischen Referenzen rechtfertigen. Diese Verschiebung hat auch kommunikative Konsequenzen. Diagnostische Entscheidungen müssen nicht nur gegenüber Kolleginnen und Kollegen, sondern zunehmend auch gegenüber Patientinnen und Patienten erklärt werden, die algorithmische Unterstützung als Ausdruck besonderer Objektivität wahrnehmen können. Die Fähigkeit, Unsicherheit zu kommunizieren und begründete Abweichungen zu erläutern, gewinnt dadurch an Bedeutung. Zusammenfassend liegen die zentralen Risiken der KI-Nutzung in der Diagnostik nicht in spektakulären Fehlentscheidungen, sondern in graduellen, systematischen Veränderungen diagnostischer Praxis. KI beeinflusst, worauf Aufmerksamkeit gelenkt wird, wie Optionen bewertet werden und welche Entscheidungen als plausibel gelten. Diese Effekte sind nicht per se negativ, erfordern jedoch bewusste Gestaltung.

Von der Diagnose zur Wahrscheinlichkeit

Anzeige

Ein weiterer Effekt von KI betrifft die Form diagnostischen Wissens. Klassische Diagnosen sind kategorial organisiert, auch wenn diese Kategorien in der Praxis unscharf sind. KI hingegen arbeitet mit kontinuierlichen Wahrscheinlichkeiten und Scores. Sie ersetzt das „entweder–oder“ nicht vollständig, verschiebt aber den Fokus hin zu graduellen Einschätzungen. Diese Entwicklung passt zu einem bestehenden Trend in der Medizin, Diagnostik stärker risikobasiert zu verstehen. Für die Zahnmedizin ist dies besonders relevant, da Erkrankungen wie Karies oder Parodontitis als dynamische Prozesse begriffen werden. KI verstärkt diese Sichtweise, ohne selbst normative Schwellen für therapeutisches Handeln festzulegen. Diese Schwellen bleiben ärztliche Entscheidungen und müssen klinisch begründet werden. Bisher fehlt es an einer systematischen Auseinandersetzung und kritischen Betrachtung, wie diese Schwellenwerte festgelegt und kommuniziert werden sollten.

Wenn Wissen nahezu kostenlos wird

Über die unmittelbare diagnostische Anwendung hinaus verändert KI eine fundamentale Ressource der Medizin: den Zugang zu Wissen. Leitlinien, Studien, Klassifikationen und Hintergrundwissen sind nicht nur digital verfügbar, sondern zunehmend kontextsensitiv abrufbar und kombinierbar. Mit sogenannten Retrieval-basierten Ansätzen werden KI-Systeme in der Lage sein, kuratierte Wissensbestände gezielt in klinische Situationen einzubinden.

Die Konsequenzen dieser Entwicklung zeigen sich deutlich in der Organisationsforschung. In einem groß angelegten Feldexperiment konnte gezeigt werden, dass generative KI individuelle Leistungsfähigkeit auf ein Niveau heben kann, das zuvor Teamarbeit erforderte. KI übernimmt dabei Funktionen, die bislang durch soziale Strukturen bereitgestellt wurden: Zugriff auf heterogene Expertise, Perspektivenvielfalt, Strukturierung von Problemen und Gegenprüfung von Annahmen. Der Effekt ist nicht nur eine höhere Produktivität, sondern eine Verschiebung der Bedeutung von Wissen selbst [9].

Übertragen auf die Zahnmedizin bedeutet dies: Der diagnostische Vorteil von Erfahrung und Spezialwissen könnte sich strukturell verändern. Wenn relevantes Wissen jederzeit verfügbar ist, wird nicht mehr dessen Besitz entscheidend, sondern dessen Einordnung. Die zentrale ärztliche Leistung liegt dann weniger im Abruf von Fakten, sondern erneut in der Bewertung von Relevanz, Unsicherheit und Angemessenheit dieser Fakten vor dem Hintergrund der gesamtheitlich betrachteten Patientenbefunde usw. Langfristig ist daher weniger eine vollständige Automatisierung diagnostischer Entscheidungen zu erwarten als eine Rekonfiguration diagnostischer Arbeit. Diagnostik wird stärker zu einem Prozess der Moderation zwischen algorithmisch bereitgestelltem Wissen und klinischer Erfahrung (Tab. 2).

Ebene der DiagnostikCharakteristik klassischer PraxisEinfluss aktueller KI-Systemeklinische Bedeutung
Wahrnehmung/ Befunderhebungindividuelle visuelle Interpretation, erfahrungsabhängigstandardisierte Mustererkennung, Hervorhebung auffälliger Strukturenmehr Befunde sichtbar, geringere
interindividuelle Streuung
BefundbewertungKontextualisierung durch Anamnese, Risiko und Verlaufbisher keine eigenständige klinische KontextintegrationRelevanzbestimmung bleibt
ärztliche Aufgabe
Entscheidungsvorbereitungimplizite Abwägung, heuristisch geprägtVorstrukturierung durch Markierungen und VorschlägeVerschiebung von Aufmerksamkeit
Therapieentscheidungnormative Schwellenentscheidungkeine autonome EntscheidungsfindungVerantwortung bleibt beim
Menschen
Wissenszugangselektiv, zeit- und erfahrungsabhängigkontextsensitiver Abruf digitaler WissensbeständeWissen wird verfügbar, aber nicht
automatisch handlungsleitend
Tab. 2: Ebenen diagnostischer Arbeit und Wirkorte Künstlicher Intelligenz.

Fazit

KI verändert die Diagnostik in der Zahnmedizin durch eine Transformation diagnostischer Arbeit. Sie beeinflusst, was gesehen wird, wie Entscheidungen vorbereitet werden und welches Wissen im Alltag verfügbar ist. Diagnostik bleibt eine ärztliche Kernkompetenz – gerade weil KI sie nicht ersetzt, sondern neu rahmt. Eine zentrale Herausforderung besteht darin, die Effekte von KI auf Wahrnehmung, Entscheidung und Wissen zu verstehen und bewusst zu gestalten.

Kommentare

Keine Kommentare.

Anzeige