Was ist das Problem?
Die Leistungsbewertung von In-vitro-Diagnostika enthält eine Beurteilung und Analyse von Daten zur Feststellung oder Überprüfung der wissenschaftlichen Validität, der Analyseleistung und gegebenenfalls der klinischen Leistung eines Produkts.
Der klinischen Leistung ist der letzte Artikel der Serie gewidmet. Die zentrale Frage lautet:
Welche Punkte umfasst die klinische Leistung und was verbirgt sich dahinter?
Laut IVDR bezeichnet die klinische Leistung die Fähigkeit eines Produkts, Ergebnisse zu liefern, die mit einem bestimmten klinischen Zustand oder physiologischen oder pathologischen Vorgang oder Zustand bei einer bestimmten Zielbevölkerung und bestimmten vorgesehenen Anwendern korrelieren.
Wo finde ich Hilfe zur Lösung?
In der Verordnung (EU) 2017/746 über In-vitro-Diagnostika (kurz IVDR) Anhang I Absatz 9.1.b) sind die folgenden nachzuweisenden Leistungsmerkmale für die klinische Leistung genannt: diagnostische Sensitivität, diagnostische Spezifität, positiver prädiktiver Wert, negativer prädiktiver Wert und Likelihood-Verhältnis und erwartete Werte bei nicht betroffenen und betroffenen Bevölkerungsgruppen.
Und was bedeutet das konkret?
Zur Erklärung der Leistungsmerkmale der klinischen Leistung müssen im ersten Schritt die Begriffe „richtig Positiv“, „richtig Negativ“, „falsch Negativ“ und „falsch Positiv“ erläutert werden:
Um festzustellen, ob ein Patient an einer bestimmten Krankheit leidet, wird ein Labortest gemacht.
Der Wertebereich der Messwerte wird durch den Cutoff in Test-Positive und Test-Negative eingeteilt. Der Cutoff kann vom Hersteller des Tests selbst festgelegt werden.
Bei einem positiven Ergebnis wird davon ausgegangen, dass der Patient krank, bei einem negativen, dass der Patient gesund sei.
Durch eine zweite genauere Untersuchung wird festgestellt, ob der Patient tatsächlich unter der untersuchten Krankheit leidet, also krank oder gesund ist.
Um die Eignung des Labortests für die Diagnose der Krankheit zu beurteilen, folgt ein Vergleich des tatsächlichen Gesundheitszustandes mit dem Testergebnis.
Hierbei gibt es vier Möglichkeiten:
- richtig Positiv (rP): Der Patient ist krank und der Test hat dies richtig ausgesagt.
- richtig Negativ (rN): Der Patient ist gesund und der Test hat dies richtig ausgesagt.
- falsch Negativ (fN): Der Patient ist krank, aber der Test hat den Patienten fälschlich als gesund eingeordnet. à Es liegt ein Fehler des Tests vor.
- falsch Positiv (fP): Der Patient ist gesund, aber der Test hat den Patienten als krank eingeordnet. à Es liegt ein Fehler des Tests vor.
Für die Auswertung der klinischen Leistung wird ermittelt, wie häufig welche Kombination von Testergebnis und Gesundheitszustand vorgekommen ist und die Zahlen in eine Wahrheitsmatrix eingetragen:
krank | gesund | |
positives Testergebnis | richtig Positiv (rP) | falsch Positiv (fP) |
negatives Testergebnis | falsch Negativ (fN) | richtig Negativ (rN) |
Mit Hilfe dieser Kombinationen können die Leistungsmerkmale der klinischen Leistung berechnet werden. [2]
Diagnostische Sensitivität und Spezifität
Achtung Verwechselungsgefahr! Hier ist die Rede von der diagnostischen Sensitivität und Spezifität nicht von der analytischen Sensitivität und Spezifität. (Die Erklärung zur analytischen Sensitivität und Spezifität ist im Artikel zur Analyseleistung zu finden.)
Die diagnostische Sensitivität und Spezifität beschreiben die Fähigkeit eines Tests Kranke von Gesunden zu unterscheiden. Diese Eigenschaften können nur durch klinische Tests mit Patientenproben ermittelt werden. [1]
Die diagnostische Sensitivität gibt den Anteil der als richtig Positiv (rP) klassifizierten Testergebnisse an der Gesamtheit der Kranken (richtig Positiv (rP) + falsch Negativ (fN)) an. Die diagnostische Sensitivität ist hoch, wenn es möglichst wenig falsch negative Ergebnisse gibt.
Die diagnostische Spezifität gibt den Anteil der als richtig Negativ (rN) klassifizierten Testergebnisse an der Gesamtheit der Gesunden (richtig Negativ (rN) + falsch Positiv (fP)) an. Die diagnostische Sensitivität ist hoch, wenn es möglichst wenig falsch positive Ergebnisse gibt. [1]
Zusammenhang von diagnostischer Sensitivität und Spezifität und Cutoff
Die Wahl des Cutoffs ist entscheidend, den damit lässt sich die Sensitivität und Spezifität einstellen. Je höher der Cutoff gewählt wird, desto mehr falsch negative Ergebnisse gibt es und die diagnostische Sensitivität ist gering. Wird jedoch ein niedriger Cutoff gewählt, werden mehr falsch positive Testergebnisse erhalten und die diagnostische Spezifität ist gering. Wie hoch der Cutoff gewählt wird, hängt davon ab, ob es nachteiliger ist falsch positive oder falsch negative Ergebnisse zu erhalten. [3]
Positiv und negativer prädiktiver Wert
Der positive prädiktive Wert (PPV) gibt den Anteil der als richtig Positiv (rP) klassifizierten Testergebnisse an der Gesamtheit der positiven Ergebnisse (richtig Positiv (rP) + falsch Positiv (fP)) an.
Der negative prädiktive Wert (NPV) gibt den Anteil der als richtig Negativ (rN) klassifizierten Testergebnisse an der Gesamtheit der negativen Ergebnisse (richtig Negativ (rN) + falsch Negativ (fN)) an.
Das Likelihood-Verhältnis bezeichnet die Wahrscheinlichkeit, mit der ein bestimmtes Ergebnis bei einer Person mit dem klinischen oder physiologischen Zielzustand eintritt, im Verhältnis zu der Wahrscheinlichkeit, mit der das gleiche Ergebnis bei einer Person eintritt, bei der der betreffende klinische oder physiologische Zustand nicht vorliegt. [2]
Woran muss ich sonst noch denken?
Zusätzlich umschließt die klinische Leistung auch die Angabe erwarteter Werte bei nicht betroffenen und betroffenen Bevölkerungsgruppen.
Die klinische Leistung wird im Bericht über die klinische Leistung nachgewiesen und dokumentiert.
Welche Bereiche umfasst nun die Leistungsbewertung eines IVDs?
Die Berichte zur wissenschaftlichen Validität (1.Teil der Serie), zur Analyseleistung (2.Teil der Serie) und zur klinischen Leistung (3. Teil der Serie) werden in dem Bericht über die Leistungsbewertung vereint. Der Bericht über die Leistungsbewertung enthält zudem eine Bewertung der drei Berichte.
Die Leistungsbewertung besteht somit aus einer Literaturrecherche, die nachweist, dass es einen Zusammenhang zwischen dem mit dem IVD zu detektieren Stoff und der Erkrankung gibt (Nachweis der wissenschaftlichen Validität).
Außerdem wird mit Hilfe von technischer Validierung bestätigt, dass der zu bestimmende Stoff auch korrekt nachgewiesen wird (Analyseleistung).
Zusätzlich umfasst die Leistungsbewertung noch eine klinische Validierung mit Patientenproben (klinische Leistung).
Der Bericht über die Leistungsbewertung ist ein obligatorischer Bestandteil der technischen Dokumentation eines In-vitro-Diagnostikums.
Bei Fragen zur Leistungsbewertung / klinischen Leistung rufen Sie uns gern an!
Tel. +49 451 - 61 911 700
Verweise:
[1] Labordiagnostik bei Coronavirus SARS-CoV-2, aufgerufen unter https://www.oeglmkc.at/corona.html#ABS141 am 06.11.2020
[2] Beurteilung eines binären Klassifikators aufgerufen unter https://de.wikipedia.org/wiki/Beurteilung_eines_bin%C3%A4ren_Klassifikators am 08.09.2020
[3] Testtrennwert aufgerufen unter https://de.wikipedia.org/wiki/Testtrennwert am 13.11.2020