Welcher Plaque-Index ist für welche parodontologische Fragestellung geeignet? Und wie wertet man ordinalskalierte Daten statistisch korrekt aus? Dieser Ratgeber erklärt die Indexwahl, die Skalenproblematik und die passenden statistischen Tests – mit konkreten Beispielen für Dissertationen und klinische Studien in der Parodontologie.
Der API (Approximalraum-Plaque-Index) nach Lange et al. (1977) misst Plaque im Interdentalraum (dichotom: ja/nein). Der SBI (Sulkus-Blutungs-Index) nach Mühlemann & Son (1971) erfasst Blutung auf Sondierung (dichotom). Der PBI (Papillen-Blutungs-Index) nach Saxer & Mühlemann (1975) bewertet die Blutungsintensität auf einer Ordinalskala von 0–4. Alle drei Indizes erzeugen ordinalskalierte oder dichotome Daten – die Verwendung von Mittelwert und t-Test ist daher statistisch nicht korrekt. Stattdessen: Median und Interquartilsbereich für die Deskription, Mann-Whitney-U-Test (zwei Gruppen), Kruskal-Wallis-Test (drei+ Gruppen) oder Wilcoxon-Vorzeichen-Rang-Test (verbundene Stichproben) für die Inferenzstatistik.
Plaque- und Entzündungsindizes sind das zentrale Messinstrument in klinischen Parodontologie-Studien. Sie quantifizieren den Mundhygienestatus und die gingivale Entzündung und ermöglichen Verlaufsbeurteilungen – etwa vor und nach einer Parodontitistherapie, einer professionellen Zahnreinigung oder einem Mundhygiene-Training.
Approximalraum-Plaque-Index (Lange et al., 1977). Misst Plaque im Interdentalraum. Dichotom: Plaque vorhanden (+) oder nicht (−). Ergebnis: Prozentwert (Anteil positiver Flächen). Bewertung: < 25 % = optimal, 25–39 % = gut, 40–69 % = mäßig, 70–100 % = unzureichend.
Sulkus-Blutungs-Index (Mühlemann & Son, 1971). Erfasst Blutung auf Sondierung am Gingivasulkus. Dichotom: Blutung (+) oder nicht (−). Ergebnis: Prozentwert. Misst gingivale Entzündung als Frühindikator. Einfach, schnell, hohe Reproduzierbarkeit.
Papillen-Blutungs-Index (Saxer & Mühlemann, 1975). Bewertet die Blutungsintensität der Interdentalpapille nach Sondierung. Ordinalskala 0–4: 0 = keine Blutung, 1 = einzelner Blutpunkt, 2 = mehrere Blutpunkte/Linie, 3 = Blutdreieck, 4 = profuse Blutung. Differenzierter als SBI.
| Index | Autor | Skala | Misst |
|---|---|---|---|
| PI (Plaque-Index) | Silness & Löe, 1964 | Ordinal (0–3) | Plaquemenge an 4 Zahnflächen |
| GI (Gingiva-Index) | Löe & Silness, 1963 | Ordinal (0–3) | Gingivale Entzündung an 4 Flächen |
| BOP | Ainamo & Bay, 1975 | Dichotom (ja/nein) | Bleeding on Probing |
| QHI (Quigley-Hein) | Quigley & Hein, 1962 (mod. Turesky) | Ordinal (0–5) | Plaque-Ausdehnung auf der Zahnoberfläche |
| PCR (Plaque Control Record) | O'Leary et al., 1972 | Dichotom (ja/nein) | Plaque an 4 Zahnflächen, Prozentwert |
Die Wahl des Index hängt von der klinischen Fragestellung, dem Studiendesign und der gewünschten Sensitivität ab. Eine falsche Indexwahl kann dazu führen, dass klinisch relevante Unterschiede statistisch nicht nachweisbar sind.
| Kriterium | API | SBI | PBI |
|---|---|---|---|
| Was wird gemessen? | Plaque (Interdentalraum) | Gingivale Blutung (Sulkus) | Blutungsintensität (Papille) |
| Skalenniveau | Dichotom → Prozentwert | Dichotom → Prozentwert | Ordinal (0–4) |
| Sensitivität | Gering (nur ja/nein) | Gering (nur ja/nein) | Hoch (5 Stufen) |
| Zeitaufwand pro Patient | Niedrig (ca. 2 min) | Niedrig (ca. 3 min) | Mittel (ca. 5 min) |
| Inter-Rater-Reliabilität | Hoch (dichotom) | Hoch (dichotom) | Mittel (Grad 2 vs. 3 abgrenzungsschwierig) |
| Geeignet für | Screening, Motivationsgespräch, große Kohorten | Entzündungs-Screening, Recall-Monitoring | Therapiestudien, Verlaufsbeurteilung, kleine Unterschiede detektieren |
| Typische Studien | Epidemiologie, Mundhygiene-Interventionen | PZR-Studien, Recall-Compliance | Parodontitistherapie-RCTs, Medikamentenstudien |
Wenn Sie kleine Veränderungen in der gingivalen Entzündung nachweisen wollen (z. B. Effekt einer adjuvanten Therapie), verwenden Sie den PBI – die ordinale 5-Stufen-Skala ist sensitiver als dichotome Indizes. Für Plaque-Screening bei großen Kohorten ist der API effizient und reliabel. Für BOP als Entzündungsmarker mit schneller Erhebung ist der SBI das Mittel der Wahl. In vielen Dissertationen werden mehrere Indizes parallel erhoben – das stärkt die Aussagekraft.
Parodontologie-Dissertation mit klinischen Daten?
Unsere Ghostwriter kennen die Indexwahl und die statistischen FallstrickeDer häufigste statistische Fehler in parodontologischen Studien: Ordinal- oder dichotome Daten werden behandelt wie metrische Daten. Das hat massive Konsequenzen für die Validität der Ergebnisse.
| Index | Einzelwert | Aggregiert | Skalenniveau | Konsequenz |
|---|---|---|---|---|
| API | Dichotom (+/−) | Prozentwert | Quasi-metrisch | Parametrische Tests möglich bei NV; sonst nichtparametrisch |
| SBI | Dichotom (+/−) | Prozentwert | Quasi-metrisch | Wie API: NV prüfen |
| PBI | Ordinal (0–4) | Summe oder Median | Ordinal | Zwingend nichtparametrisch. Mittelwertbildung nur zur Beschreibung. |
In vielen publizierten Studien werden PBI-Mittelwerte mit t-Tests verglichen. Das funktioniert „praktisch" bei großen Stichproben (zentraler Grenzwertsatz). Methodisch korrekt ist es nicht – Gutachter in Dissertationsverfahren erkennen das. Wenn Sie Mittelwerte für ordinale Daten verwenden, begründen Sie das explizit und berichten zusätzlich nichtparametrische Tests als Sensitivitätsanalyse. Besser: Von Anfang an nichtparametrisch arbeiten.
Bevor Sie Gruppenunterschiede testen, müssen Sie Ihre Daten korrekt beschreiben. Die Wahl der Lagemaße hängt direkt vom Skalenniveau ab.
| Index | Lagemaß | Streuungsmaß | Grafische Darstellung |
|---|---|---|---|
| API (%) | Median (oder MW bei NV) | IQR (oder SD bei NV) | Boxplot, Histogramm |
| SBI (%) | Median (oder MW bei NV) | IQR (oder SD bei NV) | Boxplot, Histogramm |
| PBI (0–4) | Median | IQR | Boxplot, gestapeltes Balkendiagramm |
| PBI (Summe) | Median | IQR oder Range | Boxplot |
„Der mediane PBI lag in der Testgruppe bei Baseline bei 2,0 (IQR: 1,0–3,0) und sank nach 6 Wochen auf 1,0 (IQR: 0,0–2,0). In der Kontrollgruppe betrug der mediane PBI zu Baseline 2,0 (IQR: 1,5–3,0) und nach 6 Wochen 1,5 (IQR: 1,0–2,5). Der API sank in der Testgruppe von 58,3 % ± 12,1 % auf 28,7 % ± 9,8 % (Mittelwert ± SD; Normalverteilung bestätigt durch Shapiro-Wilk-Test, p = 0,21)."
Die Testwahl folgt einer klaren Logik: Skalenniveau × Gruppenanzahl × Verbundenheit der Stichproben. Für ordinale Plaque-Indizes kommen ausschließlich nichtparametrische Verfahren in Frage – für quasi-metrische Prozentwerte (API, SBI) auch parametrische, wenn die Voraussetzungen erfüllt sind.
| Fragestellung | Gruppen | Stichprobe | PBI (ordinal) | API/SBI (quasi-metrisch) |
|---|---|---|---|---|
| Unterschied zwischen 2 Gruppen | 2 | Unverbunden | Mann-Whitney-U-Test | t-Test (wenn NV) oder Mann-Whitney-U |
| Unterschied zwischen 3+ Gruppen | 3+ | Unverbunden | Kruskal-Wallis-Test + Dunn's Post-hoc | ANOVA (wenn NV) oder Kruskal-Wallis |
| Vorher-Nachher (1 Gruppe) | 2 Zeitpunkte | Verbunden | Wilcoxon-Vorzeichen-Rang-Test | Gepaarter t-Test (wenn NV) oder Wilcoxon |
| Verlauf über 3+ Zeitpunkte | 3+ Zeitpunkte | Verbunden | Friedman-Test + Wilcoxon Post-hoc | RM-ANOVA (wenn NV) oder Friedman |
| Korrelation zweier Indizes | – | – | Spearman-Rangkorrelation | Pearson (wenn NV) oder Spearman |
Vor jedem parametrischen Test Shapiro-Wilk-Test (n < 50) oder Kolmogorov-Smirnov (n ≥ 50) durchführen. Zusätzlich visuell mit Q-Q-Plot und Histogramm. Bei API/SBI-Prozentwerten mit n ≥ 30 und symmetrischer Verteilung sind parametrische Tests oft vertretbar. Bei PBI: Immer nichtparametrisch, unabhängig von der Stichprobengröße.
Ein p-Wert allein sagt nichts über die klinische Relevanz. Für nichtparametrische Tests:
Berechnung: r = Z / √N. Interpretation: r = 0,1 (klein), r = 0,3 (mittel), r = 0,5 (groß). Angabe: „U = 245, Z = −3,12, p = 0,002, r = 0,42 (mittlerer Effekt)."
Berechnung: η² = H / (N − 1). Interpretation: η² = 0,01 (klein), 0,06 (mittel), 0,14 (groß). Bei signifikantem Ergebnis: Post-hoc mit Bonferroni-Korrektur.
Die meisten Parodontologie-Studien sind Längsschnittstudien: Baseline → Behandlung → Follow-up. Die Auswertung verbundener Stichproben erfordert andere Tests als der Gruppenvergleich.
Bei Post-hoc-Vergleichen zwischen mehreren Zeitpunkten (z. B. Baseline vs. 3 Monate, Baseline vs. 6 Monate, 3 vs. 6 Monate) müssen Sie das multiple Testproblem berücksichtigen. Lösung: Bonferroni-Korrektur (α/k, wobei k = Anzahl Vergleiche). Bei 3 Vergleichen: α = 0,05/3 = 0,017.
Typisches Design: Testgruppe vs. Kontrollgruppe, gemessen zu Baseline, 3 und 6 Monaten. Für PBI gibt es keine einfache nichtparametrische „Zweifach-ANOVA".
Pro Zeitpunkt: Mann-Whitney-U zwischen den Gruppen. Pro Gruppe: Friedman über die Zeitpunkte. Nachteil: Interaktionseffekt (Gruppe × Zeit) wird nicht direkt getestet.
Generalized Estimating Equations modellieren ordinale Daten im Längsschnitt mit Gruppe, Zeit und Interaktion als Faktoren. Empfehlung: Statistik-Beratung einholen.
Komplexe Längsschnittauswertung in der Paro-Dissertation?
Unsere Statistik-Experten unterstützen bei GEE, Friedman und gemischten ModellenKonkrete Syntax-Beispiele für die häufigsten Tests in Parodontologie-Studien – direkt zum Übernehmen in die Dissertation.
„Ordinalskalierte Daten (PBI) wurden als Median und Interquartilsbereich dargestellt. Gruppenvergleiche erfolgten mittels Mann-Whitney-U-Test (unverbundene Stichproben) bzw. Wilcoxon-Vorzeichen-Rang-Test (verbundene Stichproben). Quasi-metrische Daten (API, SBI) wurden nach Prüfung auf Normalverteilung (Shapiro-Wilk-Test) mit dem gepaarten t-Test bzw. dem t-Test für unverbundene Stichproben ausgewertet. Korrelationen zwischen Indizes wurden mittels Spearman-Rangkorrelation berechnet. Das Signifikanzniveau wurde auf α = 0,05 festgelegt. Alle Analysen erfolgten mit SPSS (Version 29, IBM Corp.) [oder R (Version 4.3.2, R Foundation)]."
| # | Fehler | Warum problematisch? | Korrekte Lösung |
|---|---|---|---|
| 1 | t-Test auf PBI-Daten | PBI ist ordinalskaliert – t-Test setzt Intervallskala und NV voraus | Mann-Whitney-U (unverbunden) oder Wilcoxon (verbunden) |
| 2 | Mittelwert ± SD für PBI angegeben | Mittelwert impliziert gleiche Abstände zwischen Stufen | Median (IQR) als primäres Lagemaß |
| 3 | Keine Normalverteilungsprüfung vor t-Test | Bei nicht-normalverteilten API/SBI-Daten sind parametrische Tests ungültig | Shapiro-Wilk vor jedem parametrischen Test berichten |
| 4 | Multiples Testen ohne Korrektur | 3 Zeitpunkte × 2 Gruppen → α-Fehler-Inflation | Bonferroni-Korrektur oder Dunn's Post-hoc |
| 5 | Keine Effektstärke berichtet | p-Wert sagt nichts über klinische Relevanz | r = Z/√N (U-Test) oder η² (Kruskal-Wallis) |
| 6 | Pearson statt Spearman-Korrelation | Pearson setzt Intervallskala und lineare Beziehung voraus | Spearman-Rangkorrelation für ordinale Indizes |
| 7 | Inter-Rater-Reliabilität nicht berichtet | Besonders PBI (5 Stufen) ist untersucherabhängig | Cohen's κ (gewichtet) berechnen, Kalibrierung dokumentieren |
| 8 | Keine Power-Analyse a priori | Studie möglicherweise underpowered | G*Power mit Effektgröße aus Literatur, α = 0,05, Power = 0,80 |
| 9 | Balkendiagramm mit MW ± SD für PBI | Suggeriert metrische Daten – irreführend | Boxplot oder gestapeltes Balkendiagramm (Häufigkeitsverteilung) |
| 10 | Chi²-Test für PBI-Gruppenvergleich | Chi² vergleicht Häufigkeiten, nicht Rangordnungen – ignoriert die ordinale Struktur | Mann-Whitney-U nutzt die Rangordnung der Daten aus |
Streng genommen nein – der PBI ist ordinal und der Mittelwert setzt gleiche Abstände zwischen den Stufen voraus. In der Praxis wird der Mittelwert in vielen Publikationen verwendet, was methodisch umstritten, aber weit verbreitet ist. Für Ihre Dissertation empfehlen wir: Median (IQR) als primäres Lagemaß verwenden. Wenn Sie den Mittelwert ergänzend angeben wollen, begründen Sie das im Methodenteil und führen Sie die Inferenzstatistik immer nichtparametrisch durch.
Die benötigte Stichprobengröße hängt von der erwarteten Effektgröße ab. Für den Mann-Whitney-U-Test können Sie G*Power verwenden (Test: „Wilcoxon-Mann-Whitney test, two groups"). Als Faustregel: Bei einem erwarteten mittleren Effekt (d = 0,5) benötigen Sie ca. n = 30 pro Gruppe für eine Power von 0,80 bei α = 0,05. Für kleine Effekte (d = 0,3): n = 80–90 pro Gruppe. Kalkulieren Sie die Power-Analyse vor Studienbeginn und dokumentieren Sie die Parameter im Methodenteil.
Ja – das ist sogar empfehlenswert. API misst Plaque (Ursache), PBI misst Entzündung (Wirkung). Durch die parallele Erhebung können Sie die Korrelation zwischen Plaque und Entzündung analysieren (Spearman-Rangkorrelation). Die Kombination stärkt die Aussagekraft Ihrer Dissertation und erlaubt eine differenziertere Diskussion der Ergebnisse. Beachten Sie: Jeder Index wird statistisch separat ausgewertet – die Methoden unterscheiden sich je nach Skalenniveau.
Beide messen Blutung auf Sondierung und sind dichotom (ja/nein). Der Hauptunterschied liegt in der Methodik: Beim SBI nach Mühlemann wird der Sulkus vorsichtig mit einer stumpfen Sonde ausgestrichen. Beim BOP nach Ainamo & Bay wird die Parodontalsonde zur Sondierungstiefenmessung verwendet und gleichzeitig die Blutung registriert. In der modernen Parodontologie wird meist BOP verwendet, da es in die reguläre parodontale Befunderhebung integriert ist. Statistisch werden beide identisch ausgewertet (Prozentwert, quasi-metrisch).
Vor Studienbeginn sollte eine Kalibrierungssitzung stattfinden, bei der zwei oder mehr Untersucher denselben Satz von Patienten (mind. 10–15) unabhängig bewerten. Die Übereinstimmung wird als gewichtetes Cohen's Kappa (κ) berechnet – „gewichtet", weil PBI ordinal ist und eine Abweichung von 0 vs. 1 weniger gravierend ist als 0 vs. 4. Interpretation: κ > 0,80 = sehr gute Übereinstimmung, 0,61–0,80 = gute Übereinstimmung. Im Methodenteil: „Die Inter-Rater-Reliabilität wurde an 15 Patienten bestimmt. Das gewichtete Cohen's Kappa betrug κ = 0,83 (95 %-KI: 0,76–0,90)."
Ja – gerade die statistische Auswertung ordinalskalierter Daten, die Power-Analyse und die korrekte Formulierung des Methodenteils erfordern Fachkenntnis. Unser Team bei BAS – Business and Science umfasst Statistiker und Ghostwriter mit medizinischem Hintergrund, die Parodontologie-Studien methodisch und inhaltlich unterstützen. Mehr dazu: Doktorarbeit Zahnmedizin und Statistik-Beratung.
Klinische Studien, Parodontologie-Dissertationen und wissenschaftliche Arbeiten für alle zahnmedizinischen Disziplinen:
Klinische Datenerhebung, statistische Auswertung ordinalskalierter Indizes oder den Methodenteil Ihrer Dissertation auf Gutachter-Niveau formulieren? Unser Team mit promovierten Zahnmediziner:innen und Biostatistiker:innen unterstützt Sie – fristgerecht und methodisch fundiert.
Ghostwriter Zahnmedizin Ghostwriter Jetzt anfragen