Hintergrund und Zielstellung
Rückenschmerzen sind eine der Hauptursachen für Arbeitsunfähigkeit und mit Krankheit oder Behinderung gelebte Lebensjahre (2017 weltweit etwa 65 Millionen Jahre) (GBD, 2018). Um das vorzeitige gesundheitsbedingte Ausscheiden aus dem Erwerbsleben zu vermeiden, kann bei der Deutschen Rentenversicherung (DRV) eine medizinische Rehabilitation beantragt werden. Ziel dieser Leistungen ist die Wiederherstellung oder Verbesserung der Erwerbsfähigkeit. Die wenigen randomisierten kontrollierten Studien zur Wirksamkeit medizinischer Rehabilitation bei Rückenschmerzen in Deutschland erbrachten bisher widersprüchliche Befunde (SVR Gesundheitswesen, 2014). Randomisierte kontrollierte Studien zur Überprüfung der Wirksamkeit medizinischer Rehabilitation sind möglich (Hüppe et al., 2006), haben aber auch ihre Grenzen hinsichtlich der Abbildung langfristiger Effekte. Zudem entsprechen die in diesen Studien eingeschlossenen Personen nur eingeschränkt den in der realen Versorgung tatsächlich erreichten Personen. Die vorliegende Kohortenstudie analysierte die Effekte medizinischer Rehabilitation bei in der realen Versorgung erreichten Personen mit Rückenschmerzen anhand eines Propensity Score Matchings.
Methoden
In dieser prospektiven Beobachtungsstudie (Deutsches Register Klinischer Studien: DRKS00011554; Bethge et al., 2017) wurde zunächst eine Zufallsstichprobe von 45.000 Personen zu gleichen Teilen aus den Versichertenkonten der DRV Nord und der DRV Mitteldeutschland gezogen. Eingeschlossen wurden erwerbstätige Personen (45-59 Jahre alt), die in den vorangegangenen vier Jahren keine Rehabilitation beantragt oder in Anspruch genommen und bisher keinen Antrag auf Erwerbsminderungsrente gestellt hatten. Nach der Erstbefragung im Jahr 2017 wurden Personen, die Rückenschmerzen berichteten, im Jahr 2019 nachbefragt. Die Fragebogendaten wurden mit administrativen Daten zu Rehabilitation und Erwerbsminderungsrenten verknüpft. Die Effekte medizinischer Rehabilitation wurden über den Vergleich einer Stichprobe von Personen mit und einer Stichprobe von Personen ohne Rehabilitation, die mittel Propensity Score Matching geriert wurde, ermittelt (Austin, 2011). Primäres Zielkriterium war die Schmerzbeeinträchtigung der letzten drei Monate (0-100 Punkte). Weitere sekundäre Zielkriterien waren Schmerzintensität, Schmerzbeeinträchtigungstage, Arbeitsunfähigkeitstage, Gesundheitszustand, Depressivität, subjektive Arbeitsfähigkeit, subjektive Erwerbsprognose sowie aus den Versichertenkonten extrahierte Daten zu Erwerbsminderungsrenten. Die Behandlungseffekte wurden für imputierte Datensätze (Intention to treat-Analyse) und für vollständige Daten (Complete Case-Analyse) geschätzt.
Ergebnisse
Für die Analyse konnten Daten von 6.610 Personen (M = 52,9 Jahre alt (SD = 4,1); 62,8 % weiblich) berücksichtigt werden. Davon nahmen 200 Personen eine medizinische Rehabilitation aufgrund von Muskel-Skelett-Erkrankungen in Anspruch. Der Zeitraum zwischen der Erstbefragung und dem Beginn des Rehabilitationsprogramms war mit durchschnittlich über 340 Tagen (M = 343 Tagen; SD = 177,3) sehr lang. Mittels Propensity Score Matching konnten Stichproben mit vergleichbaren Stichprobenmerkmalen generiert werden. Für die vergleichende Analyse wurden den 200 Personen mit medizinischer Rehabilitation (Interventionsgruppe, IG), 200 vergleichbare Personen ohne medizinische Rehabilitation (Kontrollgruppe, KG) gegenübergestellt. Die Schmerzbeeinträchtigung wurde in der KG im Vergleich zur IG um vier Punkte günstiger bewertet (Differenz = 4,2; 95 % KI: -0,8 bis 9,2; p = 0,099; n = 400). In der Complete-Case-Analyse zeigte sich ein Unterschied von 6 Punkten zugunsten der KG (Differenz = 6,1; 95 % KI: 0,9 bis 11,2; p = 0,020; n = 326) im primären Zielkriterium. Darüber hinaus berichteten Personen in der KG weniger Schmerzbeeinträchtigungstage, weniger Arbeitsunfähigkeitstage, eine höhere subjektive Arbeitsfähigkeit, eine günstigere subjektive Erwerbsprognose und beantragten seltener eine Erwerbsminderungsrente.
Diskussion und Fazit
Auf den ersten Blick deuten die Ergebnisse unserer Kohortenstudie darauf hin, dass die medizinische Rehabilitation bei Erwerbstätigen mit Rückenschmerzen keinen Vorteil zeigt. Allerdings war der Zeitraum von durchschnittlich mehr als 340 Tagen zwischen der Ersterhebung und dem Beginn des Rehabilitationsprogramms sehr lang. In der Zwischenzeit erfuhren Personen mit einer Rehabilitation wahrscheinlich eine gesundheitliche Verschlechterung, die in Folge zu einer Inanspruchnahme medizinischer Rehabilitation führte. Anhand unserer Daten bleibt unklar, wann diese Verschlechterung stattfand. Wir gehen nicht davon aus, dass die bei der Ersterhebung erfassten Stichprobenmerkmale die Merkmale der behandelten Personen zu Beginn ihres Rehabilitationsprogramms widerspiegeln. Im Verlauf des Projekts wurde deutlich, dass der von uns gewählte Zeitpunkt der Erstbefragung für die Analyse der Effekte der medizinischen Rehabilitation ungeeignet ist. In einem modifizierten kostengünstigeren Design wäre es erforderlich, dass die Ersterhebung kurz vor Beginn der Rehabilitation durchgeführt wird. Sowohl Teilnehmende einer medizinischen Rehabilitation als auch Kontrollen ohne Rehabilitation könnten über Versichertenkonten der Rentenversicherungsträger rekrutiert werden. Mittels Propensity Score Matching könnte anschließend auf Basis der Daten der Ersthebung eine vergleichbare Kontrollgruppe zu den Personen mit medizinischer Rehabilitation generiert werden. Fälle und Kontrollen könnten dann ein und zwei Jahre später erneut angeschrieben und befragt werden.
Literatur
Austin, P. C. (2011): An introduction to propensity score methods for reducing the effects of confounding in observational studies. Multivariate Behavioral Research, 46. 399-424.
Bethge, M., Mattukat, K., Fauser, D., Mau, W. (2017): Rehabilitation access and effectiveness for persons with back pain: the protocol of a cohort study (REHAB-BP, DRKS00011554). BMC Public Health, 18. 22.
GBD 2017 Disease and Injury Incidence and Prevalence Collaborators (2018): Global, regional, and national incidence, prevalence, and years lived with disability for 354 diseases and injuries for 195 countries and territories, 1990-2017: a systematic analysis for the Global Burden of Disease Study 2017. Lancet, 392. 1789-1858.
Hüppe, A., Glaser-Möller, N., Raspe, H. (2006): Trägerübergreifendes Projekt zur Früherkennung von Rehabilitationsbedarf bei Versicherten mit muskuloskelettalen Beschwerden durch Auswertung von Arbeitsunfähigkeitsdaten: Ergebnisse einer randomisierten, kontrollierten Evaluationsstudie. Gesundheitswesen, 68. 347-356.
Sachverständigenrat (SVR) zur Begutachtung der Entwicklung im Gesundheitswesen (2014). Bedarfsgerechte Versorgung - Perspektiven für ländliche Regionen und ausgewählte Leistungsbereiche. Bern: Huber.
Hintergrund und Zielstellung
Ein wichtiges Ziel in der Rehabilitation der Rentenversicherung ist die (Wieder-)Eingliederung in das Erwerbsleben. Bei dieser Zielgröße sind unterschiedliche Operationalisierungen möglich. Durch Zusammenarbeit von Rentenversicherungsträgern und Rehabilitationsforschung wurde dafür auch die Nutzung von (anonymisierten) Routinedaten der Rentenversicherung möglich. Dieser Ansatz bietet im Gegensatz etwa zu Fragebogenerhebungen den Vorteil, dass für sehr große Fallzahlen und lange Zeiträume der Erwerbsstatus sehr zuverlässig ermittelt werden kann. Ein guter Indikator ist die Anzahl Tage mit sozialversicherungspflichtiger Beschäftigung, da dieser den Erwerbsstatus unabhängig von individueller Wochenarbeitszeit und Vergütung widerspiegelt. Allerdings stellen der auf das Intervall [0,365] eingeschränkte Wertebereich, die U-förmige Verteilung (d.h. viele Beobachtungen an den Rändern des Wertebereiches mit 0 bzw. 365 Tagen) sowie mögliche Einflüsse vorbestehender Merkmale der Rehabilitanden und des regionalen Arbeitsmarktes auf die Zielgröße besondere Anforderungen an die Auswertemethodik.
Methoden
Für eine Teilstichprobe der Requamo-II-Studie (15.404 Rehabilitanden aus 82 orthopädischen Fachabteilungen) wurden Prognosemodelle zur Vorhersage der Beschäftigungstage im ersten Kalenderjahr nach Rehabilitation gerechnet. Dabei wurden aus folgenden Modellfamilien jeweils Ein- und Mehrebenenmodelle (mit der Fachabteilung als zweite Ebene) betrachtet:
• generalisierte lineare Modelle (Wang et al. 2011)
• fraktionale Modelle (Papke & Wooldrige 1996)
• Quasi-Poisson-Modelle
• (Zero-One-Inflated Beta-Modelle)
Als potentielle Confounder wurden einheitlich die Beschäftigungstage im ersten Kalenderjahr vor Rehabilitation, das Lebensalter in Fünfjahresschritten, das Geschlecht, die dichotomisierte Staatsangehörigkeit (deutsch/andere) sowie die binären Merkmale „Anschlussheilbehandlung“ und „Aufforderung zur Reha durch die Krankenkasse nach §51 SGB V“ einbezogen, die sich in früheren Studien als prognostisch relevant erwiesen hatten (Kaluscha et al. 2014). Zusätzlich wurde die Fachabteilung als weiterer Parameter einbezogen, um zu prüfen, ob einzelne Fachabteilungen unter Berücksichtigung der Rehabilitandenmerkmale auffällige Ergebnisse zeitigen.
Bestimmt wurde die Modellgüte in Form von Devianz und (Pseudo-)Varianzaufklärung (R2), da diese Maße für alle Modellfamilien bestimmbar waren.
Ergebnisse
Obwohl die Zero-One-Inflated Modelle von der Theorie her am besten für die U-förmige Verteilung geeignet sein müssten, zeigte sich recht schnell, dass die Modellgüte deutlich schlechter war als bei den anderen drei Modellfamilien, so dass dieser Ansatz nicht weiterverfolgt wurde.
Bei den anderen Modellfamilien ergaben sich sehr ähnliche Ergebnisse. Die adjustierte Bestimmtheitsmaß (R-Quadrat) war bei allen Modellen zwischen 0,40 und 0,41, der Prozentsatz der maximal erklärbaren Devianz zwischen 34,4% und 41,1%. Die Verteilung der Residuen war sehr ähnlich. Die Einführung einer zweiten Ebene für die Fachabteilungen brachte keine nennenswerten Vorteile, die Bestimmtheitsmaße der Mehrebenenmodelle waren bei jedem Modell auf zwei Dezimalen gleich und die erklärbare Devianz war auch nicht besser als beim Einebenenmodell.
Alle betrachteten potentiellen Confounder wurden in allen Modellen signifikant.
Diskussion und Fazit
Die Modellierung und die Interpretation der Ergebnisse bedarf insbesondere bei Einrichtungsvergleichen besonderer Sorgfalt. In dieser Studie zeigte sich, dass die Unterschiede zwischen einzelnen Modellen nicht so groß sind, wie es die Theorie eigentlich erwarten ließe. Wenngleich die Sensitivität gegenüber kleineren Effekten der Fachabteilung unterschiedlich war, so wurden doch stets dieselben Fachabteilungen als „sehr auffällig“ identifiziert.
Angesichts der schwächeren Verteilungsannahmen und der Auslegung für einen auf ein Intervall begrenzten Wertebereich empfiehlt sich in diesem Anwendungsfall die Nutzung eines fraktionalen Einebenenmodells.
Danksagung
Die Deutsche Rentenversicherungen Baden-Württemberg, Braunschweig-Hannover und Nordbayern förderten die Studie mit Forschungsmitteln, übernahmen aus Datenschutzgründen dankenswerterweise den Versand der Fragebögen und stellten anonymisierte Routinedaten zur Verfügung.
Literatur
Kaluscha R, Nübling R, Toepler E, Kaiser U, Müller G, Martin H, Renzland J, Reuss-Borst M, Kriz D, Schmidt J, Krischak G (2014): Zusammenhänge zwischen Patientenselbsteinschätzung und Sozialversicherungsbeiträgen ein Jahr nach Rehabilitation: Ergebnisse aus der "Reha-QM-Outcome-Studie" des Qualitätsverbundes Gesundheit und der Deutschen Rentenversicherung Baden-Württemberg. DRV-Schriften Band 103 (Tagungsband 23. Rehabilitations-wissenschaftliches Kolloquium), S. 191 – 194.
Wang, L., Liu, X., Liang, H., Carroll, R. J. (2011). Estimation and variable selection for generalized additive partial linear models. Ann. Statist. 39: 1827 – 1851
Papke, L.E., Wooldridge, J.M., 1996. Econometric methods for fractional response variables with an application to 401(k) plan participation rates. Journal of Applied Econometrics 11, 619–632.
Hintergrund und Zielstellung
Die Diagnose Krebs greift zumeist abrupt und nachhaltig in die Lebenswelt der Betroffenen ein. So erleiden onkologische Patienten sowohl durch die Erkrankung als auch infolge der Therapie oftmals Funktions- und Folgestörungen, die sie in ihrer weiteren Teilhabe am gesellschaftlichen Leben, insbesondere auch im Beruf, einschränken und die durch die Rehabilitation so weit wie möglich beseitigt oder gebessert werden sollten (Bartsch 2002).
Die Art und Schwere der Funktionsstörungen hängen einerseits von der Art der Erkrankung (z.B. Brustkrebs, Prostatakrebs) und andererseits von der gewählten Therapie (z.B. Operation, Bestrahlung, Chemotherapie) ab. So sind Prostatakrebspatienten bspw. häufiger nach einer Operation von Inkontinenz betroffen, als es nach einer Bestrahlung oder Hormontherapie der Fall ist. Inwieweit sich die vorliegenden Funktionsstörungen auf die Teilhabe am Berufsleben auswirken, hängt auch von der individuellen beruflichen Situation ab. So ist etwa davon auszugehen, dass Inkontinenz einem Berufskraftfahrer größere Schwierigkeiten bereitet als es bei einem Büroangestellten der Fall ist, der jederzeit eine Toilette aufsuchen kann.
Daher soll im Rahmen einer Studie die wesentlichen Funktions- und Folgestörungen von onkologischen Patienten in der Rehabilitation für die zahlenmäßig bedeutsamsten Krebserkrankungen (u.a. Mammakarzinome, Prostatakarzinome, kolorektale Karzinome) identifiziert werden. Zudem soll festgestellt werden, ob diese eher krankheits- oder aber therapiebedingt entstehen und welche Behandlungsstrategien bzw. Therapieformen in der Akutonkologie welche Funktionsstörungen begünstigen. Ferner sollen Zusammenhänge zwischen den wesentlichen Funktionseinschränkungen und der Teilhabe am Berufsleben onkologischer Rehabilitanden analysiert werden, um schließlich Empfehlungen zur Auswahl individuell geeigneter Therapieformen und zum Umgang mit Funktionseinschränkungen geben zu können.
Methoden
Grundlage dafür sind neben den Routinedaten aus der Rehabilitationsstatistikdatenbasis (RSD) der Rentenversicherung auch die Freitexte aus den Entlassungsberichten onkologischer Rehabilitationseinrichtungen, die im Rahmen des §301-Verfahrens elektronisch an die Rentenversicherung Baden-Württemberg übermittelt wurden. Denn insbesondere im Blatt 2 finden sich auch Angaben zur Vorbehandlung der Tumore im Akutbereich sowie zu Funktionsstörungen und daraus resultierenden Einschränkungen der (beruflichen) Teilhabe.
Voraussetzung für die Nutzung der Texte war ihre datenschutzgerechte Anonymisierung. Dazu entwickelten die DRV Baden-Württemberg und das IFR ein Verfahren, bei dem nicht nur personenidentifizierende Angaben wie z.B. der Patientennamen entfernt, sondern auch weitere potentiell sensitive Informationen wie z.B. Ortsnamen oder Angaben zu Arbeitgebern oder Behandlern durch Platzhalter ersetzt werden. So wird dann z.B. aus dem Originaltext „Hausarzt: Dr. Mustermann, 12345 Weinstadt“ in der bereinigten Version „Hausarzt: < Person >, < PLZ > < Ort >“.
Im nächsten Schritt wurden indikationsspezifische Funktions- und Folgestörungen anhand einer systematischen Literaturrecherche sowie basierend auf dem Wissen von Fachexperten (d.h. Onkologen der ATO AG06) identifiziert. Anschließend wurden üblicherweise verwendete Begriffe und Formulierungen gesammelt, die bezüglich dieser Funktionsstörungen in den Entlassungsberichten verwendet werden. Anhand solcher sprachlicher Muster können dann mittels computerlinguistischer Verfahren aus den Texten strukturierte Daten zu Funktionseinschränkungen gewonnen werden (Motto: „Aus Texten werden Daten“). Zu guter Letzt wird basierend auf den so gewonnenen Daten zu den Funktionsstörungen und den Routinedaten der DRV Baden-Württemberg eine Analyse der Zusammenhänge zwischen den vorliegenden Funktionseinschränkungen und der Teilhabe am Erwerbsleben erfolgen (Reuss-Borst et al. 2015).
Das Vorgehen soll an folgendem Beispiel verdeutlicht werden: ein häufiges Problem bei onkologischen Rehabilitanden ist die rasche Ermüdbarkeit (Fatigue). In den Texten finden sich dann häufig Formulierungen mit Varianten der Begriffe „Fatigue“, „Erschöpfung(ssymptomatik)“, „Ermüdbarkeit“. Diese lassen sich in einer kompakten Datenbankabfrage (Oracle Text: $fatig%=$erschöpf%=$ermüd%) abbilden, die mittels Jokerzeichen und Lemmatisierung (d.h. Rückführung auf den Wortstamm) flexibel die verschiedenen Formulierungsvarianten erkennt. Anschließend wird in einer Stichprobe geprüft, ob „Falsch Positive“ oder „Falsch Negative“ auftreten und die computerlinguistische Abfrage ggfs. nachgeschärft. Auf dieser Basis kann im Datensatz ein neues binäres Merkmal „Hinweise auf Fatigue ja/nein“ erzeugt werden, dass z.B. in Prognosemodelle für den Erwerbsstatus nach Rehabilitation einfließen kann.
Ergebnisse
Nach der datenschutzrechtlichen Freigabe des Anonymisierungsverfahrens stand der Freitext aus 19.335 Entlassungsberichten onkologischer Rehabilitationseinrichtungen zur Verfügung. Die größte Gruppe bildete mit N1=4.899 Fällen der Brustkrebs, gefolgt von Prostatakrebs (N2=3.716) und Darmkrebs (N3=1.193).
Die o.a. Abfrage zu Fatigue lieferte 10.107 Treffer unter den 19.335 Fällen. Bei der Validierung der Ergebnisse zeigten sich aber einige Falsch Positive (z.B. „Ermüdungsfraktur“ oder „Testabbruch aufgrund muskulärer Ermüdung“). Die verbesserte Abfrage schließt daher solche Begriffe im gleichen Satz aus (Oracle Text: $fatig%=$erschöpf%=$ermüd% not $muskul%=$ermüdungsfraktur% within sentence) und lieferte immer noch 9.907 Treffer (51,2%).
Weitere computerlinguistische Abfragen erfolgten hinsichtlich Polyneuropathien (PNP), die häufig als Folge der Chemotherapie entstehen, sowie hinsichtlich Inkontinenz, die nach Darmkrebs oder als Folge der Therapie bei Prostatakrebs auftreten kann. Hier ergaben sich für PNP 4.282 Treffer (22,1%) bzw. für Inkontinenz 2.802 Treffer (14,5%).
Diskussion und Fazit
Das Projekt hat zum einen gezeigt, dass durch vorgelagerte Anonymisierung eine datenschutzgerechte Analyse der Freitexte möglich wird. Zum anderen bestätigte sich, dass computerlinguistische Verfahren (Kaluscha 2005) geeignet sind, um die hier benötigten Informationen aus den Freitexten zu extrahieren. Dieser Ansatz dürfte der Rehabilitationsforschung auch in anderen Bereichen zahlreiche neue Möglichkeiten erschließen.
Danksagung
Die Deutsche Rentenversicherung Baden-Württemberg fördert die Studie und stellte dankenswerterweise die anonymisierten Entlassungsberichte zur Verfügung. Die Mitglieder der AG 06 „Rehabilitation“ der Arbeitsgemeinschaft der Tumorzentren, Onkologischen Schwerpunkte und Arbeitskreise in Baden-Württemberg (ATO) unterstützen die Studie mit ihrer klinisch-fachlichen Expertise.
Literatur
Bartsch H.H. (2002): Was kann die Rehabilitation onkologischer Patienten nach kurativer und palliativer Therapie leisten?
Onkologie 2002, 25(suppl 1), S. 54-59.
Kaluscha R. (2005): Informationsgewinnung aus Freitexten in der Rehabilitationsmedizin. Dissertation, Medizinische Fakultät, Universität Ulm.
URL: http://vts.uni-ulm.de/doc.asp?id=5265, Abruf: 18.11.2020.
Reuss-Borst M., Nübling R., Kaiser U., Kaluscha R., Krischak G., Kriz D., Müller G., Martin H., Renzland J., Schmidt J., Toepler E. (2015): Return to Work in der Onkologie aus Patientensicht nach einem Jahr. DRV-Schriften Band 107 (Tagungsband des 24. Rehabilitationswissenschaftliches Kolloquiums), S. 89-91.
Hintergrund und Zielstellung
Die adäquate Darstellung des Outcome medizinischer Rehabilitationsmaßnahmen stellt nach wie vor eine zentrale Herausforderung der evaluativen Rehabilitationsforschung dar. Zur Er-gebnismessung gibt es verschiedene Ansätze, die alle mit Vor- und Nachteilen verbunden sind. Im Regelfall geht die Vielfalt der möglichen singulären Ergebniskriterien zumeist mit vielen Messungen unterschiedlicher Zielkriterien einher. Hierbei läuft man leicht Gefahr, den Wald vor lauter Bäumen aus den Augen zu verlieren. Ein abseits des Mainstreams liegender Ansatz der Ergebnismessung stellt das von Schmidt, Wittmann und Nübling in den 1980er Jahren vorgestellte Konzept der multiplen Ergebniskriterien dar (Schmidt et al., 1987, Schmidt et al., 2003). Hierbei werden singuläre Kriterien zu einem multiplen Kriterium (MOC = multiple outcome criterion) aggregiert. Dieses soll den Outcome in seiner Gesamtheit abbilden.
Methoden
In der multizentrischen Requamo-II-Studie (41 Rehakliniken) werden drei Datenebenen und deren Zusammenhänge untersucht (Toepler et al., 2018): 1. Selbstangaben der Rehabilitanden (PRO-Daten), 2. RSD-Daten und 3. Daten aus dem QS-Programm der DRV. Im Rahmen der Ergebnismessung wurde auch geprüft, welches Gesamtbild des Reha-Outcome sich aufgrund der Selbstberichte 1 Jahr nach der Reha zeigt. Hierzu wurden bei einer Stichprobe von N = 7589 Rehabilitanden 27 singuläre Ergebniskriterien (SEKs; z. B. Erwerbstätigkeit, berufliche Leistungsfähigkeit, gesundheits-bezogene Lebensqualität, Einschränkungen der Teilhabe, Nachhaltigkeit der Rehaeffekte, Behandlungszufriedenheit) nach dem Prinzip „Messen und Bewerten“ zu einem multiplen Ergebniskriterium (MOC) aggregiert, wobei unterschiedliche MOC-Varianten miteinander verglichen werden konnten. Während bei Variante 1 (= MOC_27D) alle SEKS dichotomisiert (1 = positives Ergebnis vs. 0 = neutrales bzw. unerwünschtes Ergebnis) und aggregiert wurden, wurden dieselben SEKs bei Variante 2 (MOC_27) mit 0 – 1 – 2 – 3 differenzierter bewertet und aufsummiert. Alle SEKs wurden konservativ Missing-data korrigiert, wobei für fehlende Werte jeweils eine 0 eingesetzt wurde. Hierdurch ergaben sich bei Variante 1 theoretisch MOC-Skalenwerte zwischen 0 und 27, für Variante 2 Werte zwischen 0 und 81. Zur Datenreduktion wurde weiterhin eine gekürzte Version mit 15 SEKs gebildet (MOC_15RD; Range: 0 – 15). Überprüft wurde bei den drei MOC-Skalen Verteilungsform, interne Konsistenz, faktorielle Struktur, Validität, Vorhersagbarkeit und die Korrelation mit den Beitragszahlungen vor und nach der Reha, welche aus der Reha-Statistik-Datenbank zugeordnet werden konnten.
Ergebnisse
Die drei MOCs korrelierten im Bereich 0,92 bis 0,99 sehr hoch miteinander. In Abhängigkeit vom Verrechnungsprinzip der SEKs zeigten sich unterschiedliche Verteilungsformen, was sich insbesondere an unterschiedlichen Schiefe-Werten manifestierte (bei MOC_27 positiv, d.h. tendenziell eher rechtschiefe Verteilung, bei MOC_27D und MOC_15RD negativ, d.h. tendenziell linksschiefe Verteilung). Die interne Konsistenz der drei Skalen lag im Bereich α = 0,85 bis α = 0,88. Hauptkomponenten- und Faktorenanalysen der 27 SEKs ergaben 3 – 6 Faktoren, die maximal 58 % der Gesamtvarianz erklären konnten. Durch Elimination von Einzelrestfaktoren und von Items mit Mehrfachladungen konnte ein auf 15 SEKs reduziertes MOC gebildet werden, dem drei gut interpretierbare Faktoren bzw. Komponenten zugrunde lagen (1: berufsbezogener Faktor, 2: gesundheitsbezogener Faktor, 3: Bewertungs-Faktor). Eine konfirmatorische Faktorenanalyse zeigte einen zufriedenstellenden Model Fit (CFI = 0,945, SRMR = 0,045, RMSEA = 0,055). Regressionsanalytisch zeigte sich weiterhin, dass die überprüften MOCs am besten durch Veränderungsmerkmale (bis zu 78% erklärte Vari-anz), etwas weniger gut durch Merkmale, die den Post-Zustand betrafen (bis zu 51 %) und am wenigsten durch Merkmale des Prä-Zustands (bis zu 17 %) vorhersagbar waren. Die Korrelationen der drei MOCs mit den SV-Beitragszahlungen der Rehabilitanden im Jahr nach der Reha lagen im Bereich r = 0,33 bis r = 0,41. Hierbei korrelierten die Sub-Faktoren unter-schiedlich hoch mit diesem Außenkriterium. Während der berufsbezogene Faktor Korrelatio-nen bis zu r = 0,61 zeigte, waren die Zusammenhänge mit den beiden anderen Faktoren deutlich geringer.
Diskussion und Fazit
Die Ergebnisse zeigen, dass auf der Basis von PRO-Daten aussagekräftige multiple Ergeb-niskriterien konstruiert werden können. Zwischen unterschiedlich gebildeten MOCs zeigen sich hohe Interkorrelationen. Die Reliabilität derartiger Ergebnis-Kennwerte ist zufriedenstel-lend, die überprüften MOCs korrelieren auch mit Außenkriterien (z.B. RSD-Daten). Für ver-gleichende Analysen (z. B. Klinikvergleiche) können risikoadjustierte MOCs eine wichtige Grundlage sein.
Literatur
Schmidt, J., Steffanowski, A., Nübling, R., Lichtenberg, S., Wittmann, W.W. (2003): Ergebnisqualität stationärer psychosomatischer Rehabilitation. Vergleich unterschiedlicher Evaluationsstrategien. Regensburg: S. Roderer Verlag.
Schmidt, J.,Nübling, R., Wittmann, W.W. (1995): Praktikable Möglichkeiten der Erfassung von Ergebnisqualität im Rahmen der internen Qualitätssicherung: Erfahrungen mit multiplen Ergebniskriterien im Bereich der Psychosomatischen Rehabilitation. In: VDR (Hrsg.), DRV-Schriften, Band 5, S.71-73.
Schmidt, J. (1991): Evaluation einer psychosomatischen Klinik. Frankfurt: VAS.
Schmidt, J., Bernhard, P., Wittmann, W.W., Lamprecht, F. (1987): Die Unterscheidung zwischen singulären und multiplen Ergebniskriterien. Ein Beitrag zur Kriterienproblematik in der Rehabilitation. In: Lamprecht, F. (Hrsg.), Spezialisierung und Integration in der Psychosomatik, S.293 – 299. Berlin: Springer.
Toepler, E., Nübling, R., Kaluscha, R., Kaiser, U., Krischak, G., Schmidt, J. für den Forschungsverbund Reha-QM-Outcome-Studie (2018): Reha-QM-Outcome Studie II. Entwicklung eines Reha-Outcome-Index als Element der Belegungssteuerung und Instrument eines qualitätsorientierten Benchmarkings für die stationäre Rehabilitation. Studienprotokoll. Im Internet: http://bit.ly/36j8olu
Wittmann, W.W., Nübling, R. Schmidt, J: (2002): Evaluationsforschung und Programmevaluation im Gesund-heitswesen. Zeitschrift für Evaluation, 1, 39-60.
Hintergrund und Zielstellung
Die Beurteilung des erwerbsbezogenen Leistungsvermögens ist ein Prozess, in dem in umfassender Form medizinische, persönliche und arbeitsplatzbezogene Faktoren berücksichtigt werden müssen. Das in englischer Sprache (USA) vorliegende Befragungsinstrument WD-FAB macht es möglich, auch die subjektiv empfundene Leistungsfähigkeit von Rehabilitanden einzubeziehen. Mittels computeradaptiven Testens (CAT) unter Verwendung einer Itembank von mehr als 390 Items, bildet das WD-FAB-Instrument Dimensionen der körperlichen Funktionsfähigkeit und der psychosozialen Gesundheit ab. Ein von der Deutschen Rentenversicherung (DRV) Bund gefördertes Projekt zielt darauf ab, dieses komplexe Instrument in die deutsche Sprache zu übersetzen und zu validieren (Feng et al. 2019). Bedingt durch die hohe Itemanzahl wird ein stringenter Übersetzungsprozess notwendig, der als besondere Herausforderung die konzeptionelle Äquivalenz zum englischen Original hat. Somit bedarf es nicht nur einer guten sprachlichen Übersetzung, sondern ebenfalls einer kulturell angepassten Übertragung der Fragebogeninhalte auf die entsprechende Zielpopulation.
Methoden
Der Übersetzungsprozess der WD-FAB-Items folgt international anerkannten Empfehlungen (Arre-dondo et al. 2012, Beaton et al. 2000) und besteht aus 5 Schritten. Erstens die Vorwärtsübersetzung in die deutsche Sprache durch zwei unabhängige Übersetzer, zweitens der Entwicklung einer konsentierten Fassung auf Basis der Vorwärtsübersetzungen, drittens der Rückwärtsübersetzung der konsentierten Fassung, viertens der Entwicklung einer einheitlichen Fragebogenversion und fünftens der Felderprobung. Die an der Vor- und Rückwärtsübersetzung beteiligten Übersetzer wurden zudem dazu aufgefordert, zu dokumentieren, in welchem Maße bei der Übersetzung spezifische Probleme bzw. Herausforderungen aufgetreten sind. Hierfür erhielten die Übersetzer die Möglichkeit, die Items mit der Beurteilungskategorie A (keine Übersetzungsprobleme), B (leichte bis mäßige Übersetzungsprobleme), oder C (schwere Übersetzungsprobleme) zu bewerten. Zusätzlich zu den fünf Schritten des Übersetzungsprozesses wurden bei problematisch identifizierten Items 1) die Entwickler des Originalinstruments kontaktiert, 2) eine Diskussionsrunde mit Mitarbeitenden aus der Abteilung Methoden der Community Medicine durchgeführt (Mitarbeiter-Panel) sowie 3) eine Kategorisierung der Items in fünf Problembereiche vorgenommen. Der vorliegende Beitrag präsentiert die Ergebnisse des ersten und zweiten Übersetzungsschrittes.
Ergebnisse
Aus den beiden Vorwärtsübersetzungen konnte eine erste konsentierte Fragebogenversion erstellt werden. Die Analyse der Übersetzungsschwere ergab, dass 50% aller Items von den Vorwärtsübersetzern die Einstufung „A“, 47% die Einstufung „B“ und 3% die Einstufung „C“ erhielten. Die häufigsten Probleme in der Übersetzung zeigten sich bei rollstuhlspezifischen Fragen aus der entsprechenden Sektion des WD-FAB. Zwischen den weiteren Dimensionen des WD-FAB zeigten sich keine Unterschiede in der Häufigkeit problematischer Items (Einstufung „B“ oder „C“).
Aus den als „B“ und „C“ eingestuften Items und den damit einhergehenden Übersetzungsauffälligkeiten konnten fünf Problemkategorien aus dem komplexen Übersetzungsprozess bestimmt werden. In der ersten Kategorie „Wortverwendung/ Mehrdeutigkeiten“ wurden Items zusammengetragen, die Wörter oder Begrifflichkeiten beinhalten, die sich in ihrer Bedeutung von dem englischsprachigen Original mäßig bis stark unterscheiden bzw. im deutschsprachigen mehrere Übersetzungsmöglichkeiten bieten. Wörter oder Wortgruppen, für die sich keine deutsche übereinstimmende übersetzte Bedeutung fand, wurden in die Kategorie „Redewendungen“ eingeordnet. „Kulturspezifische Besonderheiten“ bilden eine dritte Kategorie. In dieser wurden Items eingeordnet, die unter Verdacht standen, Begriffe zu beinhalten, die nicht eindeutig von der Zielgruppe verstanden werden. Items, die inhaltlich in ihrer Logik Probleme bereiteten, wurden unter „inhaltliche Unstimmigkeiten“ kate-gorisiert. Die letzte Kategorie „alltagsferne Bewegungsabläufe“ beherbergt Items, die im Alltag ungewöhnliche physische Positionen beschreiben.
Exemplarisch sind in der Tabelle 1 auf Basis von drei Kategorien Item-Beispiele und deren Überset-zungsherausforderung sowie Findung einer konsentierten Fassung aufgelistet. So wurde z. B. die in der englischen Sprache zu findende Redewendung „small talk“ mit dem Verb „plaudern“ übersetzt. Das Item „using tickets to get on a bus“ erwies sich in der deutschen Übersetzung bzgl. der inhaltli-chen Bedeutung als problematisch und weniger plausibel. Hier konnte in Rücksprache mit den Orig-nalentwicklern des WD-FAB und im Mitarbeiter-Panel eine adäquate Lösung gefunden werden. Das letzte in der Tabelle aufgelistete Beispiel zeigt ein Item, welches nach der Fähigkeit eines untypischen Bewegungsablaufes im Alltag fragt. Um den Bewegungslauf „in Bodenhöhe arbeiten“ verständlicher zu machen, wurde das Item um die Beispielformulierung „eine Kindersicherung anbringen“ erweitert.
Diskussion und Fazit
Es zeigt sich, dass 50% der Items Probleme in der Übersetzung aufwiesen und spezifische Herausforderungen mitbrachten. Die Kategorisierung dieser Items in fünf unterschiedliche Problembereiche verdeutlichte zudem die Komplexität des hier durchgeführten Übersetzungsprozesses, unabhängig davon ob es sich um Items der körperlichen Funktionsfähigkeit oder der psychosozialen Gesundheit handelte. Somit kann zusammengefasst werden, dass die Adaption des WD-FAB in die deutsche Sprache deutlich mehr umfasst als die reine sprachliche Itemübersetzung. Die Auseinandersetzung mit der inhaltlichen Bedeutung der Items sowie der linguistischen Herausforderung, eine leicht verständliche Formulierung zu erhalten, führt zu einer tiefergehenden Reflektion der im WD-FAB abgebildeten Dimensionen und setzt einen stringenten, gut geplanten Übersetzungsprozess voraus.
Literatur
Arredondo E M, Mendelson T, Holub C, Espinoza N, Marshall S (2012): Cultural adaptation of physical activity self-report instruments. J Phys Act Health, 9(1): 37-43.
Beaton D E, Bombardier C, Guillemin F, Ferraz, M B (2000): Guidelines for the process of cross-cultural adaptation of self-report measures. Spine (Phila Pa 1976), 25(24):3186-3191.
Feng Y-S, Kazis L, Kohlmann T (2019): Adoption of the Work Disability Functional Assessment Battery (WD-FAB) to Germany and European Countries [work in progress]. 15. Congress of the European Forum for Research in Rehabilitation (EFRR). DRV-Schriften Band 117: 512-513.