Das Arznei-Telegramm - zu den Herausgebern gehört auch der Direktor des Institutes
für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) - hat in Ausgabe 5/2005
das Thema des Sommers 2004 „Suizidalität unter selektiven Serotonin-Wiederaufnahmehemmern
(SSRI)” wiederentdeckt und - unter Berufung auf die Meta-Analyse von Kirsch et al.
[22] - angereichert mit der subtilen Suggestion, Antidepressiva grenzten sich in der
Wirksamkeit nicht in klinisch relevantem Maße von Plazebo ab. Daraus ergab sich der
eingängige Titel: „Antidepressiva: Lebensgefährliche Plazebos?”. Fragt sich, ob bereits
im Vorfeld der am 18.01.2005 vom Gemeinsamen Bundesausschuss beim IQWiG in Auftrag
gegebenen Analyse zur vergleichenden Wirksamkeit der Antidepressiva auf Ebene „patientenrelevanter
Endpunkte” das Terrain vorbereitet werden soll. Jedenfalls kann diese Suggestivbotschaft
den überwiegend hausärztlichen Verordner nur verunsichern, erst recht angesichts des
ökonomischen Drucks, unter dem er insbesondere bei der Verordnung von Arzneimitteln
steht. Will also das Arznei-Telegramm suggerieren, das Geld sei in antidepressive
Therapie schlecht investiert?
Wirksamkeit der Antidepressiva
Der Meta-Analyse von Kirsch et al. [22], die der Food and Drug Administration (FDA) eingereichte Zulassungsstudien einbezog,
gingen ähnliche Analysen u.a. derselben Autoren [23] voraus. Letztere wurde vermutlich mit gutem Grund im Internet-Journal der American
Psychological Association „Prevention & Treatment” publiziert, denn die Botschaft
sollte auch sein, Psychotherapie sei effizienter. Die Analyse gab Anlass zu lebhafter
Debatte im englischen Sprachraum - und wurde nun nach Jahren endlich auch vom Arznei-Telegramm
entdeckt, allerdings ohne die Kritik an diesen Meta-Analysen zu würdigen. Einige dieser
Kritikpunkte sollen hier in Erinnerung gerufen und ergänzt werden.
Klein [24] und andere hatten die erste Meta-Analyse [23] in vielfältiger Hinsicht kritisiert, u.a. bezüglich der Studienselektion. Diese
Kritik hat wahrscheinlich die neue Meta-Analyse [22], nun basierend auf allen - publizierten und unpublizierten - Zulassungsstudien induziert.
Damit bleiben aber die grundsätzlichen Bedenken, die Klein [24] an der meta-analytischen Methodik geäußert hatte, unberührt. Diese lassen sich dahingehend
zusammenfassen, dass eine Meta-Analyse nicht zwingend die „Wahrheit” ans Licht bringen
kann - auch wenn dies die Hierarchiesysteme der evidenzbasierten Medizin auf den ersten
Blick glauben machen könnten. Meta-Analysen können für sich alleine keine zwingende
Evidenz beanspruchen [25]. So liegt z.B. ein entscheidender Mangel der meta-analytischen Technik darin, dass
die spezifischen methodischen Qualitäten bzw. Mängel der einzelnen, einbezogenen Studien
im Ergebnis unberücksichtigt bleiben. Daher sind jedenfalls Sensitivitätsanalysen
notwendig. Eine solche Sensitivitätsanalyse fehlt bei Kirsch et al. [22].
Die Meta-Analyse von Kirsch et al. [22] berücksichtigte nicht etwa - wie die Interpretation durch das Arznei-Telegramm suggerieren
will - alle Antidepressiva, sondern letztlich nur Fluoxetin, Venlafaxin und Nefadozon
(letzteres wegen Sicherheitsproblemen vom Markt genommen). Dabei wurden die Daten
gescheiterter Studien mit denen positiver Studien zusammengefasst. Das mag auf den
ersten Blick plausibel sein. Auf den zweiten Blick aber fragt sich, ob es legitim
ist, Daten von Studien, in denen in erheblichem Maße die diagnostischen Kriterien
nicht erfüllt waren, unbesehen einzubeziehen. Man kann im Gegenteil argumentieren,
zur Beurteilung der Wirksamkeit dürften nur Studien mit drei- (oder mehr-) armigem
Design (also Plazebo, Verum und aktive Referenz) herangezogen werden, denn nur so
steht ein echter Ankerpunkt zur Verfügung [10].
Die Geschwindigkeit und das Ausmaß der Wirkung von Antidepressiva über die verschiedenen
Substanzen hinweg und unabhängig vom Typ der Depression der eingeschlossenen Kranken
sind weitgehend stabil, der Plazeboeffekt aber variiert erheblich [4]
[21]. Der Plazeboeffekt bestimmt also die Effektstärke des Antidepressivums. So liegt
der Plazeboeffekt bei schwerkranken, hospitalisationsbedürftigen Patienten nur bei
rund 20 %, bei leichter Kranken aber bei bis zu ca. 50 %, der Effekt des Antidepressivums
aber unverändert bei 60-70 %. Je chronifizierter die Depression ist, desto geringer
wird der Plazeboeffekt, nicht aber der Effekt des Antidepressivums [4]. Non-Suppressoren von Kortisol im Dexamethason Suppressionstest (DST) haben einen
Plazeboeffekt von nur ca. 10 %, Suppressoren aber einen überdurchschnittlichen. Wären
Antidepressiva - wie vom Arznei-Telegramm unter Berufung auf Kirsch et al. [22] suggeriert - tatsächlich kaum wirksam, dann müsste der Plazeboeffekt und damit die
Effektstärke u.a. unabhängig vom Schweregrad gleich bleiben. Das trifft offensichtlich
nicht zu.
Typische Nebenwirkungen erleichtern die Entblindung doppelblinder Studien. Es ist
gut etabliert, dass diese Entblindung die Überlegenheit des Antidepressivums gegenüber
Plazebo scheinbar vergrößert [15]. Wären aber Antidepressiva weitgehend unwirksam - also Plazebos - so müssten Antidepressiva
mit besonders typischen Nebenwirkungen, also z.B. mit sedierenden und/oder anticholinergen
Nebenwirkungen, scheinbar besonders „wirksam” sein. Das trifft aber nicht zu [1]. Allenfalls bei hospitalisationsbedürftigen Schwerkranken sind trizyklische Antidepressiva
(Amitriptylin) wirksamer als andere Antidepressiva [1].
Das Arznei-Telegramm hebt wie Kirsch et al. [22] auf den mit durchschnittlich zwei Punkten tatsächlich nur geringen Plazebo-Verum-Unterschied
auf der Hamilton-Depression-Scale (HAM-D) ab. Den einzelnen Patienten wie auch den
Arzt oder die Kostenträger kann aber nicht interessieren, wie ein Patient sich durchschnittlich
bessert, sondern wie die Chancen eines Therapieerfolges (Response (> 50 % Besserung)
oder besser noch einer Remission (HAM-D < 8) sind. Zweifellos ergeben sich hier alle
der Festlegung von Cut-offs inhärenten Probleme. Immerhin aber ergibt sich für die
Responderrate unter trizyklischen Antidepressiva ein durchschnittlicher Plazebo-Verum-Unterschied
von 15 % (31 % versus 46 %), unter Plazebo erheblich variierend zwischen 6 % und 52
%, unter Verum aber nur zwischen 40 % und 69 % [33]. Daraus ergibt sich eine „number needed to treat” (NNT) von sieben, d.h. sieben
Patienten müssen behandelt werden, um bei einem Patienten eine dem Antidepressivum
ursächlich zuzuschreibende Response zu erzielen.
Walsh et al. [38] fanden - unabhängig vom Typ des Antidepressivums - eine mittlere Responserate von
50,1 % gegenüber 29,7 % unter Plazebo, also eine um ca. 20 % überlegene Wirksamkeit
(NNT = 5). Diese NNT von fünf bis sieben kann sich im Vergleich zu anderen Indikationsgebieten
sehr gut sehen lassen. Antidepressiva stehen also in der Wirksamkeit vielen anderen,
unangefochtenen Arzneimitteln in nichts nach. Die Responseraten korrelieren [38] insbesondere in den Plazebogruppen mit dem Publikationsjahr der Studie, d.h. die
Plazeboresponse hat in den letzten Dekaden (7 % pro Dekade) zugenommen. Das bedeutet
u.a., dass vermehrt leichter Kranke in die Studien aufgenommen wurden. Das kann die
Validität der den Studien zugrunde gelegten diagnostischen Klassifikationssysteme
in Frage stellen.
Klinisch noch relevanter als die Responderrate ist die Remissionsrate, d.h. der Anteil
Kranker, die gesund (HAM-D < 8) werden. Dieser Parameter wurde in der Vergangenheit
leider nur in der Minderzahl der Studien angegeben. Deshalb können hier nur die Ergebnisse
beispielhafter Meta-Analysen genannt werden. Bei Venlafaxin retard liegt die NNT im
Vergleich zu Plazebo bei 4 bis 5 ([6]
[32]
[34], Übersicht bei 12). Thase [35] wies zurecht darauf hin, dass ein Plazebo-Verum-Unterschied selbst von nur 10 %,
also eine NNT von 10, aus Sicht des Gesundheitswesens angesichts der hohen Prävalenz
der Depression sehr wohl klinisch relevant ist, „viel größer als der Effekt einer
Gewichtsreduktion oder der Cholesterinsenkung auf das Myokardinfarktrisiko oder des
Einstellens des Rauchens auf das Lungenkrebsrisiko”. Die Relevanz für das Gesundheitswesen
wird noch deutlicher, wenn man die hohe Prävalenz weiterer Krankheiten, bei denen
Antidepressiva wirksam sind, also Panikkrankheit, Zwangskrankheit, chronische Schmerzen
und viele andere mehr, einbezieht. Diese weiteren Indikationen wurden von Kirsch et
al. [22] nicht berücksichtigt und vom Arznei-Telegramm ignoriert.
Kirsch et al. [22] berücksichtigten nur Kurzzeitstudien (bis zu 8 Wochen). Thase [35] wies in seiner Erwiderung u.a. darauf hin, dass die Plazebo-Verum-Unterschiede in
plazebokontrollierten Absetzstudien typischerweise dem Doppelten des Plazeboeffektes
entsprechen. In der Tat fanden Geddes et al. [14] in ihrer Meta-Analyse von 31 randomisierten, doppelblinden plazebokontrollierten
Studien eine hoch-signifikante (p < 0,00001) Wirksamkeit der Erhaltungstherapie mit
Relapseraten von 41 % unter Plazebo versus 18 % unter Verum. Dieser Befund ist kaum
mit der behaupteten Unwirksamkeit von Antidepressiva vereinbar.
Das Arznei-Telegramm führt als weiteren Beleg für die fragwürdige Wirksamkeit von
Antidepressiva die Arbeiten von Moncrieff et al. [28]
[29] an, wonach sie nicht in klinisch relevantem Maße einem aktiven Plazebo überlegen
seien. Diesem Argument liegen nur neun Studien (trizyklische Antidepressiva versus
Atropin) mit insgesamt nur 751 Patienten zugrunde, von denen nur zwei eine Überlegenheit
des Antidepressivums zeigten. Dieses Argument postuliert, Atropin wäre tatsächlich
nicht antidepressiv wirksam. Dafür fehlt der Beleg. Im Gegenteil gibt es eine Reihe
experimenteller Hinweise für antidepressive Wirkungen von Anticholinergika (wie Atropin)
und umgekehrt antimanische Wirkungen von Cholinomimetika [8]
[9]. Andererseits weisen Quitkin et al. [31] zurecht darauf hin, dass sich die Responderraten zwischen Plazebo und „aktivem Plazebo”
nicht unterscheiden; das ist nicht vereinbar mit dem vom Arznei-Telegramm übernommenen
Argument, Antidepressiva wären „aktive Plazebos”. Schließlich waren die Studien, die
trizyklische Antidepressiva gegen Atropin als „aktives Plazebo” prüften, methodisch
ungeeignet: ein Plazebo-Arm fehlte, die Fallzahl (Power) war zu gering und unzureichend
geplant, die Dosis des Antidepressivums war inadäquat, die Behandlungsdauer (nur 3-4
Wochen) war inadäquat, die Diagnosen waren heterogen [31].
Das Arznei-Telegramm reklamiert das Fehlen von Dosis-Wirkungs-Beziehungen. Tatsächlich
fanden die wenigsten Antidepressiva-Studien solche Beziehungen. Diese Kritik aber
ignoriert die sog. Wirklatenz, dass sich also die antidepressive Wirkung nur allmählich
im Verlauf von Tagen bis Wochen entwickelt. Diese Latenz bedeutet, dass nicht das
Antidepressivum selbst für die antidepressive Wirkung verantwortlich ist, sondern
dass das Antidepressivum adaptative Prozesse anstößt und erst die neue Homöostase
(die bisher unzureichend identifiziert ist) die Stimmungsaufhellung bedingt [11]. Deshalb kann ein linearer Zusammenhang zwischen Dosis und Wirkung nicht erwartet
werden. Um diese Adaptationen zu triggern, bedarf es einer Mindestkonzentration an
den Rezeptoren, also einer Mindestkonzentration im Serum. Tatsächlich wurde zumindest
für einige unselektive, insbesondere trizyklische Antidepressiva der Zusammenhang
zwischen einer Mindestkonzentration im Serum und Therapieresponse bewiesen (Übersicht
z.B. [30]). Wegen der erheblichen interindividuellen Variabilität der Bioverfügbarkeit kann
die Identifikation einer minimal wirksamen Dosis nicht gelingen. Das Argument fehlender
Dosis-Wirkungs-Beziehung geht also ins Leere.
Anderson & Haddad [2] wiesen darauf hin, dass die Zulassungsstudien wegen ihrer experimentellen Bedingungen
(u.a. strikte Ein- und Ausschlusskriterien) die wirkliche Effektstärke nicht abbilden,
keine Aussage über die Wirksamkeit im Behandlungsalltag (effectiveness statt efficacy)
erlauben. Die „wahre” Wirksamkeit unter Alltagsbedingungen sei schlicht unbekannt.
Hier bestehe erheblicher Forschungsbedarf. Die echte Effektstärke von Antidepressiva
ist also im schlimmsten Fall nicht bekannt, jedenfalls aber klinisch relevant.
Suizidalität unter Antidepressiva
Wie steht es nun um die vom Arznei-Telegramm suggerierte Lebensgefährlichkeit der
Antidepressiva? Das Arznei-Telegramm tut die inzwischen umfangreichen epidemiologischen
Daten, wonach es mit zunehmender Verordnung von Antidepressiva und hier insbesondere
SSRI zu einem Rückgang der Suizidraten gekommen ist (Übersicht bei [13]), als nicht aussagefähig ab. Es trifft selbstverständlich zu, dass diese Daten wegen
vielfältiger anderer Einflussfaktoren keine suizidpräventiven Wirkungen der Antidepressiva
beweisen. Sie sind aber nicht irrelevant, denn sie zeigen zumindest, dass es mit zunehmender
Verordnung von SSRI nicht zu einer Zunahme an Suiziden gekommen ist.
Die Zunahme suizidaler Gedanken und suizidaler Handlungen - nicht etwa Suiziden [37] - bei Kindern und Jugendlichen in plazebokontrollierten Studien zu Paroxetin, die
dessen Wirksamkeit nicht bestätigten, löste im Jahr 2004 eine lebhafte Debatte aus.
Diese mündete in internationale Warnhinweise bezüglich der Verordnung von SSRI sowie
selektiven Serotonin-Noradrenalin-Wiederaufnahmehemmern an Kinder und Jugendliche,
die in Deutschland ohnehin für die Indikation Depression nicht zugelassen sind. In
dieser Altersgruppe ist der Plazeboeffekt besonders ausgeprägt, weshalb ein konsistenter
Wirksamkeitsnachweis bisher scheiterte [20]. Diese Debatte hat die Diskussion, die es schon einmal vor 15 Jahren gab, auch für
Erwachsene reaktiviert. Das Arznei-Telegramm suggeriert nun, eine unzureichende Datenlage
belege ein auch bei Erwachsenen erhöhtes Risiko suizidaler/autoaggressiver Phänomene
unter SSRI, und beruft sich dabei auf die Studien von Fergusson et al. [7], Gunnel et al. [16] und Martinez et al. (26). Tatsächlich können SSRI zumindest Akathisie-ähnliche Unruhe
provozieren oder verstärken [18], was im Einzelfall suizidale Phänomene verstärken könnte.
Fergusson et al. (2005) führten einen systematischen Review doppelblinder, randomisierter
Studien (n = 345, 87650 Patienten) durch und fanden unter SSRI (0,0026 %) ein gegenüber
Plazebo (0,0011 %) signifikant verdoppeltes Risiko von Suizidversuchen, allerdings
keinen Unterschied zwischen SSRI und trizyklischen Antidepressiva und keine Unterschiede
für Suizide (0,0004 %). Die Autoren diskutieren methodische Probleme, insbesondere
fehlende Angaben über suizidale Handlungen, weshalb sie nicht ausschließen, dass der
wahre Effekt höher sein könnte als beobachtet; das Gegenteil könnte aber auch zutreffen.
Gunnel et al. [16] analysierten alle der britischen „Medicines and Healthcare products Regulatory Agency
(MHRA)” vorliegenden, plazebokontrollierten Studien (n = 477, 40826 Patienten). Sie
fanden keine Evidenz für ein erhöhtes Suizidrisiko unter SSRI, allerdings schwache
Evidenz für ein erhöhtes Risiko von Selbstschädigungen.
Martinez et al. [26] analysierten Erstverordnungen von SSRI und trizyklischen Antidepressiva (n = 146095)
anhand der britischen „General Practice Research Database”, also Daten aus der Routineanwendung,
und fanden für Suizidversuche und Suizide keine Unterschiede zwischen beiden Typen
von Antidepressiva, allerdings ein erhöhtes Risiko für selbstschädigende Handlungen
bei unter 18-Jährigen. Die Autoren schließen die Möglichkeit nicht aus, dass letzterer
Befund aus einer präferentiellen Verordnung der weniger toxischen SSRI an suizidgefährdete
Patienten resultierte; das muss aber nicht zutreffen.
Cipriani et al. [5] ziehen in ihrem Editorial aus diesen drei Untersuchungen Schlussfolgerungen, die
in krassem Gegensatz zu denen des Arznei-Telegramms stehen: „Die aktuell verfügbare
Evidenz, die keinen klaren Zusammenhang zwischen SSRI und Suizid zeigt, und die robuste
Evidenz für die Wirksamkeit von Antidepressiva bei mäßiger bis schwerer unipolarer
Depression sollte die Ärzte ermutigen, diese Arzneimittel in wirksamer Dosis zu verordnen.
Dabei sollten die Ärzte sich bewusst sein, dass SSRI ähnlich wie Trizyklika suizidale
Gedanken oder Suizidversuche in der Frühphase der Behandlung induzieren oder verschlimmern
können, möglicherweise weil sie zu diesem Zeitpunkt Agitiertheit und Aktivierung hervorrufen
können”. Bei Kindern und Jugendlichen sei die Nutzen-Risiko-Bilanz aber negativ, da
es hier wenig Evidenz für Wirksamkeit gebe.
Die vom Arznei-Telegramm erhobene Forderung nach Langzeitstudien, um das Risiko durch
Antidepressiva induzierter suizidaler Phänomene weiter zu klären, wirkt plausibel.
Bei näherem Hinsehen aber erweist sie sich als widersinnig und illusorisch. Während
Suizidgedanken alltäglich sind, in einer finnischen Erhebung [19] gaben 15 % an, im letzten Jahr solche Gedanken erlebt zu haben, sind suizidale Handlungen
selten und Suizide extrem seltene Ereignisse. Das darf nicht darüber hinwegtäuschen,
dass ca. 60 % der Suizide einer Depression zuzuschreiben sind und die suizidpräventiven
Anstrengungen verstärkt werden müssen. Suizidale Phänomene gehören zum Wesen der Depression.
Die möglicherweise durch SSRI induzierten suizidalen Phänomene ereignen sich aber
wenn überhaupt nicht erst im Langzeitverlauf der Therapie, sondern zu Beginn. Also
machen Langzeitstudien keinen Sinn. Dies erst recht deshalb nicht, weil die vorliegenden,
plazebokontrollierten Studien zur Frage der Wirksamkeit von SSRI in der Erhaltungstherapie
und Rezidivprophylaxe keine Hinweise auf ein erhöhtes Risiko suizidaler Phänomene
ergeben haben [14]. Also müsste es sich um Akutstudien handeln, die zwangsläufig, um eine ursächliche
Verantwortung der SSRI nachzuweisen, plazebokontrolliert sein müssten. Nachdem die
vorliegenden Daten zeigen, dass, falls SSRI überhaupt suizidale Phänomene induzieren,
dieser Effekt sehr klein ist, bedürfte es riesiger Fallzahlen, um signifikante Auswirkungen
der Therapie auf diese Phänomene zu erfassen. Das würde also bedeuten, dass sehr viele
Patienten - und darunter zumindest auch suizidgefährdete - Plazebo exponiert werden
müssten, um ein ggf. minimales Risiko aufzudecken. Das wäre ethisch kaum vertretbar.
Die Forderung des Arznei-Telegramms ist also illusorisch. Richtig durchdacht erweist
sie sich als verantwortungslos. Aber sie ist geschickt suggestiv formuliert.
Suizidale Phänomene, insbesondere Suizidversuche und Suizide, sind zweifellos patientenrelevante
Endpunkte, für die der Gemeinsame Bundesausschuss und das Institut für Qualität und
Wirtschaftlichkeit im Gesundheitswesen (IQWiG) Wirksamkeitsnachweise fordern könnten.
Bisher ist für kein Antidepressivum bezüglich solcher Endpunkte Wirksamkeit positiv
belegt worden. Wie das Arznei-Telegramm weitgehend korrekt wiedergibt, sind bisher
nur für Lithium suizidpräventive Wirkungen belegt worden [3]
[36]; aber auch hier ist die Diskussion nicht abgeschlossen [17]. Lithium aber ist nicht als Antidepressivum zugelassen, sondern als Rezidivprophylaktikum
in der Langzeittherapie. Von Antidepressiva könnte man allenfalls in der Langzeittherapie
einen Wirksamkeitsnachweis auch bezüglich der Suizidprävention verlangen. Bisher darf
aber ohnehin nur ein einziges Antidepressivum (Venlafaxin) die Wirksamkeit als Rezidivprophylaktikum
beanspruchen.
Die Möglichkeit der Induktion suizidaler Phänomene durch SSRI kann nicht Gegenstand
von Wirksamkeitsstudien sein, sondern ist Thema der Pharmakovigilanz. Selbstverständlich
bedürfen die SSRI diesbezüglich besonderer Aufmerksamkeit. Die entscheidende therapeutische
Maßnahme, diesem möglichen Risiko gerecht zu werden und zu begegnen, ist die engmaschige
und gezielte Begleitung des Patienten insbesondere in der Frühphase der antidepressiven
Therapie. Im Einzelfall kann ein Antidepressivum suizidale Phänomene induzieren oder
verstärken [27]. Auch wenn unklar ist, ob bestimmte Typen von Antidepressiva geringere Risiken bergen,
so hat die deutsche Psychiatrie doch die langjährige Tradition, sedierende Antidepressiva
zu bevorzugen oder ein tranquilisierendes Psychopharmakon adjuvant zu verordnen.
Sind also „Antidepressiva lebensgefährliche Plazebos”? Nein. Wie die Leser des Arznei-Telegramms
dessen suggestives Handeln bewerten, muss ihnen überlassen bleiben.