Z Orthop Unfall 2019; 157(03): 254-262
DOI: 10.1055/a-0748-6081
Originalarbeit
Georg Thieme Verlag KG Stuttgart · New York

Inter-Rater Reliability of Pain Provocation Tests for Painful Lumbar Facet Joints. A Pilot Study

Interrater-Reliabilität von Provokationstests für schmerzhafte lumbale Facettengelenke. Eine Pilotstudie
Christoph Thalhamer
1   Institut für Physikalische Medizin und Orthopädische Rehabilitation, Orthopadisches Spital Speising GmbH, Wien, Austria
,
Julia Hahne
2   Orthopädisches Spital Speising, CEOPS – Centre of Excellence for Orthopaedic Pain Management, Wien, Austria
,
Omer Matthijs
3   Physiotherapie, BOMA, 8605 Kapfenberg, Austria
,
Peter Machacek
4   Rehabilitation, Reha Klinik Wien Baumgarten, Wien, Austria
› Author Affiliations
Further Information

Publication History

Publication Date:
06 November 2018 (online)

Abstract

Background With a life-time prevalence of 39%, low back pain (LBP) is one of the most common musculoskeletal disorders. Correct diagnosis of underlying causes is commonly seen as a prerequisite for successful therapy of LBP. Currently, there is no useful, non-invasive clinical test to diagnose painful lumbar zygapophyseal joints. Clinical tests with high diagnostic accuracy are therefore desirable. Inter-rater reliability is commonly seen as a prerequisite of test validity. The objective of this pilot study was thus to evaluate inter-rater reliability of new clinical pain provocation tests for diagnosing painful lumbar zygapophyseal joints. If a clinically significant level of inter-rater reliability were to be determined, this study could constitute a first step towards establishing the clinical utility of this new set of tests in the structural diagnosis of low back disorders.

Material and Methods Patients participating in this study were recruited in a specialist hospital throughout June 2015 until September 2016. Both female and male patients with current LBP, with or without buttock or lower extremity symptoms were screened for inclusion. Patients had preferably to be 50 years or older in order to be included in this study. The upper age limit was set at 90 years. They also had to be fluent in German to be able to follow verbal instructions. Exclusion criteria comprised the presence of red flags, surgical spinal fusion at any level of the lumbar spine, discectomy within the past 12 months, radiculopathy and/or radicular pain, interventional treatments for the IVD, SIJs or ZAJs within the past three months, psychiatric disorders, current litigation issues concerning back pain, and central nervous system diseases. Three certified manual therapy instructors tested patients independently. Fleissʼ kappa values and percent agreements were calculated.

Results Subjects included a sample of 48 patients (15 males and 33 females) with a mean age of 66.48 years (range 33 – 90) presenting at a specialist hospital with low back pain. The new pain provocation tests for lumbar zygapophyseal joints showed moderate reliability (Fleissʼ κ = 0.46) and an overall percent agreement of 68.8%. Separate tests for the zygapophyseal joints of L5–S1 showed fair reliability (Fleissʼ κ = 0.37) and an overall percent agreement of 64.6%. Unidimensional tests that were used in the study to exclude the intervertebral disc as a nociceptive generator showed fair reliability as well (average κ of 0.28 and 0.39, respectively). Neither drop outs nor adverse events occurred.

Conclusion The new pain provocation tests for lumbar zygapophyseal joints showed clinically significant levels of inter-rater reliability. Validation of these tests against fluoroscopy-guided medial branch blocks is warranted.

Zusammenfassung

Hintergrund Lumbaler Rückenschmerz (LRS) zählt mit einer Lebenszeitprävalenz von 39% zu den häufigsten Beschwerdebildern in der muskuloskelettalen Medizin. Eine korrekte Diagnose der zugrunde liegenden Ursache bildet die Grundlage für eine erfolgreiche Therapie des LRS. Aktuell gibt es keinen validen, nicht invasiven Test in der klinischen Diagnostik von schmerzhaften, lumbalen Zygapophysealgelenken (ZAGs). Klinische Tests mit einer hohen diagnostischen Genauigkeit sind deshalb erwünscht. Die Bestimmung der Intertester-Reliabilität dieser neuen Tests basiert auf der Annahme, dass Reliabilität eine notwendige, aber keineswegs hinreichende Voraussetzung ist für die Validität eines Tests. Das Ziel der vorliegenden Pilotstudie ist daher die Bestimmung der Intertester-Reliabilität von neuen klinischen Schmerzprovokationstests in der Diagnostik von lumbalen ZAGs. Sollte ein klinisch signifikantes Maß an Intertester-Reliabilität erreicht werden, dann könnte diese Studie einen ersten Schritt darstellen in der Entwicklung von klinisch nützlichen Tests für ZAGs in der strukturellen Diagnostik von Rückenbeschwerden.

Material und Methoden Die Patienten wurden im Zeitraum zwischen Juni 2015 und September 2016 über eine orthopädische Spezialklinik rekrutiert. Sowohl weibliche als auch männliche Patienten mit einer aktuellen lumbalen Rückenschmerzepisode, mit oder ohne Ausstrahlung in die untere Extremität, wurden für den Einschluss in die Pilotstudie gescreent. Patienten mussten vorzugsweise zwischen 50 – 90 Jahre alt sein und fähig sein, Instruktionen auf Deutsch Folge zu leisten. Ausgeschlossen wurden Patienten mit Red Flags, chirurgischer Fusion an der lumbalen Wirbelsäule, Diskektomie innerhalb der vergangenen 12 Monate, Radikulopathie und/oder radikulärem Schmerz, Infiltrationen oder interventionellen Verfahren an den lumbalen ZAG, Bandscheiben oder am Sakroiliakalgelenk in den vergangenen 3 Monaten, psychiatrische Diagnosen, Rechtsstreitigkeiten bezogen auf den zu untersuchenden LRS sowie zentralneurologische Grunderkrankungen. Alle Patienten wurden von 3 zertifizierten Manualtherapeuten unabhängig voneinander untersucht. Der Untersuchungsgang wurde vorab standardisiert. Berechnet wurden Fleiss-Kappa-Werte sowie die Übereinstimmung der Tester in Prozent.

Ergebnisse Basierend auf einer Fallzahlberechnung (Prävalenz des Merkmals = 0,3; untere Schranke des 95%igen KI von κ = 0,6) wurden 48 Patienten in die Studie eingeschlossen (33 Frauen; 15 Männer; Durchschnittsalter 66,48 Jahre). Die Tester erreichten bei den Schmerzprovokationstests für lumbale ZAGs eine moderate Übereinstimmung (Fleissʼ κ = 0,46) und eine Gesamtübereinstimmung von 68,8%. Spezielle Tests des ZAG L5–S1 erzielten eine ausreichende Übereinstimmung (Fleissʼ κ = 0,37) sowie eine Gesamtübereinstimmung von 64,6%. Die eindimensionalen Tests, die in der Studie verwendet wurden, um den lumbalen Diskus als nozizeptiven Generator ein- oder auszuschließen, zeigten ebenfalls eine ausreichende Übereinstimmung (durchschnittliches κ von 0,28 bzw. 0,39). Es gab weder Drop-outs noch unerwünschte Ereignisse.

Schlussfolgerungen Die vorliegende Arbeit zeigt, dass die neuen Schmerzprovokationstests für lumbale ZAGs ein klinisch signifikantes Maß an Intertester-Reliabilität erreichen. Die hier untersuchten Tests sollten in einem nächsten Schritt in einer größer angelegten Validierungsstudie mittels Referenztest – einer doppelten Blockade des Ramus medialis unter Röntgenkontrolle – geprüft werden.

 
  • References

  • 1 Croft P, Papageorgiou A, McNally R. Low Back Pain. In: Stevens A, Rafferty J. eds. Health Care needs Assessment, 2nd Series. Oxford: Radcliffe Medical Press; 1997: 129-182
  • 2 Hoy D, Bain C, Williams G. et al. A systematic review of the global prevalence of low back pain. Arthritis Rheum 2012; 64: 2028-2037
  • 3 Nachemson A. Epidemiology and the Economics of low back Pain. In: Herkowitz HN, Dvořák J, Bell GR, Nordin M, Grob D. eds. The lumbar Spine. 3rd ed.. Philadelphia: Lippincott Williams & Wilkins; 2004: 3-10
  • 4 Dagenais S, Caro J, Haldeman S. A systematic review of low back pain cost of illness studies in the United States and internationally. Spine J 2008; 8: 8-20
  • 5 Borkan JM, Koes B, Reis S. et al. A report from the Second International Forum for Primary Care Research on Low Back Pain. Reexamining priorities. Spine (Phila Pa 1976) 1998; 23: 1992-1996
  • 6 Foster NE, Hill JC, Hay EM. Subgrouping patients with low back pain in primary care: are we getting any better at it?. Man Ther 2011; 16: 3-8
  • 7 Hancock M, Herbert RD, Maher CG. A guide to interpretation of studies investigating subgroups of responders to physical therapy interventions. Phys Ther 2009; 89: 698-704
  • 8 Henschke N, Maher CG, Refshauge KM. et al. Low back pain research priorities: a survey of primary care practitioners. BMC Fam Prac 2007; 8: 40
  • 9 Fairbank J, Gwilym SE, France JC. et al. The role of classification of chronic low back pain. Spine (Phila Pa 1976) 2011; 36 (Suppl. 21) S19-S42
  • 10 DePalma MJ, Ketchum JM, Saullo T. What is the source of chronic low back pain and does age play a role?. Pain Med 2011; 12: 224-233
  • 11 Schwarzer AC, Aprill CN, Derby R. et al. The relative contributions of the disc and zygapophyseal joint in chronic low back pain. Spine (Phila Pa 1976) 1994; 19: 801-806
  • 12 Schwarzer AC, Aprill CN, Derby R. et al. The prevalence and clinical features of internal disc disruption in patients with chronic low back pain. Spine (Phila Pa 1976) 1995; 20: 1878-1883
  • 13 Manchikanti L, Pampati V, Fellows B. et al. Prevalence of lumbar facet joint pain in chronic low back pain. Pain Physician 1999; 2: 59-64
  • 14 Schwarzer AC, Aprill CN, Derby R. et al. Clinical features of patients with pain stemming from the lumbar zygapophysial joints. Is the lumbar facet syndrome a clinical entity?. Spine (Phila Pa 1976) 1994; 19: 1132-1137
  • 15 Schwarzer AC, Aprill CN, Derby R. et al. The false-positive rate of uncontrolled diagnostic blocks of the lumbar zygapophysial joints. Pain 1994; 58: 195-200
  • 16 Schwarzer AC, Aprill CN, Bogduk N. The sacroiliac joint in chronic low back pain. Spine (Phila Pa 1976) 1995; 20: 31-37
  • 17 Bogduk N. Evidence-informed management of chronic low back pain with facet injections and radiofrequency neurotomy. Spine J 2008; 8: 56-64
  • 18 Donelson R, Aprill C, Medcalf R. et al. A prospective study of centralization of lumbar referred pain. A predictor of symptomatic discs and anular competence. Spine (Phila Pa 1976) 1997; 22: 1115-1122
  • 19 May S, Aina A. Centralization and directional preference: a systematic review. Man Ther 2012; 17: 497-506
  • 20 Laslett M, Young SB, Aprill CN. et al. Diagnosing painful sacroiliac joints: A validity study of a McKenzie evaluation and sacroiliac joint provocation tests. Aust J Physiother 2003; 49: 89-97
  • 21 Laslett M, Oberg B, Aprill CN. et al. Centralization as a predictor of provocation discography results in chronic low back pain, and the influence of disability and distress on diagnostic power. Spine J 2005; 5: 370-380
  • 22 Laslett M, Aprill CN, McDonald B. et al. Diagnosis of sacroiliac joint pain: validity of individual provocation tests and composites of tests. Man Ther 2005; 10: 207-218
  • 23 Pauza K. Provocation and analgesic Discography Evaluation of lumbosacral Internal Disc Disruption. In: DePalma MJ. ed. iSpine. Evidence-based interventional Spine Care. New York: demos medical; 2011: 45-55
  • 24 Bogduk N, Aprill C, Derby R. Lumbar discogenic pain: state-of-the-art review. Pain Med 2013; 14: 813-836
  • 25 Hancock MJ, Maher CG, Latimer J. et al. Systematic review of tests to identify the disc, SIJ or facet joint as the source of low back pain. Eur Spine J 2007; 16: 1539-1550
  • 26 Donner A, Rotondi MA. Sample size requirements for interval estimation of the kappa statistic for interobserver agreement studies with a binary outcome and multiple raters. Int J Biostat 2010; 6: Article31
  • 27 Sizer Jr PS, Phelps V, Matthijs O. Pain generators of the lumbar spine. Pain Pract 2001; 1: 255-273
  • 28 Adams MA, Bogduk N, Burton K, Dolan P. The Biomechanics of back Pain. 3rd ed.. London: Churchill Livingstone; 2013
  • 29 Bogduk N. Clinical and radiological Anatomy of the lumbar Spine. 5th ed. London: Churchill Livingstone; 2012
  • 30 Jackson RP. The facet syndrome. Myth or reality?. Clin Orthop Relat Res 1992; 279: 110-121
  • 31 Laslett M, McDonald B, Aprill CN. et al. Clinical predictors of screening lumbar zygapophyseal joint blocks: development of clinical prediction rules. Spine J 2006; 6: 370-379
  • 32 Revel M, Poiraudeau S, Auleley GR. et al. Capacity of the clinical picture to characterize low back pain relieved by facet joint anesthesia. Proposed criteria to identify patients with painful facet joints. Spine (Phila Pa 1976) 1998; 23: 1972-1976
  • 33 Pearcy M, Portek I, Shepherd J. Three-dimensional x-ray analysis of normal movement in the lumbar spine. Spine (Phila Pa 1976) 1984; 9: 294-297
  • 34 Pearcy MJ, Tibrewal SB. Axial rotation and lateral bending in the normal lumbar spine measured by three-dimensional radiography. Spine (Phila Pa 1976) 1984; 9: 582-587
  • 35 Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics 1977; 33: 159-174
  • 36 Portney LG, Watkins MP. Foundations of clinical Research: Applications to practice. 2nd ed.. Upper Saddle River, NJ: Prentice Hall;; 2000: 65 568–575
  • 37 Hallgren K. Computing inter-rater reliability for observational data: An overview. Tutor Quant Methods Psychol 2012; 8: 23-34
  • 38 Sim J, Wright CC. The kappa statistic in reliability studies: Use, interpretation, and sample size requirements. Phys Ther 2005; 85: 257-268
  • 39 Petersen T, Laslett M, Juhl C. Clinical classification in low back pain: best-evidence diagnostic rules based on systematic reviews. BMC Musculoskelet Disord 2017; 18: 188 doi:10.1186/s12891-017-1549-6