『Lever Sign Test』最新システマティックレビュー・メタ解析と、独自のメタ解析風まとめUpdate。

Lelli Test、改め『Lever Sign Test』は結局のところ使えるの?最新エビデンスまとめその5。(2018-01-22)
Lelli Test、改め『Lever Sign Test』診断力のシステマティックレビュー・メタ分析風まとめ。(2018-01-23)

b0112009_10530397.png
Lever Signの最新システマティックレビュー・メタ解析1出てました!去年の10月発表になっていたようです、見逃してたぜー、わーわー。
これ、約一年前に私が勝手にメタ解析してみてまとめたトピックで(2018年1月23日、Lelli Test、改め『Lever Sign Test』診断力のシステマティックレビュー・メタ分析風まとめ。)、一年前の時点ではLever Signに関わる全ての論文、全7件を読んでいたんじゃないかという自負があったのですが、こういうメタ解析論文が出ると「答え合わせ」ができるので助かります。このシステマティックレビュー・メタ解析論文では8つの論文が分析されていたので、ひとつ読み逃しがあったことが判明しました。それがこちら2
b0112009_11524845.png
オランダの研究チームが2018年3月に発表したんですね。これも前回のまとめ段階(2018年1月)で未発表だったのか、そりゃ読んでないはずだわ。せっかくだからこっちからまとめてみようと思います。
この研究では1) 医師とPTでテストを行った場合のinter-rater reliabilityの検証と、2) Arthroscopy(関節内視鏡、診断ゴールドスタンダート)と比較した場合のLever Signの診断力と、3) 通常ACL断裂診断の際に使われるテストにLever Signを加えた場合の付加価値はどれほどあるのか、の3点を検証しています。ちなみにArthroscopyが「陽性(= ACL断裂あり)」と判断される基準としてはその線維の50%以上が損傷しているかどうかだったそうです。

被験者となったのは膝に怪我を受傷して整形外科・外傷外科を受診した16歳以上の患者94人(男57人、女37人、平均34±15歳)。膝のロッキング症状やACL損傷(部分・完全断裂のどちらでも)の既往歴がある患者は除外されたようなので、解釈の際には注意する必要があるかも。受傷から3週間未満の急性期の患者が26人、亜急性期(3-11週目)が31人、慢性期が37人。最終的にACL断裂ありと診断されたのは48/94(51.1%、言い換えると有病率は51.5%とも表現できます)で、部分断裂はそのうちの22.9%(11/48)、完全断裂は77.1%(37/48)。

それぞれの患者は医師によってLever Sign→Anterior Drawer Test→Lachman Test→Pivot-Shift Testの順にテストされ、可能な患者のみ一週間以内にPTによって再評価された、と(当然医師の診断を知らない、blindedの状態で)。可能な場合は、というのが緩いですし(全員やるべきでしたよね)、一週間以内に、という時差も気になります。特に急性期であれば一週間立てば腫れが引き、痛みもマシになってリラックスしやすくなってテストの正確性が変わる可能性も十分に考えられるし、あまりに「アソビ期間」としては長かったのでは。ここらへん、もう少しコントロールされていれば臨床的有意性が上がったかもしれませんね。
b0112009_15410141.png
結果です。まずはInter-rater Reliabilityから(↑)。これ、かなりびっくりです。まさかの(一般的に一番難しいと言われる)Pivot-Shift Testが最も信頼性が高く、Kappa valueが0.84(ほぼ完璧)。次いでLever Signが0.82(ほぼ完璧)、Anterior Drawerが0.80(非常に優秀)、Lachmanが0.77(非常に優秀)。全てのテストに高い信頼性が出たことは確かにそうなんですが、意外なテストが一位になったもんだなぁと…。今回のテーマであるLever Signも相当優秀ですけど円、十分すぎる信頼性があると言えるかと思います(くどいですが、全員がテストされたわけではないこと…たった94名中35-36人と、医師の評価からPTの評価まで日にちが空きすぎている恐れがあることから、単純に解釈はできないですけど)。

次が各テストの診断力です。明記されてはいませんが、医師が行ったバージョンのみを記録していると推測されます。少し問題なのが、それぞれのテストが94人全ての患者に施されたわけではないということ。本文の描写によると、患者のmuscle guardingがあり、実施できなかったケースもそれぞれのテストで1~13人いたそうなんです。具体的には、Anterior Drawer Testは91/94人(96.8%)、Lachman Testは93/94人(98.9%)、Pivot-Shift Testは81/94人(86.2%)でLever Signは87/94人(92.6%)にしか実施しなかった/できなかったと。これも考慮に入れて結果を解釈したいですよね(どんなに診断力があっても多くの患者に使えないテストじゃ仕方がありませんから)。
b0112009_16154570.png
論文のTable 4を元に4x4診断テーブルを作り直し、そこから全てのテストの感度、特異度、陽性・陰性尤度比とその95%CIを導き出しなおしてみました(本文には感度・特異度しか含まれていないばかりか、95%CIがなかったので)。今までの報告と少し食い違う、Lever Signは最も優秀な確定力を叩きだした一方で、除外力は最も低いという結果になっています(↑)。うーん、本文を何度も読み返してみたのですが、どうしてここまで低い感度が出たのか、その原因になりそうな要素にどうしても思い当たるようなことがないのです。可能性としてはこのテストを実施した医師がこのテストをどれほど練習したのかが怪しいというあたりでしょうか…。今回患者の診断を担当した医師、PT共に臨床経験やこのテストをどのように学んだのかに関して全く言及がなかったので…。

では、他のテストにLever Signを追加するその付加価値はどれほどあるのか?
b0112009_16591683.png
Table 5(↑)はClusterに書かれているテストを全て行い、「一つでも陽性なら陽性」と判断した場合の診断力を、Table 6はClusterに挙げられているテストを全て行い、「全て陽性でなければ陰性」と判断した場合の診断力を示しています。Table 5ではCluster 1→2でLever Signが追加されており、Table 6ではCluster 2→3でLever Signが加えられています。Table 5ではLever Signを追加することで特異度を損なうことなく感度が向上している様子が伺えるので、「やって損はないじゃん」という結論に(感度が2%上がることが臨床的にどれほど意味があるのかは各クリニシャンの判断に任せますが)、Table 6では感度を大いに(18%)犠牲にしながら特異度を2%上げるという、意味があるんだかないんだか分からない効果が観察できます。まぁどうせここまで3つのテストを行って全て陽性だったのだから、Lever Signもついでにやって完璧に確定してしまいたいという気持ちは…現場ではあるでしょうし否定はしませんが、そもそも私は現場でPivot-Shift Testを使うことはまずないのでこの情報(Table 5 & 6共に)がそもそも臨床的意味を持たないです…。せっかく出してもらってありがたかったんですが…。どうせならこの4つのテストを行って、「一つでも陽性なら陽性と判断した場合」、「2つ以上で」、「3つ以上で」、「4つ全てで」と全ての場合をそれぞれ分けて分析したり、LachmanとLever Signを併用した場合、とか、もっと実用的なコンビネーションを検証してほしかったなーと思ってしまいます。

この論文の結論としては、
- Lever Signは他のテストと同様、信頼性が高い
- 特異度は非常に高いが、感度はとても低い(Lachmanが最も正確で、確定力、除外力共に優秀)
- このテストを他のテストに追加する付加価値はほとんどなく、特に陰性結果はそれだけではACL損傷を除外できるものではないことを考慮して解釈すべし
…ということだったようです。ふーむ。

んで。やっと冒頭のシステマティックレビュー・メタ解析論文1 に話が戻ってきます。
2017年までに発表された7件の論文3-9に加えて今回の2018年のもの2を加えた8件の論文をレビューしています。PRISMAのガイドラインには則っているんですが、Inclusion/Exclusion Criteriaがそれぞれ:

Inclusion:
1) ACL損傷疑いの患者が被験者である
2) その診断法としてLever Signの有効性を検証している
3) "Acceptable"な比較試験を用いている
4) 2x2テーブルを作成するに足る情報を提供している
5) 英語かフランス語で書かれている

Exclusion:
1) 膝以外の障害を検証している
2) Lever Signを検証していない
3) 詳細の報告が欠けている
4) 献体を用いている
5) 特殊な機械、問診表やパフォーマンステストを用いている
6) 被験者が乳幼児を含む

…と書かれています。個人的にはこのリスト、少し違和感ありです。Inclusion #2とExclusion #2や、Inclusion #4とExclusion #3は結局「全く同じことを逆の視点から書いているだけ」なので、なにこれ、リストを長く見せかけようとしているだけ?と勘繰りたくなるし(普通はどちらか片方言及すれば十分)、"Acceptable"な比較試験はあまりに定義が曖昧だし、「特殊な機械や問診票、パフォーマンステスト」を使っていたらLever Signの検証に影響が及ぼされるわけでもないし、被験者が「乳幼児(= "infants/toddlers")」っていう表現はあんまりでは?16歳以上とか、具体的に年齢制限を設ければよかったのでは?と思ったりします。
個人的には、診断の検証論文で重要なのはProspectiveであること、つまり、膝が痛い、でも具体的に何の怪我なのかまだ分からない、という条件の被験者にまず検証したいテストを使い、それからあまり間を空けずに比較対象となるテスト(この場合はGold StandardであるArthroscopyと限定したほうがいいでしょ)を行っているという順序とblindingは重要なのであって、先にMRIなどの画像診断が撮られていたりして、既にACL損傷があることが分かった状態でテストをしていない(=そういう研究は除外してます)、ということを条件に設けるべきだと思うんです。ここの言及がないのはやっぱり、気になるなー。まぁあんまり絞り過ぎるとまだまだ論文はできってない分野だから、該当論文が少なくなり過ぎちゃう、っていう懸念はわかるんだけど。

あと、QUADAS-2ではなくQUADAS(オリジナルのほう)を使って各論文の質を推し量ってるんですが、だったら14点満点中何点だったのかを数字で示せばいいのに、「10以上はhigh quality/low risk of bias」「10未満はlow quality/high risk of bias」という二択にまとめられており、その理由は「前にもそういう風にまとめられてた論文幾つかあったし他に方法があるわけでもないから」というやけに消極的なものになっています。QUADASがどんなものかを知っている読み手であれば、10点あればそこそこの質であるってことは常識として理解しているでしょうし、逆に質が低いとひとくくりにしてもQUADASが9点なのか3点なのかでは大違いだし、どうして素直に点数そのものを表記しなかったのか私は大いに疑問が残ります。治療系の論文だってPEDroスコアだってRaw Scoreを表記するでしょ?

そんなわけで色々気になるところはありますが、結果です。下がTable 1、それぞれの研究被験者のDemographics。良質な研究はDececi et al3とMassey et al6のふたつだけってことになってますね、やっぱりQUADASスコアそのものを見たかったけどー。
b0112009_20540161.png
こちらがTable 2。比較試験はなんだったのか、試験者はどんな人で、どんな状況下で評価されたのかが示されています。ある場合は信頼性も。
b0112009_20540923.png
…で、このTable 3がメタ解析部分ですね。比較試験別にArthroscopy vs MRIと、MRIの中でも「良質の研究のみを比べたもの」と、「全ての研究をまとめたもの」の複数に分けられています。数字はかなりばらつきがある印象。特に感度と尤度比はバラバラですね。特異度だけが一貫して良いイメージ。
b0112009_21201506.png
これは面白いビジュアルプレゼンテーション!左がArthroscopy、中央がMRI(良質な研究2つのみ)、右がMRI(3つ全て)の合計値から出した尤度比を使ったpre- and post-test probabilityのシフトです。当然、それぞれの研究を合わせたprevalence(有病率)がpre-test probabilityとして使われています。まぁでもやっぱり高いなー、有病率。5割から7割って!サンプルバイアスは相当あり、と言わざるをえませんね。スポーツの現場で膝が痛い、という設定に絞って同様の研究を行ったらここまで有病率高いことはないと思うので、あくまでも参考までに、なんですけど…まぁでもこのテストが陽性だったら確定はかなり自信を持ってできる、ということは言えるでしょうか。

結論としては「そこそこチカラあるかもだけど研究の質がマチマチだし、数も十分にないのでまだよくわかりません」という感じでした。ふむー。私はこのメタ解析にあまり納得がいかなかったので(いや、面白い点もあるんですけど私だったらこうするなー、という点もいくつか思い浮かんでしまったので)、以前まとめたシステマティックレビュー・メタ解析「風」のデータに今回のLichtenberg et al2のものを足したもの(一番下)を作ってみました。下はシステマティックレビュー「風」まとめ。
b0112009_15410569.png
こちらがメタ解析です。私の解析基準は「Arthroscopyを使っている」兼「診断結果がわからない状態でテストを行っている」且つ「麻酔下でない」データに限ったもの。こう改めてみるとMulligan et al9とLichtenberg et al2の研究の感度がやっぱり異様に低いんだよなー。原因はなんだろう?と思うけれど、総合計では感度も決して悪くないので、やはり総合的には私はLever Signは(何らかの状況でLachmanが使えなかったら)充分有効なalternativeになりうる、クリニシャンならツールとして持っておいて損はないテストだと思っています。どちらかというと、除外力より確定力に優れているという感じかな。
b0112009_15410958.png
そんなわけで、最新メタ解析もいいんですが、私は自分でまとめたこのメタ解析「風」データのほうが眺めていて有意義かなと思ってます(総被験者も約500人とだいぶ増えてきましたし)。ただ、論文にもあったようにまだまだ臨床研究の被験者やセッティングにバラツキがあり、これからもっとclinically applicableな状況でテストの診断力が検証されていく(具体的には受傷から3日以内の超・急性の16-30歳くらいの被験者で、半月板や他の靭帯損傷患者も含む、比較試験はarthroscopy、非・麻酔科の環境で…)といいなぁと思っています。続報を待つことにします!

1. Reiman MP, Reiman CK1, Décary S.Accuracy of the lever sign to diagnose anterior cruciate ligament tear: a systematic review with meta-analysis. Int J Sports Phys Ther. 2018;13(5):774-788.
2. Lichtenberg MC, Koster CH, Teunissen LPJ, et al. Does the lever sign test have added value for diagnosing anterior cruciate ligament ruptures? Orthop J Sports Med. 2018;6(3):2325967118759631. doi: 10.1177/2325967118759631.
3. Deveci A, Cankaya D, Yilmaz S, Özdemir G, Arslantaş E, Bozkurt M. The arthroscopical and radiological corelation of lever sign test for the diagnosis of anterior cruciate ligament rupture. Springerplus. 2015;4:830. doi: 10.1186/s40064-015-1628-9.
4. Thapa SS, Lamichhane AP, Mahara DP. Accuracy of Lelli test for anterior cruciate ligament tear. J Inst Med. 2015;37(2):91-94.
5. Lelli A, Di Turi RP, Spenciner DB, Dòmini M. The "lever sign": a new clinical test for the diagnosis of anterior cruciate ligament rupture. Knee Surg Sports Traumatol Arthrosc. 2016;24(9):2794-2797. doi: 10.1007/s00167-014-3490-7.
6. Massey P, Harris J, Winston LA, Philip N, Delgado DA, McCulloch PC. Critical analysis of the lever test for diagnosis of anterior cruciate ligament insufficiency. Arthroscopy. 2017;33(8):1560-1566. doi:10.1016/j.arthro.2017.03.007.
7. Chong AC1,, Whitetree C, Priddy MC, Zimmerman PR, Haeder PR, Prohaska DJ. Evaluating different clinical diagnosis of anterior cruciate ligament ruptures in providers with different training backgrounds. Iowa Orthop J. 2017;37:71-79.
8. Jarbo KA, Hartigan DE, Scott KL, Patel KA, Chhabra A. Accuracy of the lever sign test in the diagnosis of anterior cruciate ligament injuries. Orthop J Sports Med. 2017;5(10):2325967117729809. doi: 10.1177/2325967117729809.
9. Mulligan EP, Anderson A, Watson S, Dimeff RJ. The diagnostic accuracy of the lever sign for detecting anterior cruciate ligament injury. Int J Sports Phys Ther. 2017;12(7):1057-1067.

  by supersy | 2019-01-10 22:00 | Athletic Training

NATA最新Position ... >>

SEM SKIN - DESIGN by SEM EXE

AX