Shoulder Impingement Syndrome (SIS)診断について、その3。

b0112009_10385830.png
#8 Kelly & Brittle, 2009
この研究ではUSを比較試験として用い、7つのテストの診断的価値を検証しています。US画像診断は最近の技術の進歩でより正確になってきていて…と他の論文(#7)でも書いてあったような文句が導入部に書かれていますが、その際に引用されている文献は#7でも使われていた2004年のものと2000年の論文のみで、もっと新しいはずの#6 (2006年)の論文と決定的に食い違うので、やっぱり個人的に「USをreference testとして使う」ことの正当性は低いのではと思いますが…。

被験者: 該当整形外科病院に肩のUSを撮りに来た34人の患者さん(男性20人、女性14人、中間年齢57歳、中間症状期間2年…なぜにmeanでなくてmedian?)。Inclusion criteriaは年齢が20-70歳で、指示に従う能力があり、no history of traumatic injury to the shoulderというところ(肝心な肩の症状に関する指定は一切なし)で、Exclusion criteriaは1) neurological-type pain or weakness originating from cervical spine もしくは 2) inflammatory joint diseaseがあること、だそうです。我々ATからしたら、US画像にreferされる患者の平均的criteriaが分からないのでこれは設定の甘いIn/exclusion criteriaですね。Sample sizeに関してもPower Analysisは行われておらず、かなり被験者の数は少ないなぁという印象です。

検証方法: US (肩の超音波の専門家であるひとりのradiologistが一貫しておこなう)の直後一人のphysiotherapistが7つのテスト(Neer, Hawkins-Kennedy, Painful Arc, Empty Can, Full Can, Resisted Abduction, Resisted ER)を実施。タイムラグがないのがいいですね。しかも、このPTはUSの結果を知らない(blinded)状態だったそうなので、ここも評価できます。

気になるのは「US画像がfull-thicknessがどうか不明瞭だったり、テスト結果が曖昧(陽性とも陰性ともつけがたい)だった場合は分析から省きました」という記述ですかね。実際の診療では「あれー?このテスト陰性かな、陽性かな?」と迷うような場面があるからといって「分からないから診断しない!」と投げるわけにはいきません。曖昧なケースも含めて診断できるようなツールを開発することこそに意味があるのではと思うので、「不明瞭なものは除外」というのはあまり褒められた研究デザインではありません
b0112009_12461577.png
結果: さて、結果は上の表の通りです。例によって-LRや+/-PVがなかったので全部まとめて出してみました。ハッキリ言って有効なものはほとんど確認できません。外転時の痛みが確定に有効なくらいでしょうか。それにしたって、95%CI値が報告されていないので、どれほど安定した数値なのかは残念ながら不明です。被験者の数が少ないので、95%CI幅が報告されていたとしても広いことは間違いないのではと思います。

著者の結論にも「SIS診断にこれらのテストの使用はさほど有効ではない」と書かれています。唯一面白いと思ったのが、それに続く考察で「肩周りは神経支配がリッチであるため、例えばまだまだSIS初期で、USでは変化が見受けられないけど、これらのテストでは痛みが出るという可能性も十分にあるのではないか」つまり、USという比較テストの信憑性そのものにも疑問を掲げているところでしょうか。まぁ、これを言ってしまうとGold StandardであるはずのArthroscopyもその絶対性が怪しくなってきてしまいますけども…。これ(初期の比較的asymptomaticなSISの診断)を考慮しようと思ったら、今度はSISの初期、中期、末期…みたいに患者を状態でわけて、それぞれでテストの診断価値を実証しなければいけなくなりますねぇ。興味深い考え方なんですけど、検証は難しいかな。
b0112009_10390587.png
#9 Hegedus, 2012
2006年に俺らreview article出したんだけど、あれから結構経ってoriginal researchもさらに出たし、systematic review/meta-analysisのmethodologyもかなりスタンダード化が進んだし、QUADASが進んでQUADAS-2になったりもしてるんで、もう一回新しくsystematic review/meta-analysisやりなおしますわー、という論文。

Inclusion Criteria: diagnostic accuracy studies; report SN and SP; written in English; examining adults with shoulder pain fur to musculoskeletal pathology
Exclusion Criteria: the use of equipment/devices; subjects tested under anesthesia; cadavers
Databases Used: Medline, CINAHL, EMBASE, Cochrane Library
b0112009_21041162.png
2人の研究者が別々にタイトルとabstractを読み、include or excludeを判断。意見が合わないところは話し合いで、それでも解決しなければ第3研究者によって決定。そののち、手元に残った論文の全文を読んでsystematic reviewとしての最終分析に入れるか決定。最終分析に含まれた32の論文のうち、2x2テーブルが抽出可能だった論文はmeta-analysisにも含まれたそうです。同様に、QUADAS-2に関しても2人の研究者がそれぞれindependentlyでこのツールを用いて研究の質を推し測る分析を行ったそうなんですが、QUADAS-2のagreementはk = 0.31 (95%CI 0.10-0.52)とかなりpoor (低い)値に。いやー、講習会などでも私はオリジナルQUADASのほうがまだ良かったのではないかって言ってしまったりするんですけど、そうなんですよね、QUADAS-2のほうが主観的なので、評価者によって意見の食い違いがある、つまり、inter-rater reliabilityが低いと思うんですよ…。まぁ別に今回のこのレビューそのものの悪口を言っているわけではなくて、これはツールそのもののlimitationですよね。ここまでのmethodologyはスタンダードな、いわゆる非常に丁寧に作られた良レビューという印象です。

QUADAS-2の分析から見えてきた「(今回のレビューに含まれた)多くの論文に共通するバイアス」に関する問題点は大きくふたつ。1) Patient Flow - index testとreference testの間が空きすぎ…これは以前に私も指摘した点ですね。それから、2) そもそもgold standardですらないUSをreference testに使う研究が近年増えている(n = 12)、という点も。これも私が書いていたところだ、やっぱりそうだよね!なんでUSがありきになったのか…。

Systematic reviewの部分はそんなに面白くなかったんで(オイ)、もっとワクワクするMeta-analysisの部分に飛んじゃいましょう!これはご飯三杯はいける、楽しい統計群です!下のテーブルは文中のTable 3を私が個人的に一番見やすいように修正したものなんですけど、ひとつだけ疑問があるとすれば「なんでImpingementとSLAPの上半分だけ、SNとSPを小数点以下まで求めていないの…?」という一貫性の無さですかね。数字いじるんだったらそういうところはしっかり合わせてほしかったです。んで。せっかくのmeta-analysisなので、95%CI幅を考慮しても絶対的な統計力がある「優れたテスト」はあるのか?ということで、「決定的統計力」があるものはがっつり赤に太字で、「まぁ使えないことはない」というテストはうっすら赤で、それぞれハイライトしてみました。意外というかやっぱりというか、少ないですね、良いテスト…。
b0112009_21001210.png
Impingement: NeerとHawkins-Kennedyは除外にはまぁまぁ、確定にはPainful Arcがまぁまぁ有効。
SLAP: Anteiror SlideとYergasonの確定は決定的。CrankとCompression Rotationは確定にまぁまぁ。除外に有効なものは残念ながらないが、一番マシなのはActive Compression (O'Brien's - 67%, 95%CI 51-80%)といったところか。
Anterior Instability: これはやっぱりAnterior ApprehensionからのRelocation, Surpriseのコンボをやれってことでしょうね。それぞれ確定力は決定的もしくはまぁまぁ。そして、Surpriseは除外力もまぁまぁあり。
Tendinopathy: Hawkins-Kennedyの除外力がまぁまぁ。
Labral Tear: Crankの確定力はまぁまぁ。
障害別にまとめるとこんな感じですかね。LR値は残念ながら総じて良くないです。例えばSpecificityが良くてもSensitivityが乏しいと、いわゆる「トレードオフ」状態になってしまっていて「総合的にLR値が1に近づく」という、まぁ、こういう現象が起こりえます。
b0112009_21042011.png
コンビネーションテストも紹介されてはいるんですが、95%CIがないのでここで敢えて言及する価値はないかと思います。結論としては、「使いどころによってはチカラを発揮できるテストはあるが、これさえ使えば完璧!というテストは存在しないし、コンビネーションテストもギリギリ使えるかどうか…という感じ。もっとcomprehensiveな診断方法を開発、検証する必要がある」とまとめられています。これは私も賛成です。

#10 Dinnes et al., 2003
肩の傷害の診断に、1) clinical examination, 2) US, 3) MRI, 4) MRAはどれだけ有効なのか、という大掛かりなレビュー文献。これは…誰かのdissertationでしょ?chapter形式で185ページあるし…。こういうの課題にするかね普通?ぶつぶつ…。
b0112009_12050926.png
この論文、長すぎてとてもまとめきれないので、面白いと思ったところだけ書くと…
  • Includeされた研究の多くがprimary care setting (i.e. スポーツの試合中に怪我が起こり、その場でATが診断)ではなく、誰かの手を渡って最終的に整形外科やリューマチ課などにreferされた患者であるからして(self-referもあるかもしれないけど)、これらの研究の結果が(比較的患者がunselectedである)現場でそのまま当てはまるとは限らない。
  • 上記の理由で、障害のprevalenceは高いものが多かった(i.e. RC disorderが平均で61%)。…現場での数字はきっとこれほど高くはないでしょうし、prevalenceは直接SN、SPなどの結果にも関わってくるので、これによって結論が影響を受けた可能性は十分にあり得ます。
  • 個々のSelective Tissue Testで除外に有効なのが1) Arc of Pain (SN 97%; 95-99%)/Impingement Sign (SN 97%; 95-99%); 2) IR Lag Sign (SN 97%; 83-99%, -LR 0.0; 0.0-0.2); 3) Rent Test (SN 96%; 85-99%, -LR 0.0; 0.0-0.2); 4) Neer (SN 89%; 80-94%); 5) Night Pain (SN 88%; 84-91%)。
  • 確定に有効なのは1) ER Lag Sign (SP 100%; 86-100%)/Drop Test (SP 100%; 86-100%)/Lift-Off (SP 100%; 86-100%); 2) Rent Test (SP 97%; 89-99%, +LR 30.1; 7.7-118.0)/Speed (SP 97%; 87-100%); 3) IRRST (SP 96%; 90-99%, +LR 24.8; 8.1-75.9)/IR Lag Sign (SP 96%; 80-00%)。
  • 総合的に優秀なのはRent Test (除外確定、SN、SP、+/-LR全て有効)、次にIR Lag Sign (除外確定、SN、SP、-LRは確定的)、そしてIRRST (確定、SP、+LRが確定的)というところでしょうか。しかし、これはそれぞれ異なる障害を診断するためのものなのでなんというか、わかりにくくなってしまっているまとめです。傷害別にorganizeすればよかったのでは?
b0112009_11353358.png
  • テストの組み合わせは臨床的に意味がありそうなものはなし。例えば、このまとめ(↓)によれば、7つのテストをおこなって全てが陽性だったら確定可能…って、あたりまえじゃん!って感じなので。他にも「10 tests + X-ray」なんて、ATにしては現実味がゼロ。
b0112009_12014583.png
  • 肩の傷害の診断にUSを使うことに関しては、今までに38の研究が発表されていたらしいのですが「最近使われている周波数は>10MHzが主流なのに、過去の研究では5MHz(6 studies)や7MHz(19 studies)、もしくは5MHzと7MHzのコンボ(6 studies)が使われていること多く、10MHzの研究(3 studies)のほうが圧倒的に少ないほど。バラツキが大きすぎる」とのことで。ふーむ、ここんとこは知らなかった。となると、研究間の比較の正確性がアヤしくなってきますね。
  • 加えて、超音波画像の研究は被験者のdemographicの描写が甘い、不適切なreference testを使っている、診断基準がきちんと定義されていない、USとreference testの間が空きすぎている、なども挙げられており、総合的にこれらの研究の質はかなり悪いと考えてよさそう。特に私が気になるのがretrospective (or unknown, n = 18) studiesの統計のほうがprospective (n = 11) studiesよりもSensitivity (85%; 81-85% vs 70%; 64-75%)とSpecificity (86%; 83-88% vs 81%; 76-85%)の数値がいいってことでしょうか。もうこうなってくるといよいよ過半数の研究にバイアスがあるってことじゃないかと。
b0112009_12553585.png
  • USそのもののOverall pooled SN = 80% (95%CI 78-83%)とSP = 85% (95%CI 82-87%)。RCのtear深刻度別にa: any tear; b: full-thickness; c: partial-thickness tearで見てみると(↑、個人的に重要だと思う結果に★を付けてみました)、断裂の度合いを問わず、確定にはいいけと除外はなー、という感じですね。画像診断まで取って損傷を見逃したくないというのが患者・クリニシャン双方の考えかなと思うので、このSensitivityの幅は私としては使い勝手がいいとは言えないのは、という印象です。これはLR値見ていても同じ(↓)ですね。full-thicknessのtearで陽性出たらDORが13にも跳ね上がるのだとか。しかし、陽性は有意義でも陰性はそれほど意味を持たない。
    b0112009_13061121.png
  • MRIのRC pathologyに対する診断価値を検証した研究は全部で29。Overall pooled SN = 83% (95%CI 79-86%); SP = 86% (95% CI 83-88%)ということで、USよりはほんのわずかばかり優秀。MRIに関して面白いと思ったのが、「患者の年齢が上がるとともに正確性が下がる」というところですかね。加齢に伴う組織の変化をpick upしすぎてしまうのでしょうか?
b0112009_00230568.png
  • RCのtear深刻度別にa: any tear; b: full-thickness; c: partial-thickness tearで見てみると(↑、これも確定的だと思うものに★アリ)、MRIはfull-thicknessの診断には確定・除外共にかなり有効(SN 89%; 86-92%, SP 95%; 91-95%)な反面、partial thicknessの除外力は非常に低い(Sn 44%; 36-51%, SP 90%; 87-92%)のがわかります。LR値(↓)もまぁ、この結果を反映していますよね。Full-thicknessの-LR値は完璧とは言いませんが、「陰性の場合はRC断裂の可能性は(pre-test probability 32%から)7%未満まで落ちる」のには十分な数値でもあります。臨床的意味はそこそこあるのではと私は感じています。これに基づき、最終結論では「MRIはfull-thicknessの除外に有効」とのみ書かれているので、「確定は?」と思って、nomogram使って陽性の場合のpost-test probabilityも示してみました(赤線がfull-thickness、緑がany tear、そして青がpartial thicknessです)。うーん、なるほど、確かにpre-test probabilityの32%を考慮しちゃうと、陽性の場合でもfull-thickness tearのpost-test probabilityは82%ほどと、それほど確定的ではなくなってしまうのか。なるほど。
b0112009_00520153.png
b0112009_01255933.png
  • さて、最後はMRA。MRAの診断価値を検証した研究はたった6、ということでこれは比較的コンパクトにデータがまとめられています(↓)。下の総合的な数値を見る限りでは、full-thicknessのtearにはMRAは確定も除外も決定的に有効partial tearに関しては確定が決定的に有効、ですね。MRIよりもそれぞれ数値が少しばかり高い印象です。Prevalence 平均36%を元に考えると、MRAが陽性だった場合full-thickness tearがある可能性は85%に、陰性だった場合その可能性は6%までに低下するという計算。
b0112009_03260954.png
  • まとめると、「画像診断ではfull-thicknessのほうがpartial thicknessよりも診断しやすい」というところは間違いなさそうですね。本文には「MRIに比べてUSとMRAのほうが優秀」とあったんですが…うーん?そうかなー?確かにUSとMRAが部分断裂を確定できるのに対して、MRIはその能力が少し劣るところは大きいのか?研究の質としてはUSのそれは低いものが多いかなと思ったんですけどね…。今ネットで調べてみたら、もちろん保険や場所によって差はあると思うのですが、コストはUSが一回平均$225ほど、MRIは$475くらいでMRAが$550くらいとありました。ちなみにarthroscopyは$2500-6000くらい?値段も加味すると、一番コスパが良いのはUSってことになるんでしょうか。お金に糸目はつけないんだったらさっさとMRA撮っちゃいましょ、って感じかな。
b0112009_05370319.png
そんなわけで、これでSIS診断の10文献レビュー終わりです!あーこれが終わればやっと読みたかった脳震盪の文献群に取り掛かれそう。楽しみです、ひゃっほうー。

[PR]

  # by supersy | 2017-04-15 18:00 | Athletic Training | Comments(0)

Shoulder Impingement Syndrome (SIS)診断について、その2。

b0112009_06301040.png
#5 Silva et al., 2008
実際に臨床でよく使われるreference standardであるMRIとPhysical Examの結果を比べましょう!というこの研究。いやー、うーん、それでもやっぱりGold StandardであるArthroscopyと比べるべきだと思うんだけど、「臨床的によく使うから」という理由でMRIと比較するのはどうなんだろう。そのJustificationには少し疑問が残ります。

被験者: 18歳以上の新たに肩の痛みが出始めた患者をリクルートし、30人(男性14人、女性16人、平均年齢54.87 ± 13.8歳、平均症状期間97.5日)が参加。かなり人数は少ない印象。Sample sizeは計算していない、と明言してます(なぜ?)。Exclusion Criteriaは1) history of shoulder trauma or surgery, 2) inflammatory rheumatic diseases, 3) painful cervical motion, 4) other musculoskeletal problems of an UE (#4は曖昧すぎる気が)。

検証方法: Demographicを取った後、AROM、PROMと7つのスペシャルテストをひとりRheumatologistが実地。RAを除外した後なのに、なぜ専門外とも思えるRheumatologistが…?Ortho MDじゃなくて…?検証されたテストはNeer, Hawkins, Yocum, Jobe (Empty Can), Patte Manoeuvre (先のIRRSTのERをテストせず、IRのみやるバージョンという感じ), Lift-off, Resisted Abduction。Physical Examをおこなった3日以内に、Physical Examの結果を知らない(blinded)RadiologistがMRI画像を撮って診断し、その結論が比較されました。MRIは閉所恐怖症の被験者がひとりだけいたため、それ以外の全員(これはExclusion Criteriaに含めておくべきだったのでは…この患者はどういう風に分析されたのか?)を対象として行われたそうな。

結果: 結果は以下のテーブルの通り。MRIでは患者をSISかどうか診断しただけでなく、SSB = Subacromial-Subdeltoid Bursitisがあったかどうかも検証、分析に加えたそうなんですが…この怪我のみ分けて検証した理由はなんだったのか?説明が不十分に感じます。
b0112009_08050282.png
LR値はなぜかPositiveしか求められていなかったので-LRを追加しました。残念ながらSISの診断に有効なテストはないですね。SSBは…Neer, Hawkins, Yocum, Lift-offにPassive Abductionが陰性で除外が可能そうです。最も有効なのはLift-off Testでしょうか。しかし、被験者の数が少ないこと、そして95%CI値が求められていないことを考慮すればこの数字にどれほど一貫性があるのかは甚だ疑問です。
b0112009_08151227.png
ひとつでダメなら合わせればどうだ、ということで、2つのテストを組み合わせた場合の結果も表にまとめられているのですが、SensitivityとPPV、+LRだけ載せられても…という感じです。きちんとcomplete dataをプレゼントするべきだと思います。私がこの表を見た感想は「やはりSISに有効なテストは組み合わせてみても無し。SSBは『PatteとLift-off』の組み合わせを著者らは推しているが(+LR 10.27)、95%CI幅は広いし信頼に足る数字ではない」というところです。

b0112009_06301581.png
#6 Michener et al., 2009
やっときちんと統計やってくれてる研究が…(涙)!
この研究では1) SIS診断によく使われるテストのreliabilityは?2) 個々のテストの診断的価値は?3) 効果的な組み合わせはあるのか?という3つの観点から5つのテスト(Neer, Hawkins-Kennedy, Painful Arc, Empty Can, ER Resistance)を検証しています。

被験者: 整形外科に来院した、一週間以上続く肩の痛みのある患者55人(男性47人、女性8人、平均年齢40.6 ± 15.1歳、平均症状期間33.8 ± 48.9ヶ月)。男性が多い(85.5%)ですね。Power Analysisに基づき、合計57人の被験者が要るという分析まではしたようなんですが、実際の被験者の数はこれをわずかに満たしていません。あと2人、見つからなかったのかな…。

検証方法: Physical Examはそれぞれの患者に対して2人の臨床家(1人のOrthopedic surgeon, 17年の臨床経験、1人のPT、8年の臨床経験)が別々におこない (blinded to each other's findings)、その結果を比較しました。その後、平均2.6 ± 2.7ヶ月の期間を経て(報告されているのはありがたいけど、ちょっと長いな…)、これまたPhysical Examの結果を知らないOrthopedic SurgeonArthroscopyを実施。最終診断を下し、Physical Examの結果と比較されたというわけです。Blindingがふたつあるのがいいですね。

結果: まずはreliabilityから。17年の臨床経験のある医師と、8年の臨床経験のあるPTが5つのテストをおこない、どれだけその結果が一致したかという分析です。
b0112009_08300180.png
これは…意外と低いですね。Kappa CoefficientはPoor < 0.20; Fair 0.21-0.40; Moderate 0.41-0.60; Good 0.61-0.80; Strong >0.81なので、Hawkins-Kennedyが『Poor』なの以外は『FairからModerateに収まる』と言ってしまってもいいんですけど、これらのテストは比較的スキルの要らない簡単なもののはずで、それらの信頼性がここまで低いというのは、正直なところびっくりです。もう少し各テストのスタンダード化が進むべきってことなんでしょうか。

では、個々のテストの診断的価値は?確定に使えるのはEmpty Can, ER Resistance Testのふたつで、除外に最も有効なのはNeer Testといったところでしょうか。これら3つのテストのSensitivity, Specificityは95%CI幅もそこそこ狭く、それぞれの能力にそれなりに長けていることが確認できます。LR値は…どれもイマイチですね。95%CI幅も広いです。あまり参考になりません。組み合わせてはどうか?ということで、確定能力トップ3の『Painful Arc, Empty Can, ER Resistance Test』のコンビネーション除外力トップ3の『Painful Arc, Hawkins-Kennedy, Neer』のコンビネーションの統計的価値もそれぞれ計算してみたそうなんですが、残念ながら「どの組み合わせも適切とは言えない」という結果になっています。
b0112009_08303232.png
5つ全てのテストをおこなった場合、「〇以上陽性だと」というようなcutoff pointはあるのか?と分析した結果、最も確定と除外のバランスが取れていたのは『3つ以上陽性である場合、集合的に陽性と考える』という場合でした(Table 4)。こちらは除外も確定もボチボチ、といったところです。

個人的にはTable 5のような表を眺めているのは大好きなのですが、finding時代は残念ながらそんなにわくわくするものではありませんね。LR値はどれもイマイチ。どのテストも決定的なprobabilityの変化にはつながらないようです。

結論としては、SISの確定には 1) Empty Canをソロで使う、2) ER Resistance Testをソロで使う、3) 5つのテストのうち、陽性が3以上ある、という3つの条件のいずれかを用いることが、そして除外には 1) Neerをソロで使う、もしくは2) 5つのテストのうち、陽性が3未満である、という2つの条件のいずれかを用いるのが有効なようです。有効なコンビネーションは残念ながら無し、probabilityを決定的にシフトさせるテストもこれまた残念ながら無し。95%CIも含め、丁寧な統計分析が行われている研究で、非常に好感が持てます。読んでいて楽しい論文でした。
b0112009_06301980.png
#7 Salaffi et al., 2010
さて、最後の論文はUSをReference Standardとして用い、5つの「肩障害用」のテストの診断力を検証したものです。USをReferenceに用いた理由として、2004年に発表された研究によればUSの正確性は87%で…とその有効さを説明をしてはいるものの、これはその1でまとめた2006年発表のArdic氏らの報告とは食い違う見解なわけで、そこらへんの背景の説明は不十分であるんではないかなーと疑い深くなりたくなってしまう導入です。

被験者: 肩の痛みを訴えてリウマチ科に来院した203人(男性64人、女性139人、平均年齢58歳、平均症状期間2ヶ月)の患者が対象。Exclusion Criteriaは 1) historyof trauma, surgery or radiation therapy, 2) tumor in the shoulder girdle, 3) septic arthritis 4) inflammatory rheumatic diseaseで、うーん、あまり普段は見かけないようなものもありますね。どうしてTumorなんかを入れようと思ったんでしょう?別にあって悪いものじゃないですけど、理由が気になります。

検証方法: 患者のdemographicsのあと、一人のRheumatologistがphysical examinationをおこない(私の認識が間違っているのか…RAの専門家はOrthopedicの専門家とは違うのではと思うのだけど、違うのかな?どうしてOrtho MDじゃないのか疑問に思ってしまうのだけど…)、Hawkins, Jobe, Pette, Lift-off, Speed's Testの5つを実施。これらのテストの結果を得点化して集計するcomposite index、SNAP SHOT (Simple Numeric Assessment of Pain by SHOulder Tests、↓写真参照)として記録しました。このSNAP SHOTに関しては誰がどうやって作ったのかの説明は一切なく、あまりに唐突なので「なぜこの5つのテスト?」「なぜこの得点形式(各テスト痛みのレベルに合わせ0-2点、総合で0-10点)?」という疑問しか沸きませんが…。で。そのあとでUS診断。また別のRheumatologistの医師が、Physical Examの結果を知らない状態で(blinded)おこないました。Physical ExamからUS診断までの期間は明記されておらず、同日だったのか数か月後だったのかは不明です。
b0112009_10281733.png
結果: 各テストの統計は次の通り。ここで一度明らかにしておきたいのが、それぞれのテストは違う障害の診断目的で使われているという点です。HawkinsはSISを、Empty Can (Jobe)はsupraspinatus tendon、Patteはinfraspinatus tendonを、Lift-off (Gerber)はsubscap tendonを、Speed'sはbiceps tendonのpathologyをそれぞれ診断するのに使われています。なので、下のテーブル (Table 1)は、5つのテストの診断力を比べ合いすることはできないのだという前提で眺めてみてください(この説明は本文中でもしっかり説明されておらず、何分かりにくくしているのさー、という印象です)。

眺めている限りでは、アレですかね、95%CIも含めて解釈するならば「PatteはInfraspinatus tendinopathyの確定に」「Lift-offはSubscap tendinopathyの確定に」「Speed'sはBiceps tendinopathyの確定に」それぞれ有効、ということが言えるでしょうか。除外はあまりいいものがないですね。一番マシなのはHawkinsのSISの除外力ですけれど、それだってイマイチ決定力に欠けます。
b0112009_09480662.png
さて、私がこの研究で一番疑問を感じているのはこのSNAP SHOTという名前のcomposite index (↑Table 2)です。私、もともとcomposite系のテストは嫌いじゃないんですけど、これははっきり言って目的が不明だと思います。そもそもこのSNAP SHOTは何を診断しようとしているのか?ここの部分の説明が一切記載されていないからです。5つの異なる肩障害を診断するテストを合わせて、一体その点数が高かったからといって、どんな診断名が付くというのでしょう。もしこれが論文に繰り返し書かれている「painful shoulder」の診断のためなんだとしたら、その診断は患者が「肩が痛い」という主訴を訴えて来院した時点でestablishされているはずです。私は臨床家として、患者に「painful shoulder」という診断を課すことを目標に診断に臨むことは永遠にないと思うので、そういう意味ではこのcomposite scoreは私にとって何の意味も生みません。

そういったセオリーの部分は無視して統計だけを見ると、10点満点のSNAP SHOTのうち、「3点より高いかどうか」をcutoffと設定すれば除外と確定に最も理想的であるということは言えます。但し、くどいですが、臨床的意味は皆無だと私は思います。

うーん、つまらないものを切ってしまった次元の気分です。どうせ課題として課せられるなら、もう少し面白い論文を読みたいです。せんせー…。

[PR]

  # by supersy | 2017-04-09 21:00 | Athletic Training | Comments(0)

月刊トレーニングジャーナル5月号発売 & Shoulder Impingement Syndrome (SIS)診断について、その1。

b0112009_11550966.png
月刊トレーニング・ジャーナル5月号が発売になっています!連載最終回の今回は、「ATは医療の一部に特化した専門家であるべきなのか、オールマイティなジェネラリストであるべきなのか?」という観点から、現在アメリカで活発に交わされている、「我々はどこからきて、どこへいて、どこへ向かうべきなのか」について書いています。最終回には相応しいトピックかなぁと個人的に思っています。興味のある方はこちらからどうぞ。一部書店で販売していますがオンラインでも購入可能で、送料は無料だそうです。

全12ヶ月分の連載もこれで終了です!お世話になった皆様、ありがとうございました。資料提供など友人らに協力してもらったりして、とてもとても助かりましたー。



さて、諸事情あって少し間を空けましたが、最後の10文献をまとめておきたいと思います。トピックはSISの診断です。
b0112009_11484579.png
#1 MacDonald et al., 2000
NeerとHawkins Impingement Tests(↓)はSubacromial Bursitis/Rotator Cuff Pathosisの診断に有効なのか?という研究。少し古いので、研究デザイン自体にも色々flawあり。それから、SIS診断なんだとしたらどうしてBiceps tendinopathyについて触れていないのかも疑問が残りますね。
b0112009_12462716.png
被験者: Shoulder Arthroscopy(内視鏡手術)を受ける予定の患者85人(平均年齢40才、男性62人、女性23人)が対象。85 "consecutive" patientsという書き方をしてあるので、quota samplingだったのか?と思うけれど、どう被験者を集めたのか、どうして85人なのか(= statistical power analysis)など詳しい記述はなし。Inclusion/Exclusion Criteriaに関する記述も一切無し。Scopeを不可避と判断される程状態の悪い患者のみが対象なんだとしたら、この研究にはsample biasがかなりあると言える。Internal validityとExternal validityがあるかは甚だ疑問

検証方法: ひとりのsurgeonが全ての患者をexamine - 1) Physical Examと、2) Arthroscopyとをそれぞれおこなった。

結果: 結果は以下のテーブルに示した通り。Likelihood ratiosが求められていなかったのでついでに足しておきました。内容としては、「Bursitisの診断はNeerとHawkingが両方陰性だった場合は除外が可能」「Rotator Cuff Pathosisの診断はNeer、Hawkinsの陰性が共に除外に有効」という結論でしたが、95% CIが求められていないのは非常に痛い。Point valueだけ見ててもなー
b0112009_13020922.png

b0112009_11485499.png
#2 Calis et al., 2000
これはトルコの研究ですね。先ほどの研究に比べてもう少し手広く、「SIS診断するのにはどのテストがいいのか」ということで、Neer, Hawkins, Horizontal adduction, Speed, Yergason, Painful arc, Drop arm testの7つそれぞれの診断価値と、clusterとしての使用価値を検証しています。

被験者: 慢性的な肩の痛みを訴えてrheumatologyもしくはorthopaedic surgery unitから該当医院に委託された、もしくは直接該当医院に来院した患者120人(両側のケースもあったので肩は合計125、男性48人、女性72人、平均年齢51.6 ± 13.9歳)が対象。Inclusion Criteriaは年齢幅が18-70歳であること、そしてExclusion criteriaは 1) inflammatory or systemic diseases; 2) acute traumatic conditions, 3) postoperative conditions and 4) neck and elbow disorders…どうこれらの「該当条件」を探したのかは明記されていませんが。もっと細かい表記があるとより好ましいですが、先の研究よりは条件の絞り方がしっかりしています。

検証方法: 患者のdemographics、physical exam (2名の医師によって行われた―それぞれ4年と8年の臨床経験ありinterobserver reliabilityは98%…どう測ったか説明はないが、真実だとすれば優秀な数字)とX-ray、MRI (一人のradiologistが読む経験不明、blindされていたかの記述なし)を通じて患者の状態を検証したのち、SIT (subacromial injection test)を使って最終比較。SITが陽性で、且つX-rayが陰性だった場合にSISという最終診断が下されたようです。SITがSIS診断のgold standardであるという話は、理屈は通っていますがエビデンスを見たことがありません。これが最も適切な診断法なのかという判断が読み手としてしにくいのと、もしこれの診断法そのものに欠陥があった場合、この研究結果の全ての意味が著しく薄れるという懸念はあります。

結果: SITに基づいてSIS有りと判断されたのは86/120人 (prevalence/pre-test probability = 71.7%)、MRIによるグレード分けでは、19人がステージ1、50人がステージ2、18人がステージ3だったそうな。SIS患者(86人)と非SIS患者(34人)の間の平均年齢差は大差なし。個人的にはsymptom durationの比較も見たかったですが。では、個々の診断テストの結果とクラスター・テストの結果を下の表にまとめます。例によってLikelihood Ratioが求められていなかったので足しました。
b0112009_01524886.png
確定のトップ3はHawkins, Neer, Horizontal Adduction testで、除外のトップ3はDrop Arm, Yergason, Painful Arcの順番ですね。どちらかのみに特化したテストが多いため、LR値は陰性・陽性どちらも優秀とは言えません。クラスターのほうは…月並みですが、この7つのテストを実施し、陽性が多ければ多いほどSISの確定力が上がり、陰性が多ければ多いほど除外力が下がるということでしょうか。確定・除外のどちらにも使える基準というのは残念ながら存在しなさそうです。Accuracyの値は、pre-test probabilityが高いんであんまりアテにならないかと…Sensitivity値に引っ張られる形になってしまっているので。

うーん、興味深い結果ではありますが、これも先ほどの研究同様、95%CIが報告されていませんのでこの結果を鵜呑みにすることは危険です。きちんと統計報告せーよーほんとにもー、もったいないなー。


b0112009_11485846.png
#3 Zaslav, 2001
SISとヒトクチにいっても直接subarcomial archの構造上の問題を含むPrimary Impingementと(=surgical decompressionなどが有効の可能性高)、Instabilityなどに起因するintraarticular structureのImpingement、つまりはSecondary Impingement (リハビリによる介入や手術による関節包のtighteningが有効?)など、様々なunderlying pathologyが考えられます。ということで、この論文では新しい「Internal Rotation Resistance Strength Test (IRRST)」というテストがその鑑別に有効なのかどうかを検証しています。ちなみに、IRRSTというのは肩を90°外転、80°外旋した状態から、ER、IRの順でそれぞれのIsometric Strengthを試験者がテストし、ERに比べてIRが弱ければ陽性…というテストです。以下の動画参照。うーん、まずはこのテストのinter-rater reliabilityを明記してほしいですね。強さを比較して陽性かどうか決めるって、少しsubjectiveな気がするので。

被験者: 平均16週間(range: 2-25ヶ月)のconservative treatment(cortisone injectionからのリハビリ)を試しても症状の改善が見られず、肩の内視鏡手術を受ける予定の患者110人(男性65人、女性45人、平均年齢44歳)が対象。これも#1の研究同様、「リハビリが失敗し、内視鏡を受けざるを得ないような深刻なケース」の患者のみが被験者になっているため、「現場で肩を痛めた患者(=軽いものも深刻なものもバラバラに含まれる)」にこのまま結果を当てはめてもいいものとは限らない…sample biasの可能性高しですInclusion CriteriaはNeer Testが陽性であることで、Exclusion Criteriaは明記されていないものの、X-rayとMRIでAVNが確認された患者は除外された、と説明されています (ここまでの研究から、NeerはSensitivityが優秀なのは報告済みだけど、Specificityは決して高くない。それを考えれば、Neer陽性にどれほどの価値があるのか?)。

検証方法: まずはPhysical Examを、そのあとArthroscopyという順番で検証。Physical Examをおこなったのは「アシスタント」さんで、経歴などの詳細は不明。この人がIR Resistance Strength Testをおこなったのであろうと予想しますが、前述したように少しsubjectiveに見えるこのテストを陽性か陰性か判断するこの試験者の定義や背景はもう少し説明されるべきだったのではないでしょうか。一方、scopeをおこなったのはひとりの医師これもそれ以外の経歴は不明です。Blindingに関する記述はないので、おこなわれなかったと判断するのが妥当でしょう。

結果: 2x2テーブル(↓)を見る限り、このIRRSTはIntraarticular pathology、つまり分類でいうとSecondary SISの場合に陽性になり、Extraarticular pathology、つまりPrimary Impingementの場合に陰性になる可能性が高いということが言えそうです。この観点からSensitivity、Specificity、+/-PVと+/-LRを計算すると、下のようになります。またしてもLR値が計算されていなかったので足しておきました。昔の研究ではいかにPVがLRに比べて重宝されていたかわかるなー。今ではその関係性はほぼ真逆になっているけれど。
b0112009_04241029.png
この結果を見る限りでは、IRRSTはIntra vs extraarticualr tissue involvementを区別するのに非常に有効なテストであるということが言えますね。除外、確定共にかなりの診断力があります。やはり、95%CI値が求められていないのは致命的な統計欠陥と言えるでしょう。それから、少し疑問なのが、このテストがPrimary vs Secondary Impingementを区別するのに有効だというのはともかく、そもそもImpingement Syndromeではない患者に使った場合はどうなるのか?という点です。この研究のProtocolのままでいうと「Neer Impingement Testが陽性であることがImpingementであるという確定条件」なのかもしれませんが、これは前述したようにここまでの研究結果から論破可能な前提条件です。一体どういった患者にそもそもIRRSTの使用を考えるべきなのか、そこの背景設定が甘ければ我々臨床者にとってはあまり意味をなさないテストになってしまいます。例えば、subscapの肉離れ患者さんがいたとして、その障害はnon-SIS、extraarticular pathologyと解釈するのが自然だと思うんですけど、このテストはまー陽性になりそうですよね。でもだからといってSecondary ImpingementともIntraarticularとも言えないですよね。使いどころが定義されていないぶん、このテストには表面的な数字ほどの臨床的効果は実際はないだろうな、と個人的には思ってしまいます。

b0112009_11490358.png
#4 Ardic et al., 2006
この論文は画像診断に焦点を置いたもの。超音波画像(ultrasonography、US)とMRIが肩の臨床的評価、機能的評価とどうcorrelateするかを検証しています。

被験者: 58人(男性13人、女性45人、平均年齢55.5 ± 12.4歳、平均症状期間11.8 ± 7ヶ月)の"clinically suspected SIS"患者が対象。Inclusion Criteriaは1) no history of trauma、2) 肩の痛みが3ヶ月以上続いている、3) 3週間鎮痛剤を試したが無効、4)且つclinically suspected SISの診断を受けたことで(最後の条件はあまりにpoorly defined)、Exclusion Criteriaは1) history of trauma or cervical trauma、2) cervical discopathy、3) neurologic origin of muscle weakness、4) additional musculoskeletal problems of UE (#3と#4はpoorly defined)、5) systemic, metabolic, or inflammatory diseases、6) MRIやultrasonographyが何らかの理由で禁忌、と記述されています。

検証方法: ひとりの医師が一貫して全ての患者のPhysical ExamとX-ray (AP, Axillary views)をおこない、それからUSとMRIを撮る…という流れ。USとMRIはそれぞれ異なる、しかし一貫した"experienced" ragiologistによって撮られたそうで、その人物らはPhysical ExamとX-rayの結果にはblindedであったという表記がしっかりとあるところは好印象です。USとMRIに関してはどの角度からそれぞれの組織をどう見たかという詳しい説明があり、ここは素人目ながら再現性は高そうだと感じます。逆に疑問に感じるのはPhysical ExamとX-ray、USとMRIがそれぞれ「同じ月に撮った」という表記はあるもの、Physical Exam/X-rayとUS/MRIの間がどれほど空いていたのかは不明だというところです。もしかしたら一ヶ月以上空いており、例えば病状がこの間に進行してしまった可能性も考えられます。もっと短いスパン、同じ週…なんなら同じ日のうちにやるのが理想的なのではと思います。それから、これらはあくまでお互いのcorrelationを計算されただけで、何かほかのGold Standard、例えばarthroscopyの結果と比較したわけではありません。MRIとUSが共に何かを見逃せば、不正確であっても正解っぽく見えてしまう危険性もあるわけです。

結果: X-rayの結果は全員がWNL(特に異常なし)。興味深いのはUSとMRIの比較診断です。かなりの数の肩障害について、USはMRIに比べて見逃しやすい (p < 0.05)という結果が出てます。USとMRIが統計的有意な差なく同様にdetectできるのはBiceps rupture, Biceps effusion/hypertrophy, Supraspinatus tearのみで、他の傷害はMRIのほうが圧倒的に感度が高いのが印象的です。うーん、でもp値はきちんと具体的にリポートしてほしいな、0.05未満だったかどうかだけではなく。どうしてこういうところ手を抜くんだろう。95%CIも相変わらず報告されていないし。
b0112009_05465685.png
MRI画像とclinical findingの報告は正直言ってかなりまとまりが悪く、あまり意味のある結論が導けないので少しばかり省きます。特筆すべきは「Regression analysisの結果、glenoid labral tearとbursal effusion/hypertrophyがMRIで確認された場合、その肩の機能は著しく低い」というところくらいなんですが、うーん、でもこれにしたってこの発見のどこに臨床的価値があるのか…。
b0112009_06095032.png
USとPhysical Examの関係性もテーブルに示されています…が、前述したようにこれらの診断がそもそも真のGold Standardによって示されたものではないので、この表のappreciateの仕方が私にはさっぱりよくわかりません。Neer、Hawkins-KennedyやSpeed'sに頼るより、USのほうがずっと正確だよってことが言いたいのかもしれませんが、私としては「そりゃーそうでしょう、USのほうが劣っていたら困るわい」という感じです。

途中まで丁寧に作られていただけに、結果のプレゼンの仕方と分析に仕方が非常に雑に感じる、もったいない研究です。コストや手軽さから考えて、USのほうがMRIよりも現実的な場合が臨床的には圧倒的に多いかと思うのですが、この研究結果を見る限りでは「Biceps tendon pathologiesとRCの完全断裂を見るのでなければ、USよりもMRIのほうが圧倒的に正確である」…つまり、USはMRIの代わりには現段階で成りえない、というのが私の出す結論です。現在のテクノロジーを持ってしても同じことが言えるかどうかは疑問ですけれど…。

[PR]

  # by supersy | 2017-04-09 16:20 | Athletic Training | Comments(0)

6月17・18日にEBP講習を東京で開催します!

この夏の帰国日程がやっと最終決定しそうです。今回の帰国中もあれこれ色々と忙しくなりそうですが、もちろん個人EBP講習も今まで通りやりますよー!ということで、東京EBP講習の告知です。
b0112009_11485376.jpg
エビデンスに基づく医療とか実践(Evidence-Based Practice, EBP)ってよく聞くけど結局どういうことなの?今まで分かった顔して頷いてきたけど、なんだかよくわからない、ちょっと人には聞きづらい、でも自分ひとりで勉強するのもなかなかハードルが高い…。「エビデンスという言葉が苦手」と感じている人にこそ参加してほしいと考えて作った講習がこのEBP講習です。エビデンスの基礎を学ぶのはもちろん、このEBP講習の焦点は文献からいかに必要なエビデンスを抜き出し、理解するか、そしてその上でどう現場に活かしていくか(個人的にはこれができなきゃ意味がないと思います)の練習をするところにあります。診断(評価)編はシステマティックレビューやメタ分析論文を中心に『いかに英語を読まずに情報を抜き取るか』を、治療介入編はRCTを『読みながらいかに効率よく、単語を選んで情報を抜き出していくか』、そして予防編はその両方を混ぜながらスポーツ現場で活かせるトピックを読み解きます。

今までに参加してくださった方の中から、エビデンスって思ったより簡単なんだ、楽しいものなんだ!という感想を今のところ多くいただいています(ふふふ…そうです、私は論文を読んでムフフとなれる仲間を増やそうとしているんです)。EBP初心者として来た方に、EBP中級者として帰っていただくのが目標です。

今回も主催は高橋さんにお願いしています。お申し込みはGuardians Athletic Training & Therapyのウェブサイト上のこちらから。

<講習日時>
2017年6月17日(土)
18:15pm-21:30pm エビデンスに基づく予防医学: 基本から応用まで

2017年6月18日(日)
9:15am-12:30pm エビデンスに基づくスポーツ傷害評価: 基本から応用まで
12:30pm-13:15pm 昼食(各自)
13:15pm-16:30pm エビデンスに基づく治療介入: 基本から応用まで

…の、3部構成でお送りします。参加はお好きなコースひとつだけでも、2つでも3つ全てでも可能です(複数講習参加する場合は、お手数ですがリンク先から各イベントひとつずつお申し込みください)。複数参加される方は前回から導入した『セット割引』が適応、そして『学生割引』システムも健在です。今まで同様、参加資格の指定は何もありません。学んだるでェ―という気持ちだけ持ってきてくだされば。学生さんも大歓迎です!ATCのクレデンシャルをお持ちの方には、各コースEBP CEUが3つきます。3つ全て受講すれば3 x 3 = 9 EBP CEUsです。

<会場>
たましんRISURUホール(立川市市民会館)
〒190-0022 東京都立川市錦町3-3-20
   JR中央線立川駅南口より、徒歩13分
   JR南武線西国立駅より、徒歩7分
   多摩モノレール立川南駅より、立川南通りを直進、徒歩12分

<定員> 90名

<受講料> 
  一般 1コース 9,000円
     2コース 16,200円 (10% off - 1,800円引き)
     3コース 22,950円 (15% off - 4,050円引き)
  学生 1コース 8,100円 (10% off - 900円引き)
     2コース 14,400円 (20% off - 3,600円引き)
     3コース 20,250円 (25% off - 6,750円引き)
     *現役大学・専門学校生(国内外不問)さん対象。申込後に学生証の提示が必要です、
      詳しくはリンク先の説明をお読みください

より多くの皆様にお会いできるのを楽しみにしております!セミナーの内容に関して質問があればここのコメントか私に直接ご連絡ください。会場、参加費など運営に関しての質問は高橋まで(tdtakahashi@guardiansatt.com)お願いいたします。

[PR]

  # by supersy | 2017-03-30 21:30 | Athletic Training | Comments(0)

PRI Vision in St Paul, MN。

PRI理念に対して「人間をパターンに当てはめること、人間にラベルを張る行為は人を無力化する行為である」という批判を目にしたことがあります。Labelingは人の弱みを可視化、不必要に強大化するという論理は心理学をかじったものとしてよくわかりますが、患者が何者なのかをidentifyせずに治療を開始することはできませんし(そんな闇鍋を差し出すような医療はプロとして提供すべきではありません)、症状に名前を付ける=診断という行為そのものにLabelingという要素が入ることはどうしても避けられません。加えて、(PRIを代表してこの文章を書くつもりはないのであくまで私の個人的な考えとさせていただくとして)私が信じていることに「我々の動的、感覚的input/outputは神経シグナルの伝達によってcarry outされており、これらの神経系の発火はパターン化されていればいるほど効率が良くなる」というものがあります。
b0112009_09354303.jpg
皆さん「けものみち」という言葉を聞いたことがありますよね?元々は道もない、鬱蒼と茂った森が、獣が一度、二度と通るにつれて徐々に道になっていく。そのうち植物がなぎ倒され、地面が踏み固められ、見通しもよくなって、獣はその道しか通らなくなることでしょう。人間の神経回路にも同じことが言えます。例えば、椅子から立ち上がる、シャツを着る、靴を履く、歯を磨く、車に乗り込みエンジンをかける…こういった日常的に繰り返される行為は自分の身体の中に深く習慣として徐々に根付き、いちいち毎回個々の関節を何度内旋、外転、屈曲して…おっといきすぎた…などと細かくfeedbackメカニズムを使って慎重に実行しなくても、feedforwardメカニズムを介してほぼ自動的に勝手に身体のほうが動いてくれるようになります。神経回路の発火がプログラミング化される、同じ発火を繰り返すうちに神経のけものみちが作られる…これがPRIのいう「パターン化」された状態だと私は理解しています。
b0112009_10530492.png
物理学で皆さんが習ったように、世の中のものは最も抵抗が少なく、最小の労力と最短の時間で進める道を自動的に選択する常があります。電気や光がいい例で、人間の神経回路も例外ではありません。そういう意味では、パターン化そのもの(=最小に見える労力で目的を達成するための好みの神経発火回路が存在するということ、つまり「習慣」「癖」があるということ)自体は全く問題ではありませんよね。問題なのは、一本しかないけものみちが深く深く掘り下げられてしまい、そこからハマって出られなくなってしまった状態、そして他のものを選ぶ選択肢が全く閉ざされてしまった状態です。これは、以前にAvailabilityとVariabilityについて書いた記事 でも言及しましたが、状況に合わせて複数の選択肢の中から(=availabilityがある)適切なけものみちを選び、好きに行き来できるような状態を作る(=variability)のが(別にPRIに限ったわけではなく、どんなdisciplineでも)治療の最終目標であるべきだと私は考えています。

患者さんと相対し、この人は一体いくつのどんなけものみちを持っているのか?その中からどれを選びがちという好み・癖があるのか?それらの選択肢は健康的か?そうでない場合、異なるcontextで必要に迫られれば他のけものみちを選ぶ能力はあるのか?そんなことを診断していくのがPRIの診断アルゴリズムです。患者を無力化しようとしているわけではなく、どのけものみちをいったん通行止めにして、新しいこっちのけものみちにも導いてみようかしら?と色々プランニングするための欠かせぬ一歩だと私は理解していますし、それを患者に分かる言葉で説明する義務も私にあるとも感じています。もしそういったステップを全て無視して「L AIC, R BCパターンですね」とだけ言って患者を脅かし、混乱させ、どや顔をしているようなセラピストがいるとしたら、そんなクリニシャンはPRIの基礎理念どころか医療というものを全く理解していないことになると思います。医療は相手をいたぶるドッヂボールではない、キャッチボールのはずですから。我々と共にPRI講習を受講してくださった勤勉な方々がそういう勘違いをしているとは思えませんけれども。



なぜこんなことを今更書いているかというと、今週末はミネソタはSt Paulに来ており、Postural-Vision Integrationの講習に参加しているからです。この講習では、いかに視覚が全ての感覚の中で支配的なものであるか(脳が処理する感覚情報の70%は視覚というのだから驚き!)、歩行の一つひとつのphaseに、どう視覚情報が関わってくるか、視覚が他のシステムを上書きして感覚全般をdominateしてしまっている患者にどういった介入ができるのか…ということを学びます。つまり、一定の視覚情報に頼り、それによって作られたけものみちしか通らない人への治療法ってことですねー。
b0112009_12085737.png
PRI創立者のRonと眼科医のHeidiのダブル講師というとても豪華な講師陣で、受講者にはPRIのベテランも他の眼科医やVestibular Therapistも入り乱れてわいわいやりながら、ものすごーく有意義な時間が過ごせました。ひゃー、めちゃめちゃ楽しかった。私は眼科専門ではないので、眼に特化したこの講習は知識的に準備不足な気がする、まだ時期尚早なのでは…という不安感と、スケジュール的になかなか取れない(年に4回くらいしか開催されない)のとでもうここずっと3年くらい受講実現に踏み切れずにいたのです。いやー、でも待った甲斐はあったかも。私自身のPRI基盤がしっかりしたお陰で今回の内容を取りこぼしせず全て吸収できた気がするし、Visionの講習そのものも洗練されてきてここは教える、ここは教えないというバランスが丁度よかった。
b0112009_12125084.jpg
Focal vision(中心視野)ではなくperipheral vision (周辺視野)に注目し、右と左、どっちの周辺視野をどう広げるかというディスカッション、そしてそれをgaitに絡めて解いていくプロセスは非常に面白かったです。歩きながら、周辺視野を使ってobjectを(視覚的に)掴んでぐっと一歩一歩前に進んでいく(peripheral contactからのperipheral optic flow)という感覚は説明されてみてなるほど!と膝を打ってしまいました。歩行に伴い周辺視界が前から後ろへ、右から左へ、左から右へ流れること…現代ではそんな当たり前のことがトレッドミルやスマートフォンなどの普及でどんどん減ってきているのかな。Sitting is smoking, という記事を昔どこかで目にしたけど、Gazing (at iPhone, tablet) is smoking、ということも言えるかもしれませんね。
b0112009_12150263.jpg
「眼球運動は頭部と頸部の運動とは独立して起こるべきものである」「Extraocular muscles(EOM↑)はその小さく柔らかい眼球を動かすのに必要な300倍の力を有している。つまり、EOMはCraniumに対して眼球を動かす(globe on orbit, GO)だけではなく、眼球に対してCraniumも動かす(orbit on globe, OG)ものであると考えるほうが理にかなっている」ってとこがめちゃめちゃ面白かったです。Visionをクリアにシャープにしていこう、というのが眼科医の一般的なアプローチだと思うんですけど、患者に慣れ親しんだけものみちを「深く掘り下げすぎない」「いったん忘れてもらう」ために、visual disturbance(視覚的障害)を作り出して通いなれた道を少しの間封鎖し、その間に新しいけものみちを見つけ、探検・散策してもらう、というアプローチは実にPRI的眼科医、つまりHeidiっぽいかと思います(笑)。RonにHeidi、楽しい講義をありがとー!
b0112009_07403522.jpg



ちなみに少し観光をする時間もあったので、ホテル近くのComo Park Zoo & Conservatoryに足を運んできました。
b0112009_12244050.jpg
b0112009_12250767.jpg
b0112009_12284330.jpg
b0112009_12262160.jpg
足元に雪も残っていて、湖も凍っていてそりゃー寒かったけど、少し日常を忘れてゆっくりできてよかった。さて、これからテキサスへ帰ります。学期後半がはじまるー。

[PR]

  # by supersy | 2017-03-19 17:45 | PRI | Comments(0)

Tuning Fork (音叉)で骨折鑑別できる?最新システマティックレビューまとめ。

音叉と聴診器で骨折判別?(2014年4月30日)
続・音叉と聴診器で骨折判別?(2014年6月16日)

3年ほど前に音叉を使った骨折鑑別を記事にしました(↑)が、最近こんなシステマティックレビュー論文(↓)1を見つけたのでまとめてみます。3年前(2014年)にジャーナル掲載されたもので、ものすごく新しいってわけじゃないんですが、これ以降まだ他のシステマティックレビューやMeta-analysisが発表されていないので現時点では「最新」です。ちなみにこれはOpen Accessなのでどなたでも無料で読めますよー、下にリンク張っておきます。
b0112009_02365188.png
さて、以前も書いたように、スポーツの現場では「これって骨折れてるかな?それとも軟部組織のケガかな?」と判断に迷うことはよくあります。骨折という診断を下すためのX-rayはそんなに高価な画像診断ではありませんし、比較的簡単にアメリカでも行えますけど、それでもやはりradiation exposureを最低限に抑えたり、不要な画像診断は省くという判断を積極的におこなって医療費削減に努めるのは医療従事者の義務だと思うわけです。そのためにスポーツの現場で我々ATができることがあれば、そんな知識・スキル獲得に尽力すべきだという事実にゃ変わりありません。その手段としての骨折鑑別のためのTuning Fork Test(音叉テスト)はもう60年も前から使われているそうですよ。60年ってすごいな。
b0112009_03315843.png
最もシンプルに使われるTuning Fork Test(上写真左)の例としては、1) 骨折の疑いがある箇所に直接("directly over")、もしくは僅かに近位の箇所("closely proximal to the suspected fracture site")にVibrating tuning forkを置き、痛みの有無を診る。もしくは、2) 骨折の疑いのある骨の遠位骨隆起("a bony prominence distal to the fracture site")にVibrating tuning forkを置き、痛みの有無を診る…というもの(私は正直なところ(2)しかほぼ使いませんね。受傷直後に(1)やるとfalse positiveが出ることが多いような気がするんだよな)。それから、以前に紹介した、3) 聴診器を組み合わせて音のabsence/diminish度を診る、Barford Test(上写真右)というのがありますね。

今回のシステマティックレビューでは、患者の年齢やclinical setting (病院のER vs 大学のスポーツクリニック)を問わず、とにかく2012年の11月までに発表された論文で、Tuning forkを骨折鑑別に使ったものをreview。Case seriesやcase-control studies, narrative reviewは除外対象で、cross-referenceチェックもおこなわれています。2人のindependent reviewerが1) タイトルとアブストラクト、 2) Full Textとを二段階でスクリーンし、最終的にレビューに含まれたのは6つの論文(総患者数は329人、決して多くはない数字です)。

まずは、Barford Testを検証した2つの論文の詳細がこちら。
Bache & Cross (1984)
 Setting: 病院のER
 対象被験者: 100人の大腿骨折疑いの患者(平均79歳)
 比較テスト: X-ray

Moore (2009)
 Setting: 大学のAthletics/Orthopedic Clinic
 対象被験者: 37人の7日以内に受傷した骨折疑いの患者(骨問わず, 年齢幅 7-60歳)
 比較テスト: X-ray

このふたつの研究だけでもかなりheterogeneityがあるのが分かりますね…大腿骨骨折は高齢者に多い長期的なdisabilityに繋がる大怪我だし、「見逃してはいけない」危機感がその他の骨折とはレベルが違うと個人的には思います。Mooreの研究2も何度も読んだんで覚えてるんですけど、こっちもこっちで年齢・骨バラバラ(上肢下肢)でごっちゃまぜの研究ですからねー。この二つを混ぜて解釈してしまっていいものか甚だ疑問です。

それから「骨の振動で痛みがあるか診ましょう」といういわゆるTuning Fork Testを検証した研究4つがこちら。
Lesho (1997)
 Setting: 軍隊のメディカルセンター
 対象被験者: 52人の脛骨疲労骨折疑いの訓練生・隊員(平均25歳)
 比較テスト: Bone scan

Kazemi & Roscoe (2000)
 Setting: 病院のER
 対象被験者: 46人の10日以内に受傷した骨折疑いの患者(骨問わず、平均30歳)
 比較テスト: Bone scan

Dissmann & Han (2006)
 Setting: 病院のER
 対象被験者: 足首内反メカニズムで受傷、OARが陽性だった患者49人(年齢幅 12-84歳)
 比較テスト: X-ray

Wilder et al (2009)
 Setting: Runners Clinic
 対象被験者: 足部を含む下肢に疲労骨折疑いのある患者45人(平均31歳)
 比較テスト: X-ray and Bone scan

これも…被験者層、年齢幅は高校・大学・プロのアスリートを相手に仕事している方からしたら(平均79歳なんかのさっきの研究よりは)現場のそれと近い、加えて、骨は下肢に集中している(=現場でも下肢の骨折疑いのほうが多いので)ところはよりapplicableかなとは思うのですが、最低でも疲労骨折か急性の骨折かは区別したほうが良かったんじゃないですかね。サブカテゴリー作ってわけて分析したほうが良かったんじゃ…研究が少なすぎるから、そういうことをすると意味あるconclusionを引っ張ってきにくいという気持ちはわかりますけど。あとDissmann & Hanの記事3は前にもまとめました(The Ottawa Ankle Rulesより優れたものは出てきたか?骨折鑑別・最新エビデンスのReview)が、この論文・結果の臨床的価値は「Ottawa Ankle Rulesのちょい足しspecial test」としてのものであり、独立したTuning Fork Testのそれとは解釈しないほうがいいのではと思います(足首内反メカニズムでOARが陽性、という縛りはgeneralizeするには厳しすぎるのでは)。

比較テストは急性骨折はX-ray、疲労骨折はBone scanというのは十分適切だと思います(むしろ急性骨折患者46人全員にBone scan使ったKazemi & Roscoe4恐るべし)。QUADAS-2を使ってそれぞれの研究の質を推し量った、という記述はあるんですが、それをまとめた表などは記載されていませんね、妙ですね。
b0112009_01363658.png
さて、このシステマティックレビューの結果(Table 3)をもとにこんな表を作り直してみました。緑色の部分は私が個人的に「これはあったほうがいいんじゃないの」と思って元の研究論文を見直したりなどして、足した情報です。オレンジ色の部分は「95%CIから見ても優秀といっていい数字」と私が判断したものを表します。それぞれの研究の被験者は決して多くなかったので、95%CI幅は一概に広い印象です。Point valueでは優秀なものがいくつも見られます。
b0112009_01493645.png
それでは、個人的な考察です。95%CI幅は広いものもありますが、総じてSensitivity(感度)は75-92%と安定してなかり高い数字が並んでいます。-LRの値はまだ少し理想的というには高めですが、それでも総合的にTuning Forkを使った骨折判別は、rule out (除外)する力はsそこそこ強いということができそうです。記事から抜粋した上のFigure 2(↑)を見てみると、Sensitivityが中でも低め(70%代)な研究はどちらも疲労骨折を検証したもの5,6であることもわかります。急性の骨折には、コンスタントに80%以上出せています。

反してSpecificity(特異度)はというと、18-94%とかなりばらつきがあります。95%CI幅から見て優秀なもの(Moore2やDissiman & Han3)もないことはないんですが、逆に95%CI幅を考慮すると決定的にダメなもの(Bache & Cross,7 Wilder et al6)もあります。+LRも同様といったところでしょうか。つまるところ、Tuning Forkを使ったテストが仮に陽性でも、必ずしも毎回骨折があるとは限らない=rule in (確定)する力は弱い、ということになりますね。確定する力が弱いのだから、Diagnostic OR (=陽性だった場合に実際に骨折がある可能性が何倍に跳ね上がるか)もまちまちなのは当然のことです。

このシステマティックレビューの結果では「異なる周波数でも診断力に大差はなし」と書かれています。うーん、これを「結論」にしてしまうにはまだまだ研究絶対数が足りないように思いますね。考察で書かれていて確かに!と頷いたのが、「いつこのテストを使うかというタイミングも問題なのでは」というところ。骨折受傷から日にちが経ちすぎていると仮骨形成(callus formation)が始まってしまい、Barford TestもTuning Forkテストも偽陰性が生まれやすいと推測されます(実証はされていません)。これを考慮すると「Tuning Forkを使ったテストをするのであれば、何日以内に行わなければならない」的なガイドラインも将来生まれるべきなのかもしれませんね。あとは骨折のタイプにも影響される、というのはMoore2もその論文で論じていたところです。Transverse Fractureの場合はキレイに陽性が出やすいけど、Avulsion Fractureでは偽陰性になりやすい、なんて書かれていましたっけ。Hairline Fractureはどうなんだろ?骨折のタイプに関しては、このシステマティックレビューからは「Tuning Forkを使ったテストは疲労骨折よりは急性骨折のほうが有効である」ということは言えるかと思います。

最後に、ちょっと意外だったんですけどTuning Fork TestのInter-rater Reliabilityって意外と低いんですって。どれくらい低いのかは具体的には示されておらず、その論文のfull-textが3月17日現在私も手元に所有できていないので詳しくはよくわからないんですが、このシンプルに見えるテストもスタンダード化、もしくはトレーニングが必要だってことなのかもしれませんね。例えば音叉をどこに置くのかという場所決め、振動の強さ、何をもって「陽性」と判断するかの基準(激しい痛みなのか、軽い痛みや違和感でもいいのか)、受傷からのタイミング、それから掘り返すようですけど周波数の違いとか、そういったvariableもいじりながら研究を重ね、最適な評価テストプロトコルを決めていく余地がまだまだありそうです。古い研究が多かったしなー、これからもっと新しいの出ないかしら。

まーつまり超短くまとめると、除外できるが、確定はできない。疲労骨折よりは、急性骨折に有効。完璧ではないし単独で使うべきではないが、やはりcost-effectiveな、現場では有効な手段といってもいい…ってことかな。ほかの手段と合わせて使うことで正確性が上がるのはDissmann & Han3 の研究からも明らかなので、私はこれからも現場で使い続けていきたいと思います。陽性結果は慎重に判断する感じで。
b0112009_02162534.png
最後の最後に。これはおまけなんですが、Journal of Athletic TrainingではこのシステマティックレビューをNarrativeで解説したコメンタリー的な文章(↑)が2016年に掲載されました。7 内容としては私が趣味でやっているブログに非常に近いです、「この論文ではこんなことが書かれています、こういう風に解釈できますね」…という感じでまろやかに論文の読み解きをしているわけです。もちろん口調は私の文章よりもっとずっと論文調で、きっちりきれいに書かれていますけど。

あの、個人的な感覚なのであれなんですけど、こういう「論文を読めない貴方の代わりに私たちが皆さんにわかりやすいよう解説しますね」っていう記事をPeer-reviewed Journalに載っけてしまうのが恥ずかしいです。個人のブログならわかります、でもプロのジャーナルに載せてしまうって「一般的なアメリカのATはこういう面白いシステマティックレビューには自力でたどり着かないだろうし、たどり着いたところで読んでもわからないだろうから、噛み砕いて説明しておくね」と自ら言っているようで…。しかも、「読者のレベルに合わせての配慮」なのか、このコメンタリーでは95%CIに関する解説は何もしていない。Point valueのみのディスカッションです。

もしかしたら、JATのエディターさんたちが「書いてあることがさっぱりわからない」などと読者であるATから批判を受け、臨床と研究のギャップを消すべく、こういった論文を積極的に掲載しようとしているのかもしれません。この論文の筆者さんたちも「こんなに面白い論文、もっと多くの人に見てもらいたい」という気持ちでこれを書いたのでしょう。そういった方々の努力を批判するわけではないんですが、それにしたって他の、例えば医師やPTなどのジャーナルで「読みやすいように書き直した」噛み砕き論文が掲載されるなんて私は見たことがない(もしあるとしたら私の不勉強です、すみません)ので、ATのエビデンス理解力の低さが露呈しているようで情けない、恥ずかしいと感じてしまいます。正しいエビデンスに基づく医療を実践できるようなATがもっともっと増え、自主的に様々な論文に食らいついて理解しようとする…そんな姿こそが未来のスタンダードになればいいなぁと思ってます。ATの皆さん、もっと論文読みましょー、これってああいうこと?こういうこと?と頭をひねりながら読み解こうとするその過程こそがEBPなんです。慣れてきたら楽しいですよー。

1. Mugunthan K, Doust J, Kurz B, Glasziou P. Is there sufficient evidence for tuning fork tests in diagnosing fractures? A systematic review. BMJ Open. 2014;4(8):e005238. doi: 10.1136/bmjopen-2014-005238.
2. Moore MB. The use of a tuning fork and stethoscope to identify fractures. J Athl Train. 2009;44:272–274.
3. Dissmann PD, Han KH. The tuning fork test: a useful tool for improving specificity in “Ottawa positive”’ patients after ankle inversion injury. Emerg Med J. 2006;23:788–790.
4. Kazemi M, Roscoe MW. Is the tuning fork test a reliable tool in detecting acute simple fractures? Int Sports J. 2000;4:1–8.
5. Lesho EP. Can tuning forks replace bone scans for identification of tibial stress fractures? Mil Med. 1997;162:802–803.
6. Wilder RP, Vincent HK, Stewart J, et al. Clinical use of tuning forks to identify running-related stress fractures. Athl Train Sports Health Care. 2009;1:12–18.
7. Bache JB, Cross AB. The Barford test. A useful diagnostic sign in fractures of the femoral neck. Practitioner. 1984;228:305–308.
8. Toney CM, Games KE, Winkelmann ZK, Eberman LE. Using tuning-fork tests in diagnosing fractures. J Athl Train. 2016;51(6):498-499. doi: 10.4085/1062-6050-51.7.06.

[PR]

  # by supersy | 2017-03-17 12:30 | Athletic Training | Comments(0)

チーム医療の実践のために知っておくべきこと、その3。

b0112009_06413030.png
#7 Ambrose-Miller & Ashcroft, 2016
Social workerさんがIPPをしていく上で直面する問題点を挙げた論文。冒頭でIPPを成功させるカギとしてこんなことが挙げられています。
- Organizational Structure
組織の中にcollaborative leadershipがあること、そして組織の文化そのものにコラボをしましょうね、という文化や雰囲気があるのは大事で、そのためのコミュニケーション方法が確立されていることも大事である…としたあとで、「colocationも大事」と述べられています。Colocationという単語を初めて耳にしたので、なんじゃら、と思って調べてみたら、別々の団体、様々な職種の人たちが同じ施設に勤めている環境を意味するようです。なるほど、physicallyに一緒のところにいるって確かに強いですよねー。
- Professional Identity and Scope of Practice
プロとしてのアイデンティティー…これは他の文献でも言われていることですが、面白い表現だなぁと思ったのが"social workerはinterdisciplinary teamの中で効果的に機能しようと思ったらその役割をnegotiateしなきゃいけない"というところですかね。役割を「定義」するのではなく「交渉」するというところが面白い。「私こういうことが得意なんだけどこれやってもいい?」「これはあなたがやるの?それとも私やろうか?」という感じでしょうか。これは、social workerに限らず、全てのプロがすべきなんだろうなと解釈しました。
- Power Differentials
医療界にはovert (あからさま…i.e. 金銭的優位)とcovert (一見目につきにくい…i.e. 何かを決める際の発言力の違い)なpower differentials (権力格差)があり、これによってIPPが促進されることも抑制されることもある…とのこと。やはりその中心にいる(=最も権力が高い)ことが多いのはdoctor (医師)で、この階級制度を平らにしようと思ったら一番影響を受ける(=権利を手放さなければならない)のは医師だ、と書かれています。逆に言うと、その変化を医師が恐れていては本当の意味でのIPPは実現できないでしょうね。

さてさて、研究はNational Conferenceの間の2日間に行われたようで、自主的に参加の意思を示した11人のSocial workerに携わっている学会参加者(educators, practitioners, researchers, studentsのごちゃまぜ)に対してsemi-structured focus group (90分のインタビュー)をおこない、その結果をqualitative studyとしてまとめています。IPPのbarrierとは?Facilitatorとは?と問うたわけです。ここまでの突っ込みどころとしては1) 11人という少ない人数に対して、あまりに様々な背景(教育、臨床、研究、学生…)を集めすぎたのではないか?data saturationに達せるとは到底思えないのだけど…; 2) 90分というインタビューの長さにはまったく幅が無いけれど、11人全てきっちり90分インタビューしたとは考えにくい; 3) インタビュー内容は録音されておらず、研究者はノートを取りながらまとめたのみ。90分正確なノートを取り続けるのは不可能に近いと思うのが…; 4) member checkingやその他のtrustworthinessを高めるテクニックは一切使われず。信憑性は低い…というところでしょうか。

でてきた6つのテーマは…他の研究ともかぶっているものがかなり多くて、特に目新しいと感じたものはないんですが、1) Collaborative Culture…平等主義と「コラボするぞ」って雰囲気が組織内にあることが大事。そして、こういうのは気を抜くとすぐになくなってしまうものでもあるので、大事に育む(nurturance)という精神が大事; 2) Self-identify…患者を個人として、そして社会の中の一部として見つめる…それこそがSocial Workerの仕事である、と自覚すること。そしてSocial workerという仕事はそもそも曖昧な役割を担うものである、と自覚すること。仕事の中にFlexibilityがあるところが難しいところでもあり、面白いところでもある、という理解すること; 3) Role Clarification…他人の仕事を理解し、他人に仕事を理解してもらう。お互いから学び合うには、受けてきた教育(IPE)とColocationがやはり大事; 4) Decision Making…医者が決めてしまうのではなく、チームとして物事を決める; 5) Communication…これは、もういいですよね?こまめに、形態化して行う。意外なことにElectric medical recordsには問題が多いと感じているsocial workerが多いようです; 6) Power Dynamics…医師が権力を持ちすぎていて、social workerの発言が打ち消されることがある。

やはり、「お互いの役割と領域をしっかり理解した上で、その壁を崩してfluidityを持って仕事をする」というのがカギのようです。チームとして物事を決めていく、ということも最後にもう一度強調されているのですが、これが実現するには医師がチームの他のメンバーを信頼し、権限を共有する勇気を持たないと始まらないように思います。
b0112009_06463610.png
#8 Theberge, 2007
今までもう長いことオーソドックスな医療のみが主流だったのが、近年になってComplementary and Alternative Medicine (CAM、代替医療)が受け入れられるようになり、医療に幅が出てきました。特にスポーツ医療の分野はその傾向が強く、鍼灸師やマッサージセラピストなど、様々なプロが入り混じるようになってきています。この論文では、その代替医療の筆頭であるChiropracticがスポーツ医療の現場でどのように機能しているかまとめたものです。

トップレベルのスポーツ現場(オリンピックなどを含む)で勤務経験のある35人の医療従事者(11人のphysicians, 10人のphysiotherapists, 6人のathletic therapists, 8人のchiropractors)に対して個別にinterviewを行い、それを録音、文字起こししてcodingしましたとさ。

スポーツ医療の目的は、リスクを見極め、最小化して、その上で選手の持つ最高のポテンシャルをパフォーマンスとして引き出すこと。この中心にいるべきは間違いなくathleteであり、athlete-centeredのケアを提供するということは選手が欲しいというものを提供することでもあります。医療スタッフ陣も、オリンピック協会からも「選手が欲しがるものを提供しろ」と直接プレッシャーをかけられたりすることがあるんだそうです。ひえー。逆に言えばこうして求められてpopularになってきたのがカイロプラクターということなんですよね。しかし、同時に医療チームの他のメンバーが、「(カイロよりも)もっといい治療があるのに…」と感じていたりなんかすると、カイロを快く思わない他の医療従事者との間に溝が出来ていたりもするそうです。

スポーツ医療チーム内のコラボはもちろん超重要。オリンピックレベルともなると、その世界の専門家が集結するわけですから、お互いからの学び合いを「貴重なもの」と感じているプロが多いようです。こういったコラボが順調に進むためにカギとなるのは、やはりプロとしての境界線とcomplementarity(相補性)のバランス、そして「最終決定権は医師にある」という暗黙の了解なんだそうな。オリンピックとかだと、やっぱり責任の出どころなどははっきりしていないといけませんしね。

カイロプラクターにとっての障壁とは?というセクションでは「どの職業でもチームとしての枠で上手く働けない性格の人というのはいるけど、カイロはその中でも特にチームの一員として働くのが不得手」と多くの被験者が回答しています。もちろん「人による」のでしょうけれど、普段のpracticeが基本ソロで、全部自分で決められるから、チーム内でも同じようにやってしまう人が多いという背景があるようです。カイロからしてみると、「我々はprimary health care provider、診断も治療もreferもする。Manipulationしかしない人、という認識は侮辱的だ」という意見だし、医師や他のセラピストは「チーム医療でカイロに求められているのはあくまでManipulation」と考えている…ここらへんに大きな認識のズレがあるようです。
それから、「あくまでカイロがここにいるのは選手が望んだことだから」という認識も医療チーム内ではあるようです。「他のセラピストとやることは被っていたりもするし、どうしてもチーム医療のメンバーでなくてはならない、と我々が感じているというよりは、やはり選手に求められているからいる」ものだと考えている人もいると。「本当にもう上手くいっている、医師とPT、AT、Massage Therapistのチームが既にあったとして、そこにカイロを足すことがマイナスになることもある。上手くやれていたバランスが崩れる」という厳しい医師の意見も紹介されています。

カイロプラクターを取り巻く論争、という章ではカイロの(誰が何と言おうと)一番の武器であるmanipulationが、「quick, not long-lasting fix」というところに引っかかる医療従事者も多い、と論じられています。「いや確かに直後のパフォーマンスは良くなるかもしれない、選手も精神的に満足かも知れないけど、やっぱり僕はもっと根本的な治療も組み込まなきゃダメだと思うんだ。試合の場ではそういうことが難しいのは分かるけど…」というPTや、「ぽきっとやってもらうことは『普通』になった選手は、自分独りではそのズレた『普通』を見つけられなくなり、カイロプラクターにぼきぼき「やり続けて」もらわなければ『普通』になれなくなる。これはdependent(依存)と呼ぶべきだろう」という医師のコメントも。これに対して興味深いのが、とあるカイロプラクターの「大事な試合の前には派手にぼきっとはやらないよ、すごく軽いものだけ」というコメント。それに対して「そんなに『軽い』ものだったら生理的な効果はあるんですか?」とインタビュアーにつっこまれ、「試合前はフィジカルもだけどメンタルも大事。(生理的な効果はなくても)それによって気持ちが整えられれば損じゃないでしょう?」「手を置いて、信頼関係を築くことが大切」と答えた、という描写があります。うーん?こうなってくるとその前の医師の「依存性が生まれてくる」というコメントがさらに映えてきますね。自らのスキルや専門性を、ただの気持ちを整えるルーティーンの一部にすることに満足してしまうのってもったいなくないですか?せっかくそんな大事な場にいて、選手の身体を触れる立場にあるのに。他にも「最近のカイロプラクターはもっとholisticなことをしているよ。エクササイズを使うのが主流になってきてるし」というカイロによるコメントもありましたが、だったらエクササイズの専門家、PTさんに任せておけばよくない…?という疑問も湧きますね。カイロプラクターがカイロプラクターたるそのニッチを、カイロプラクター自身が言葉にして説明できないのは最大の弱点かもしれません。この章は、他にもカイロ対他医療従事者のかなりヒートアップした意見が事細かに綴られています。詳細はどなたかの気分を害すと嫌なので書かないでおきますが、気になる方はfull textを読んでみてくださいな。

プロとしての妥当性、という最後のまとめでは、「それでもスポーツ医療チームに招かれるカイロは、manual therapistとしての役割が望まれていること、つまりreduced scope of practiceで働くことが求められているということを理解した上で参加すべき。そして、他の医療従事者は、カイロプラクティックのadjustmentが信頼と自信によって確立されており、placeboに深く関わる効果がある、ということを認め、カイロをチームへ受け入れるべきだ」と述べられています。私も過去8年程、大学勤務中に数名のカイロさんと仕事しましたけど、その経験からでいうと、陽気でエネルギーに溢れていて仕事は一緒にしやすい方が多かったです。でもなんというか、個人的に、カイロさんと一緒に仕事をしていく上で一番苦労したのは、カイロさんの下へ送った選手の15%くらいが悪化して帰ってくるってところでしたね…。私の個人的な経験に基づく数字で言うと、25%くらいは「劇的に良くなる」、30%くらいは「多少良くなる」、30%ほどは「特に変わらない」で、15%は悪化、という感じでしたかね。総じて良くなる患者さんのほうが圧倒的に多いんですけど、私の中で「悪化」だけは絶対にダメだと思うんです。この選手、カイロさんに見せたいんだけど悪化したらどうしよう、明日試合だし…みたいな葛藤があると、やっぱり「自分で治療しよう」と思ってしまいます。あとは、うーん、時折教育的背景を疑問に思うことがあったというか…sprainとstrainみたいな基本的な用語をごっちゃにしてしまっていたり、Thomas TestとThompson Testを覚え間違えているとか、解剖学の知識が曖昧とか、そういうところを垣間見てしまうと同じ医療従事者として尊敬しにくくなるというのはありました。たまたま知識のupdateをしそびれていた分野、とか、そのカイロさんだけの問題だったのかもしれないけど。

チーム医療のメンバーになる、ということは、「他のメンバーにそれを貴方よりも上手くやる人がいたら、その役割は譲る」ということなんだろうと思います。例えば診断は医師もPTもATもカイロもみんなできますが、チーム医療を実践する場合、それの役割は医師が担うのが全うだ、と判断し、PT、AT、カイロが一歩引くのが「チーム医療」なんじゃないでしょうか。やっぱり一番最初の線引き、領域の定義がしっかりしており、それを全員が受け入れてからでないと、理想的なIPPの実践は難しいですね。
b0112009_06464999.png
#9 Pellatt, 2005
脊髄損傷は実に一人の人間の人生に多大な影響を及ぼす怪我。そのリハビリに、IPPのアプローチはうってつけなんじゃないの?現実はどんな感じなの?というのがこの研究。イギリスのとあるLarge spinal cord injury unitに勤務するInterprofessional Teamのメンバー(14人の看護師、5人の医師、3人のOT、5人のPhysiotherapist)にsemi-structuredなインタビュー。長さは30分から1時間程度で、テープ録音 & transcribeされ、そのあとcodingされました。Rigorの確立のためにreflexive approachは使われましたが、member checkingは行われず。うーむ。最低でも2つは何かした方がいいと思うんですけどね、rigorのために。

この研究の結果は面白かったです。一言に要約するなら「Knowing Paradox (知ってるつもりパラドックス)」とでも言いましょうかね。

●Overlapする役割
NurseとOT、PTとOT…他業種間の仕事内容のOverlapが多いというのはここまでの文献でも言われていることですが、今回の研究の参加者の中にはこれは「弱み」ではなく「強み」と感じている人が多かったそうです。お互いを補い合え、また同時に、同じことでも少し違う視点から見合えることでよりcomprehensiveなviewをつかめるというわけですね。

●わかってもらえない
しかし、overlapしない役割も多くあります。インタビューされた医療従事者はそれぞれ『もう、他の皆ってば私の職業が何なのか、どんなことができるのか十分にわかってくれていない!』と感じているというんですね。興味深いことに、NurseとOTは「私たちはもっとできることがあるのに、下に見られている。有効活用してもらえていない」、PTは「リハビリにおける自分の役割は他のプロよりも重要でhigh profileなのに、そこんところを周りが理解しきれていない。そんなことでイライラされてもなぁ…」。医師は「俺らってはそんなに何でも屋じゃないのに、どんなことにも完璧な知識を持ってると思われてる。そんなわけじゃないよー」…という、別々の理由で「わかってもらえていない」と不満を感じている、というのも実に興味深いです。

●でも私はわかっている
そんな反面、多くの医療従事者が『でも私は他の皆の仕事をよくわかってるもんね』と感じている、というのです。「自らを棚に上げ現象」ですよねぇ。

この論文の考察がまた面白いっす。なんか教科書みたいというか、個人の意見がかなり入っている気がするんですけど、self-fulfilling prophecyとでもいうんですかね、このKnowing Paradoxは「自信がなくてdecision-makingに入っていけない人がmisunderstood/underratedと感じがちなんじゃないか(=自信がなくて行動に踏み切れないことが、「大したことができない」と思われる原因を作ってしまっている)」、そして「自分はみんなのことを分かっている、という自信がある人はその自信ゆえにそれ以上他人を知ろうとしないからこそ、溝が広がってしまう」ということが原因なんじゃないか、と論じているんです。これは面白い考え方です。加えて、英語には"othering (他人化する、ヒトを自分とは異質のものであると認識する)"という言葉があるんですけど、NurseやOTは"self-othering (自らを他人とは違う、「どうせ私はPT/Doctorじゃないもんね」と区別)"する傾向にあるんじゃないんか、とも述べています。Doctor/PTがdominantな存在で、NurseやOTは自分らを「それに従う」存在と認識しているってことです。

Otheringをやめること、そして、「自分は他人を理解している」という認識を忘れ、真摯に他人を学ぶ姿勢がIPPの成功には大事なんじゃないかなっつーことですかね。
b0112009_06465461.png
#10 Semlyen et al., 1998
最後の論文です。Traumatic Brain Injuryのリハビリにmultidisciplinary rehabを取り入れて、そのアウトカムがどうだったかを2年間に渡って追ったUKの研究。古い論文なのだけど、とても気を使ってデザインしたんだろうなぁという心配りが感じられ、まだ研究のデザインなどに不慣れな人も読みやすいように丁寧に良く書かれている印象です。

Hunters Moor Regional Rehabilitation Centreでmultidisciplinary rehabを受けた患者(Hunters Moor Group、略してHM組; 33人、うち男性28人、女性5人、平均年齢36 ± 13歳)と他の施設で一般的な(single discipline approachの)リハビリを受けた患者(Other Rehabilitation Group、略してOR組; 18人、うち男性15人、女性3人、平均年齢30 ± 12歳)を対象に行った研究。Inclusion Criteriaはsevere traumatic head injuryを受傷してRegional Neurosciences Centre at Newcastle General Hospitalを受診した患者で、1) initial Glasgow Coma Scaleが最低でも6時間、≦8; 2) 16-65歳; 3) 家族・保護者がconsentを出せる状況; 4) 病院近辺に住んでいる; 5) surgically stableで受傷後4週間以内に退院できた人 (根拠は分からないけど、そこそこ細かくいいinclusion criteriaに見える。exclusion criteriaは明記されていないが、drug/alcohol misuseがあったり、神経系疾患が元々あった人は除外されている)。

上記の条件を満たした上で、病院から「(退院して)transferしてよし」と判断された状態でinterventionがスタート。で、患者さんが住んでいる地域と、Hunters Moorのベッドの空き状態に基づいてHunters Moorか別のlocal hospitalかに振り分けていったんだそうな(ランダム化はされていない、OR組はグループ内のheterogeneityを減らすためにせめてひとつの病院に送るべきだったのでは、グループの患者数が33人 vs 18人と約2倍の大きな差がある)。HM組の患者は毎日nusring care, physiotherapy, speech & language therapy, occupational therapy, clinical psychology, rehab medicine, counseling, social work inputという幅広い医療を提供されていた一方、OR組はinpatient, outpatient, home-basedなどで患者のgoalに最も合ったsingle disciplineのセラピーを受けていた(i.e. ひとりのphysiotherapistと週に一回一時間のみ、とか) (やはりリハビリ内容のバラツキが気になる。しかも、HM組は毎日リハビリで、OR組は週に一回一時間、とかなんだったら、仮に差があったとしてもリハビリ頻度の問題かもしれない。単純に比較するにはコントロールしきれていない要素が多い)。
b0112009_12524477.png
リハビリ開始前の脳損傷の程度などはグループ間の差はなかった、というけど、このテーブル2を見る限りだと統計的に有意でないながらもHM組の脳損傷の程度のほうが悪い傾向にあるのが分かります。加えて、HM組のほうがリハビリを始める前に著しく時間が経過していた (49.37 ± 29.62日 vs 17.94 ±13.60日, p < 0.001)ことが分かりますね。つまりoutcomeにはHM組のほうが不利だったんじゃないかなーと感じてしまいます。しかし、リハビリそのものの長さも、統計的に有意ではなかったとしながらも、平均201 ± 144.12日 vs 111.80 ± 175.17日というのはかなり差があるように見えます。HM組のほうがそもそも高い頻度でリハビリを受けていたんですよね…その上、期間までも長期にわたって受けていたのだとしたら、仮にHM組のoutcomeがOR組より著しく向上したとしても、単に(リハビリの内容以前に)長期間、高頻度でリハビリを受けていたからってだけかもしれません。うーん、ここはSDも大きいように感じますし、ちょっとグループ内個人差も大きいような。Control GroupにあたるOR組のリハビリがコントロールしきれなかったのはやっぱり痛い。

Functional Assessment (Barthel Index, Functional Independence Measure, Newcastle Independence Assessment Form-Research…いずれも患者の機能的・身体的independence性を計るmeasureである。それぞれのツールのvalidationやreliabilityなども言及されている。私の専門外なのでどれほど優れたものなのかはわからないけど、3つのpatient-based outcome measuresを1998年に使ったというのはすごい) は受傷後4週間、8週間、12週間、6ヶ月、12ヶ月、24ヶ月後に行われ、caregiverさんの精神状態もGeneral Health Questionnaire (GHQ-28)を使って12週間、6ヶ月と12ヶ月後にも計測されたそうです (脳損傷は家族や身近な人にも影響が出ます。これらの人たちの精神的ストレスを計ろうとしたところはすごい。怪我の社会的影響も見ようとしているわけだから。改めて、1998年の研究なんだけど、先見の明がありすぎるなぁと感嘆)。
b0112009_13155488.png
さて、上のテーブルは患者のindependenceの変化を「8週間時点から12週間時点」など特定期間の変化(つまり患者がどれだけ機能回復していったか)をまとめたもの。HM組のほうがスタートが悪かったということもあるんですが、OR組の機能回復が頭打ちになっているのに対し、HM組が計測毎に時間が一年二年と経過してもぐいぐい回復しているのがよくわかります。欲を言えばグループ間の比較のp valueも乗っけておいてほしかったんですけどー。
b0112009_13284635.png
caregiverさん(家族や一緒に住んでいる身近な介護している人)のpsychological well-beingはというと、上の4つのグラフを見ると結構明確かなと思います。点線がOR組、線がHM組。左から、「somatic symptom」、「anxiety/insomnia」、「social dysfunction」、「severe depression」のスコアになっていて、一年経過時にはそのどれでもHM組のcaregiverさんが精神的に良い状態にあるのが分かります。中でも「somatic symptom(p = 0.001)」と「social dysfunction(p = 0.057)」ではより顕著な差が見られました。

まとまると、2年間という比較的長いスパンで患者を追ってみると、multidisciplinary rehabilitationを受けた患者は(開始時点では機能状態はむしろ悪かったにも関わらず)、single-discipline rehabを受けた患者に比べ、リハビリ期間が終わっても著しい機能回復を続ける傾向にある。caregiverの精神的ストレスに関しては、受傷から一年するとmultidisciplinary approachを受けた患者のcaregiverはストレスが減るが、single-disciplinary approachの場合は増える傾向にある…ということがわかりました。いやー、OR組のリハビリがバラバラであること、頻度と期間も問題はかなり致命的ではあるとは思うんですが、くどいですけど1998年にこれだけの研究が成されていたというのが驚きです、感動です。かなり読み応えがありました。致命的なdesign flawを補って余りある先見の明のある、有意義な研究です。

さて、これでチーム医療シリーズは一区切りです。あと10論文、読まなければいけないのがあるのですが…他に勉強しなければいけないこともあるし、文献レビュ―はちょっと2週間ほど休憩しようかな。時間ができたらまたもどってきまーす。

[PR]

  # by supersy | 2017-03-15 23:30 | Athletic Training | Comments(0)

SEM SKIN - DESIGN by SEM EXE

AX