2011年12月22日 星期四

複本信度 (Alternate-Forms Reliability)

Alternate-Forms Reliability “a form of reliability in which alternate forms of the same test are given to a group of heterogeneous and representative subjects; scores for the two forms are then correlated.”

中文解釋:複本信度是指編制一份量表,稱為正本,然後編制另一份性質內容、難度均相同、但文字不同的題目,作為複本,並以正本與複本針對相同對象實施測量,求得兩份測量結果,計算其相關程度,了解測量工具的信度。

臨床意義:如驗證後正本與複本得到結果有高度一致性,則可運用於臨床上避免再測時個案產生學習或練習效應,以減少評估誤差。

判斷標準:計算相關係數 (: Pearson’s r)。相關係數介於0.25-0.5為尚可 (fair),介於0.5-0.75為中度至良好(moderate to good) ,大於0.75為良好至極佳(good to excellent)
Reference:
Stigler, Stephen M. Francis Galton's Account of the Invention of Correlation. Statistical Science, 1989, 4,73–79.
Benedict RH, Zgaljardic DJ. Practice effects during repeated administrations of memory tests with and without alternate forms. Journal of Clinical Experimental Neuropsychology. 1998, 20, 339-352.
研究設計:受試者在同一個時間,接受兩份測驗(一份為正本,另一份為複本)

參考文獻:
Schmidt KS, Mattis PJ, Adams J, Nestor P. Alternate-form reliability of Dementia Rating Scale-2. Archives of Clinical Neuropsychology, 2005, 20, 435-441.

2011年12月21日 星期三

陰性預測值 (negative predictive value)

定義
Negative  predictive value
 is a possibility that the person diagnosed as a non-patient is not a patient.

陰性預測值是指診斷(篩檢)為沒有患病的人確實沒有患病者的機率。


判斷標準:陰性預測值介於0.5-0.6為極差 (fail),介於0.6-0.7為不佳 (poor) ,介於0.7-0.8為尚可 (fair) ,介於0.8-0.9為良好 (good),0.9-1.0為極佳 (excellent)

臨床意義:協助臨床工作者判斷診斷(篩檢)結果的正確性。若診斷標準(篩檢工具)的陰性預測值高,表示結果正確性高。可避免漏失患有高危險性疾病(例如:愛滋病)的病人,造成病人本身或社會大眾的負擔。

研究設計
針對來院就診轉介之個案進行評估,再根據臨床專科醫師之診斷結果,計算陰性預測值。
特性:疾病的盛行率越高,陰性預測值越小。診斷標準(篩檢工具)的敏感性越高,陰
性預測值越高

Reference王瑋瀚, 花茂棽, 楊啓正, 朱怡娟, 鄭婷文, 葉炳強, . . . 徐文俊. (2008). 台灣WAIS-Ⅲ中文版算術、記憶廣度測驗及其組合估算工作記憶指數在臨床上之適用性:回溯性研究. 中華心理學刊, 50, 187-199.

Kiyota, Y., Schneeweiss, S., Glynn, R. J., Cannuscio, C. C., Avorn, J., & Solomon, D. H. (2004). Accuracy of Medicare claims-based diagnosis of acute myocardial infarction: Estimating positive predictive value on the basis of review of hospital records. American Heart Journal, 148, 99-104.

Swets, J. A. (1988). Measuring the accuracy of diagnostic systems. Science, 240, 1285-1293.

2011年12月15日 星期四

陽性預測值 (positive predictive value)-20111219更新

定義
Positive predictive value
 is a possibility that the person diagnosed as a  patient is a real patient.


陽性預測值是指診斷(篩檢)為有病的人,真正有患病的機率。


判斷標準:陽性預測值介於0.5-0.6為極差 (fail),介於0.6-0.7為不佳 (poor) ,介於0.7-0.8為尚可 (fair) ,介於0.8-0.9為良好 (good),0.9-1.0為極佳 (excellent)

臨床意義:協助臨床工作者判斷診斷(篩檢)結果的正確性。若診斷標準(篩檢工具)的陽性預測值高,表示結果正確性高。可避免將醫療資源浪費在不是病人的人身上,或是造成個案之心理負擔。

研究設計
針對來院就診轉介之個案進行評估,再根據臨床專科醫師之診斷結果,計算陽性預測值。

特性:疾病的盛行率及診斷標準(評估工具)的特異性越高,
陽性預測值越高


參考資料王瑋瀚, 花茂棽, 楊啓正, 朱怡娟, 鄭婷文, 葉炳強, . . . 徐文俊. (2008). 台灣WAIS-Ⅲ中文版算術、記憶廣度測驗及其組合估算工作記憶指數在臨床上之適用性:回溯性研究. 中華心理學刊, 50, 187-199.

Kiyota, Y., Schneeweiss, S., Glynn, R. J., Cannuscio, C. C., Avorn, J., & Solomon, D. H. (2004). Accuracy of Medicare claims-based diagnosis of acute myocardial infarction: Estimating positive predictive value on the basis of review of hospital records. American Heart Journal, 148, 99-104.


Swets, J. A. (1988). Measuring the accuracy of diagnostic systems. Science, 240, 1285-1293.



2011年12月14日 星期三

Rasch measurement model

The Rasch model “can examine whether items from a scale measure a unidimensional construct. Rasch analysis transforms ordinal scores to the logit scale and thus to an interval-level measurement.”

References:
1. Hsueh IP, Wang WC, Sheu CF, Hsieh CL. Rasch analysis of combining two indices to assess comprehensive ADL function in stroke patients. Stroke, 2004; 35:721-736.
2. Pallant JF, Tennant A. An introduction to the Rasch measurement model: an example using the Hospital Anxiety and Depression Scale (HADS). Br J Clin Psychol, 2007; 46:1-18.

單參數Rasch 模式(只有題目難易度一個參數): Rasch 分析主要驗證量表項目是否符合Rasch 模式,若符合模式欲期則可以宣稱量表符合單向度假設。此外,如量表項目均能符合Rasch模式的預期,則Rasch模式利用對數函數(logit function)針對答題機率進行計算得到客觀等距量尺。

臨床意義: 經過項目分析,如資料符合Rasch模式,除可確認量表所有項目測量同一建構,滿足單向度外,且分數可以加總,加總之後所得之分數才能被用來代表例如個案之日常生活活動能力。

研究設計/收集資料:
個案: 篩選符合標準的門診或住院之中風病人
       - 包含不同嚴重/功能程度
施測者: 熟悉量表之治療師
檢驗量表是否符合單向度只需一次的評估結果(需大量樣本數)即可驗證

統計量之判斷標準:
1. MNSQ: infit/outfit 介於0.6-1.4
2. ZSTD: 介於±2之間
3. PCA: 任一因素解釋變異比例不超過20%

項目鑑別效度

Item discriminant validity: to demonstrate that an item measures what it is supposed to measure, and also to determine the extent to which each item measures other concepts that it is not supposed to measure.

中文解釋:確認項目是否測量所屬量表之概念,且確定項目不是在測量不所屬量表之概念。

統計量之判斷標準:項目和所屬量表之相關比和不所屬量表之相關要高,且高於統計顯著標準,統計顯著標準為2個標準誤(standard error)
1 standard error = 1/ n
(n: sample size)

Reference: Ware, J. E., & Barbara G. (1998). Methods for testing data quality, scaling assumptions, and reliability: The IQOLA project approach. J Clin Epidemio, 51, 945-952.

臨床意義:項目和所屬量表相關與項目和不所屬量表相關之比較,反應項目之潛在構念,假如項目和所屬量表之相關比和不所屬量表之相關要高,且達到顯著標準,表示此項目測量其所屬量表之潛在構念,此項目分數與其所屬量表之其它項目分數的加總才具有意義,此量表之項目總分才可代表潛在構念。

Model paper: McHorney, C. A., Ware, J. E., Lu, J. F. R., Sherbourne, C. D. (1994). The Mos 36-item short-form health survey (SF-36): III. Tests of data quality, scaling assumptions, and reliability across diverse patient groups. Medical Care, 32, 40-66

研究設計:大量收集同一族群之受測者的填寫量表之資料數據,以分析項目與量表之相關。

Person reliability

Person reliability is equivalent to the traditional test reliability, which indicates how likely we will be able to get the same ordering of individuals using a repeated test.
試題反應理論中針對個案能力所驗證的信度,相當於傳統的測驗信度,指的是:重複相同的測驗可以得到相同的個案能力排序的可能性(穩定性)。

Reference:
Li, J., Liu, H., Feng, T., & Cai, Y. (2011). Psychometric assessment of HIV/STI sexual risk scale among MSM: A Rasch model approach. BMC Public Health, 11, 763.

Criteria: A minimum value of 0.7 is required for group use and 0.85 for individual use.
用於團體比較的標準:0.7;用於個人比較的標準:0.85。

Reference:
Tennant, A., & Conaghan, P. G. (2007). The Rasch measurement model in rheumatology: what is it and why use it? When should it be applied, and what should one look for in a Rasch paper? Arthritis Rheum, 57(8), 1358-1362.

Research design: 以新發展的評估工具評估一群個案(如:200人),以每位(團體)個案所得(平均)分數變異誤(標準誤的平方)的反比來獲得評估工具對個別(團體)個案能力估計的信度。
註:person reliability可分為團體層級個別層級。

Model paper:
Hou, W. H., Chen, J. H., Wang, Y. H., Wang, C. H., Lin, J. H., Hsueh, I. P., Hsieh, C. L. (2011). Development of a set of functional hierarchical balance short forms for patients with stroke. Arch Phys Med Rehabil, 92(7), 1119-1125.

臨床意義:Person reliability可幫助我們得知所使用的評估工具是否具有估計不同個案能力的穩定性(精準度)。

2011年12月2日 星期五

未來的專有名詞說明 請加上「研究設計」及 model paper

1. 也就是如何設計研究/收集資料
2. 提出相關的實證論文做為 model paper
3. 請加上統計量之判斷標準
4.之前的詞彙,欠缺上述內容者,請陸續補上。至遲明年1月底前補齊。