2011年12月23日 星期五

Item reliability

Item reliability index is the estimate of the replicability of item placement within a hierarchy of items along the measured variable if these same items were to be given to another sample of comparable ability.
試題反應理論中,針對試題所估計的信度是:根據評估變項排列的題目難易的可重複性(是否在測量另一群差不多能力個案時,也能有相同的題目難易排序)。
Reference:
Kook SH, Varni JW. Validation of the Korean version of the pediatric quality of life inventory 4.0 (PedsQL) generic core scales in school children and adolescents using the Rasch model. Health and quality of life outcomes 2008;6:41.

標準: 用於整體題目比較:0.7;用於個別題目比較:0.85。介於0和1之間。
Reference:
Tennant A, Conaghan PG. The Rasch measurement model in rheumatology: what is it and why use it? When should it be applied, and what should one look for in a Rasch paper? Arthritis and rheumatism 2007;57:1358-1362.

研究設計: 以新發展的評估工具評估一群個案(如:200人),獲得題目的難易程度,並以此估計題目的信度。

Model paper:
Hou, W. H., Chen, J. H., Wang, Y. H., Wang, C. H., Lin, J. H., Hsueh, I. P., Hsieh, C. L. (2011). Development of a set of functional hierarchical balance short forms for patients with stroke. Arch Phys Med Rehabil, 92(7), 1119-1125.

臨床意義:當一個評估工具的試題信度高,代表題目難度是精確且穩定的。一旦試題的難度精確且穩定,對個案功能的評估才會精準且穩定。

4 則留言:

  1. 「研究設計」後段寫得像 data analysis
    「item reliability 可幫助我們得知評估工具是否適用於不同群但卻有相似能力的個案」之語意不清。

    回覆刪除
  2. 1. IRT之item reliability在傳統測量理論中,算是哪個心理計量特性?
    2. 您提到的標準中,有分整體題目比較和個別題目比較,為什麼要分整體題目比較和個別題目比較?有何其特殊意義和應用?
    謝謝。

    回覆刪除
  3. 1.目前好像沒有相對應的心理計量特性。
    2.因為單一試題有自己的試題難度,整份試題有整體的試題難度。

    回覆刪除