2013年9月16日星期一

R M - CH-6 - LECTURE NOTES

第六章
測量
學習重點
測量的尺度
單一或是綜合指標
測量誤差的主要成因
系統誤差、隨機誤差

信度
訪員或觀察者之間的信度、測驗-複測的信度、內容一致性信度
效度
表面效度、內容效度、效標關聯效度、建構效度、因素效度
信度和效度之間的關聯
質性研究中的信度和效度

測量的尺度(一)
測量的尺度:一個「屬性」,是指某些事情的一種特性或特質;變項在邏輯上就是一種屬性。每一個變項應該具備兩個重要的特質:
第一:所包含的的屬性應該是周延性的。如果變項在研究過程中要發揮任何效用,就應該要將每個觀察都分類到變項所包含的屬性中。

測量的尺度(二)
第二:變項所包含的屬性必須要具有互斥性。除了必須使每個觀察都可以被分類到某一個屬性之外,也只能被分類到一個。
然而,屬性之間可能也有其他的關聯性。也由於屬性之間的其他關聯,所以不同的變項可能表示不同的測量層次。

測量的尺度(三)
名目測量:變項的屬性若只具有互斥和周延這兩個特質者,就稱為名目測量。例如,性別、種族、宗教信仰、政黨、出生地等。
爲了增進資料的蒐集和處理過程,我們分配不同的編碼數字給名目測量中不同的分類或屬性。我們可能將「1」用來代表男生,將「2」用來代表女生。但是,和其他層次變項不同的是,名目測量的數字代碼是不具有任何與數量有關的意義。它們只是方便用來記錄本質上的差異。

測量的尺度(四)
次序測量:變項的屬性在邏輯上有順序者,稱為次序測量。例如,社會階層、種族主義、性別歧視、案主滿意度等。
和名目測量一樣,我們會分配代碼數字去代表各個次序。但與之不同的是,這些數字在某種程度上有數量的意義。
例如一份服務滿意度的量表上有「非常好」、「好」、「普通」、「差」四個分類,那數字代碼可能會用4代表非常好,3代表好,2代表普通,1代表差。

測量的尺度(五)
等距測量:對某些變項的屬性而言,之間實際的距離是有意義的,這些變項就是等距測量。對這些變項而言,屬性彼此之間有邏輯的距離可代表某種有意義的標準間隔。例如,溫度測量中的華氏和攝氏就是等距測量。
社會科學研究中的等距測量通常被用於結構性的測量,例如標準化的智力測驗,在IQ100和IQ110之間的距離被認為與IQ110和IQ120之間的距離是一樣的。

測量的尺度(六)
比例測量:大部份的社會科學變項只要符合等距測量最基本的條件,就能符合比例測量的條件。
在比例測量中,組成變項的屬性除了包括上述討論過的特性之外,還立基於絕對原點。例如社會工作研究中的年齡、居住時間、子女數等。而沒有絕對原點的屬性則不適用,例如身高。

測量的尺度(七)
測量尺度的意涵:基本上,主要是在資料分析上的意義,而在研究計劃的架構中,這些分析的涵義是需要事先計劃的,某些分析的技巧需要變項符合最低層次的測量尺度,在執行研究時也會受到變項尺度的某些限制。嚴格來說,你需要預先草擬適合你變項尺度的研究結論。

測量的尺度(八)
有些變項可以代表不同的測量尺度。最高層次的測量是比例測量,其次是等距測量,接著是次序測量,最後是名目測量。高層次的變項可以被視為較低層次的變項,例如,比例測量的變項可被視為次序測量的變項。
單一或是綜合指標
很多變項是不用觀察,直接可以測量的。例如「性別」,不論怎麼分類,只能被分為男性和女性。許多變項有明顯的單一指標,可用簡單的方法看一下或者詢問一下就可以知道。
而有些概念有著很多種詮釋、很多個指標,有時候一時之間很難找到想要的單一指標來作為變項的測量。在這種狀況中,可能必須針對一個變項做一些觀察,接著結合觀察到的幾種資料,針對這個變項去創造一個綜合的測量。

測量誤差的主要成因(一)
系統誤差:當所蒐集的資料無法正確反應出所要測量的概念時,就發生了系統誤差,這可能是因為我們蒐集資料的方式或是提供資料的過程出了問題。
當我們要測量的是人們的想法時,可能會因為受試者聯想到其他事情而發生系統誤差。

測量誤差的主要成因(二)
偏誤:有多種形式,可能是因為我們詢問問題的方式帶有預設性,暗示受試者回答我們期望聽到的答案;或是當我們得到的答案是支持我們的假設時,我們可能會微笑或點頭表示同意;或是受訪者可能會對我們所問的問題存有偏見,而沒有回答他真正的想法或行為。
順從反應:不管他們描述的內容為何,就表示出同意或不同意受試者而造成的誤差。
社會期望偏誤:受試者去做或說一些事情來是他看起來更好而造成的誤差。
文化偏誤:不同受試者在文化上的差異可能會給測量結果造成一些誤差。

測量誤差的主要成因(三)
隨機誤差:與系統誤差不同,隨機誤差是沒有固定的型態。它並不會使我們的測量產生誤差,而是使測量之間互相矛盾不一致。如果我們所測量的事物並沒有隨著時間改變,但是測量卻是不一致的結果,那麼就可能是因為我們的測量前後不一致,即隨機誤差。
例如受試者被詢問到他們并不了解的事物但是又不想表現出來時,他們可能會隨機的回答「是」或「不是」,而下一次再詢問他們相同的問題時,即使他們的情形沒有改變,答案也可能會改變。

測量誤差的主要成因(四)
測量方式中的誤差
自評報告的填寫:它可能用來蒐集人們的背景資料(如年齡、性別、種族等)或去測量他們的知識、態度、技巧和行為。在設計測量工具時,應避免由用語以及社會期望形象所導致的系統誤差。
訪談:這種方式可以允許我們觀察受訪者的反應以及探究更多的含糊資訊和開放式問題。但訪談更容易使受訪者爲了呈現自己好的一面而出現社會期望誤差。

測量誤差的主要成因(五)
直接行為觀察:這種方式也會有系統上的誤差。當受試者知道自己正在被觀察時,他們可能表現出比平常或是比當不知道自己被觀察時,還符合社會期望的行為。此外,不同的觀察者也會因為對所要觀察及記錄的現象有不同的了解程度而導致隨機誤差的產生。
現存記錄資料的檢測:我們可能會希望去檢測受試者在個案記錄上所記錄的過程,去觀察他們提供不同服務的頻率。但有些實務工作者可能會在記錄上誇大他們實際服務的時間,從而導致一些系統誤差的產生。

信度(一)
信度:主要是討論一個特定的技術如果重複的使用在同一個事物上,是否每一次都會有相同的結果。因此,信度可以測量出一個測量中的隨機誤差。測量的信度越高,隨機誤差的機率就越小。
信度的類型
訪員或觀察者之間的信度:觀察者間的信度或者評分者間的信度,是指觀察者和評分者之間一致性的程度。

信度(二)
測驗—複測的信度:評估不同時間內測量的穩定性,即量表即使在不同的時間測量,也具有一致性。
內部一致性信度:其假設這個測量工具的內容是由很多題目組成的,每一個題目都有一個分數,與其他的分數組成為一個總的分數,我們可以簡單的評估每個題目的分數與其他題目組的分數是否相關,或者,我們也可以將所有題目分成幾個部份,并計算所有題目所分成的各個部份之間的分數總和,并評估這些總和之間的相關。

效度(一)
效度:是指一個測量能適當地反應某個概念的真正意義的範圍。
效度的類型
表面效度:特定的經驗測量可能會也可能不會與一般大眾的認知和我們個人對某個概念的想像是一致的。
內容效度:是指在一個測量所包含某個概念意義的範圍,到達哪一個程度,其包含了表面效度的元素。

效度(二)
效標關聯效度:是根據一些其他的標準。當我們要評估一個工具的效標關聯效度時,我們另外選擇一個其他的標準或是工具,而這個標準必須是我們所信賴的,與所欲檢驗的工具所測量的變項是一樣的。效標關聯效度又可分成兩種:預測效度、一致效度。
建構效度:若我們以理論為基礎,可能會發現當中有些變項與這個測量是有關的,而建構效度正是以此為基礎。

效度(三)
因素效度:是社會工作研究中常會遇見的,是指一個量表中,有多少不同的概念,而在這些概念和組成概念的題目中,什麽才是研究者想要的。

信度和效度之間的關聯(一)
將要測量的目標當作靶心,不管它擊中哪裡,信度就像「緊密的黑點」,因為信度是測驗一致性的。
另一方面,效度是擊中靶心的周圍,沒有信度是因為隨機誤差,而沒有效度是因為系統誤差。「如圖6-4」

信度和效度之間的關聯(二)
質性研究中的信度和效度(一)
在質性研究與量性研究中,信度與效度在某些基本的邏輯上是相同的,然而在某些議題上又有所不同。
例如在一個少年憂鬱的質性研究中,研究者不會依賴標準化的工具,而會去研究一個比較小的樣本群,藉由對每一個樣本以及他們的重要他人進行大量的直接觀察與深度訪談。

質性研究中的信度和效度(二)
質性研究的觀點是仔細和深入地描述事情,以及從多元的觀點切入,因此較不需要去擔心這個測量是否真的符合我們所要研究的。
如果量性研究的結果越支持質性研究所蒐集的資訊,則質性研究的結果會被視為是越有效度及信度的。


From - 陳卓華博士/Dr. Sunny Chan
Cwchan@ipm.edu.mo

没有评论:

发表评论