當前位置: 華文世界 > 教育

Chapter3-5 變量類別 之 定距數據

2024-01-11教育

定距數據 是沿著相鄰值之間距離相等的數值刻度測量的。這些距離稱為「間距」。

定距刻度上沒有真正的零點,這就是它與比率數據的區別。在定距尺度上,零是任意點,而不是變量的完全不存在。

區間量表的常見範例包括標準化考試(如 SAT)和心理量表。

3.5.1. 測量水平

間隔是四個分層測量級別之一。測量水平表明數據記錄的精確程度。級別越高,測量越復雜。

名義變量和有序變量是分類變量,而定距變量和比率變量是定量變量。與分類數據相比,可以對定量數據進行更多的統計檢驗。

3.5.2. 定距與比率刻度

定距和比率刻度在值之間具有相等的間隔。但是,只有比率刻度具有表示完全不存在變量的真零。

攝氏度和華氏度是 定距尺度 的例子。這些刻度上的每個點與相鄰點的間隔正好相差一度。20 度和 21 度之間的差異與 225 度和 226 度之間的差異相同。

然而,這些刻度具有任意的零點——零度並不是可能的最低溫度。

由於沒有真正的零,因此無法在區間刻度上乘以或除以分數。30°C 的溫度不是 15°C 的兩倍。 同樣,-5°F 的溫度也不低於 -10°F 的一半。

相比之下,克耳文溫標是一個 比率刻度 。在克耳文標度中,沒有什麽比 0 K 更冷的了。因此,以克耳文為單位的溫度比很有意義:20 K 的溫度是 10 K 的兩倍。

3.5.3. 定距數據範例

智力等心理概念通常透過測試或清單中的操作化來量化。這些測試的分數間隔相等,但它們沒有真正的零,因為它們無法衡量「零智力」或「零人格」。

要確定刻度是定距的還是有序的,請考慮它是否使用具有固定測量單位的值,其中任意兩點之間的距離是已知大小的。例如:

  • 從 0(無疼痛)到 10(最嚴重的疼痛)的疼痛評定量表是定距。
  • 從無疼痛、輕度疼痛、中度疼痛、重度疼痛到最嚴重的疼痛的疼痛評定量表是有序的。
  • 將數據視為定距數據可以執行更強大的統計檢驗。

    3.5.4. 定距數據分析

    要大致了解研究過程中所收集的數據,研究人員可以首先收集以下描述性統計資訊:

  • 以數碼或百分比表示的頻率分布
  • 找到中心趨勢的眾數、中位數或均值
  • 範圍、標準差和變異數,確定數據的變異性,即數據的離散程度
  • 區間數據範例:

    收集來自 A 市的 59 名應屆畢業生的 SAT 分數,考生的 SAT 分數可以在 400-1600 之間。

    頻率分布:

    表格和圖形可用於顯示並視覺化其分布。

    集中趨勢

    從圖表中,可以看到數據是相當正態分布的。由於沒有偏度,要找到大多數值的位置,研究人員可以使用所有 3 種常見的集中趨勢度量:眾數、中位數和平均值。

    (1) 眾數:眾數是數據集中最常重復的值。在這種情況下,沒有模式,因為每個值只出現一次。

    (2) 中位數:中位數是正好位於數據集中間的值。要找到中間位置,請取 (n+1)/2 處的值,其中 n 是值的總數。

    (n+1)/2 = (59+1)/2 = 30

    中位數位於第 30 位,其值為 1120。

    (3) 平均數:均值使用所有值為您提供一個數碼,以表示數據的集中趨勢。要找到平均值,請使用公式 ∑x/n。將所有值 (∑x) 相加,然後將總和除以 n。

    ∑x = 65850 n = 59 ∑x/n = 65850/59= 1116.1

    當所收集到的定量數據呈正態分布時,平均值通常被認為是集中趨勢的最佳度量。這是因為它使用數據集中的每個值進行計算,這與眾數或中位數不同。

    離散趨勢

    全距、標準差和變異數描述了數據的分布程度。全距是最容易計算的,而標準差和變異數更復雜,但資訊量也更大。

    (1)全距:要尋找全距,請從數據集中的最高值中減去最小值。我們的最大值是 1500,最小值是 620。

    範圍 = 1500 – 620 = 880

    (2)標準差:標準差是數據集中的平均變異量。平均而言,它告訴您每個分數與平均值相差多遠。大多數電腦程式都可以計算標準偏差。

    s = 210.42

    (3)變異數: 標準差是數據集中的平均變異量。平均而言,它告訴您每個分數與平均值相差多遠。大多數電腦程式都可以輕松為您計算標準偏差。

    S2 = 210.42

    統計檢驗

    經過上面的數據簡要分析,研究人員已經對數據有了大致的了解,可以選擇適當的檢驗來進行統計推斷。在區間數據呈正態分布的情況下,參數檢驗和非參數檢驗都是可能的。

    參數檢驗在統計上比非參數檢驗更強大,可讓研究人員對數據做出更有力的結論。但是,數據必須滿足若幹要求才能套用參數檢驗。

    以下參數檢驗是一些最常見的參數檢驗,用於檢驗有關定距數據的假設。