Chapter3-5 變量類別 之 定距數據

2024-01-11教育

定距數據 是沿著相鄰值之間距離相等的數值刻度測量的。這些距離稱為「間距」。

定距刻度上沒有真正的零點，這就是它與比率數據的區別。在定距尺度上，零是任意點，而不是變量的完全不存在。

區間量表的常見範例包括標準化考試（如 SAT）和心理量表。

3.5.1. 測量水平

間隔是四個分層測量級別之一。測量水平表明數據記錄的精確程度。級別越高，測量越復雜。

名義變量和有序變量是分類變量，而定距變量和比率變量是定量變量。與分類數據相比，可以對定量數據進行更多的統計檢驗。

3.5.2. 定距與比率刻度

定距和比率刻度在值之間具有相等的間隔。但是，只有比率刻度具有表示完全不存在變量的真零。

攝氏度和華氏度是 定距尺度 的例子。這些刻度上的每個點與相鄰點的間隔正好相差一度。20 度和 21 度之間的差異與 225 度和 226 度之間的差異相同。

然而，這些刻度具有任意的零點——零度並不是可能的最低溫度。

由於沒有真正的零，因此無法在區間刻度上乘以或除以分數。30°C 的溫度不是 15°C 的兩倍。同樣，-5°F 的溫度也不低於 -10°F 的一半。

相比之下，克耳文溫標是一個 比率刻度 。在克耳文標度中，沒有什麽比 0 K 更冷的了。因此，以克耳文為單位的溫度比很有意義：20 K 的溫度是 10 K 的兩倍。

3.5.3. 定距數據範例

智力等心理概念通常透過測試或清單中的操作化來量化。這些測試的分數間隔相等，但它們沒有真正的零，因為它們無法衡量「零智力」或「零人格」。

要確定刻度是定距的還是有序的，請考慮它是否使用具有固定測量單位的值，其中任意兩點之間的距離是已知大小的。例如：

從 0（無疼痛）到 10（最嚴重的疼痛）的疼痛評定量表是定距。

從無疼痛、輕度疼痛、中度疼痛、重度疼痛到最嚴重的疼痛的疼痛評定量表是有序的。

將數據視為定距數據可以執行更強大的統計檢驗。

3.5.4. 定距數據分析

要大致了解研究過程中所收集的數據，研究人員可以首先收集以下描述性統計資訊：

以數碼或百分比表示的頻率分布

找到中心趨勢的眾數、中位數或均值

範圍、標準差和變異數，確定數據的變異性，即數據的離散程度

區間數據範例：

收集來自 A 市的 59 名應屆畢業生的 SAT 分數，考生的 SAT 分數可以在 400-1600 之間。

頻率分布：

表格和圖形可用於顯示並視覺化其分布。

集中趨勢

從圖表中，可以看到數據是相當正態分布的。由於沒有偏度，要找到大多數值的位置，研究人員可以使用所有 3 種常見的集中趨勢度量：眾數、中位數和平均值。

(1) 眾數：眾數是數據集中最常重復的值。在這種情況下，沒有模式，因為每個值只出現一次。

(2) 中位數：中位數是正好位於數據集中間的值。要找到中間位置，請取（n+1）/2 處的值，其中 n 是值的總數。

(n+1）/2 = （59+1）/2 = 30

中位數位於第 30 位，其值為 1120。

(3) 平均數：均值使用所有值為您提供一個數碼，以表示數據的集中趨勢。要找到平均值，請使用公式 ∑x/n。將所有值（∑x）相加，然後將總和除以 n。

∑x = 65850 n = 59 ∑x/n = 65850/59= 1116.1

當所收集到的定量數據呈正態分布時，平均值通常被認為是集中趨勢的最佳度量。這是因為它使用數據集中的每個值進行計算，這與眾數或中位數不同。

離散趨勢

全距、標準差和變異數描述了數據的分布程度。全距是最容易計算的，而標準差和變異數更復雜，但資訊量也更大。

(1)全距：要尋找全距，請從數據集中的最高值中減去最小值。我們的最大值是 1500，最小值是 620。

範圍 = 1500 – 620 = 880

(2)標準差：標準差是數據集中的平均變異量。平均而言，它告訴您每個分數與平均值相差多遠。大多數電腦程式都可以計算標準偏差。

s = 210.42

(3)變異數: 標準差是數據集中的平均變異量。平均而言，它告訴您每個分數與平均值相差多遠。大多數電腦程式都可以輕松為您計算標準偏差。

S2 = 210.42

統計檢驗

經過上面的數據簡要分析，研究人員已經對數據有了大致的了解，可以選擇適當的檢驗來進行統計推斷。在區間數據呈正態分布的情況下，參數檢驗和非參數檢驗都是可能的。

參數檢驗在統計上比非參數檢驗更強大，可讓研究人員對數據做出更有力的結論。但是，數據必須滿足若幹要求才能套用參數檢驗。

以下參數檢驗是一些最常見的參數檢驗，用於檢驗有關定距數據的假設。

Chapter3-5 變量類別 之 定距數據

Chapter3-5 變量類別之定距數據