概述
使用散點圖可以調查一對連續變量之間的關系。散點圖在一個座標平面中顯示一對經過排序的 x 和 y 變量。
例如,醫療研究者會建立散點圖來顯示少女的體重指數 (BMI) 和身體脂肪百分比之間的正相關關系。
要建立散點圖,請選擇圖形 > 散點圖。
散點圖主要結果解釋
步驟 1:尋找模型關系和評估模型關系的強度
確定哪個模型關系能夠以最佳方式擬合數據並評估模型關系的強度。如果模型能夠很好地擬合數據,則可以使用該模型的回歸方程式來描述數據。
提示: 要檢視特定的模型對數據的擬合優度,請添加一條擬合回歸線。雙擊圖形。當此圖形處於編輯模式時,右鍵單擊此圖形,然後選擇 添加 > 回歸擬合。可以將指標放在擬合回歸線上以檢視回歸方程式。
關系的型別
確定哪種模型關系(如果有的話)能夠以最佳方式擬合數據。下面是可以用回歸擬合線建模的關系型別的範例。
如果您的數據似乎擬合模型,則可以使用 回歸分析研究關系。
關系強度
評估數據與模型的擬合程度,以估計 X 和 Y 之間關系的強度。當關系較強時,回歸方程式會準確地對數據建模。如果您有擬合回歸線,請將指標放在擬合回歸線上以檢視回歸方程式和 R 平方值。R 平方值越大,回歸方程式對數據的建模越準確。
要量化線性(直線)關系的強度,請使用 相關分析。
步驟 2:尋找與組相關的模式
如果散點圖含組,您可以尋找與組相關的模式。尋找觀測值組之間 x-y 關系中的差異。即使您未在圖形中包括分組變量,您也可以標識有意義的組。尋找有意義的組可以幫助您更準確地描述數據。
下面的圖形是與組相關的模式的範例。
具有不同斜率的組
當組具有更陡峭的斜率時,x 值的變化與更大的 y 值變化相關聯。
具有不同位置的組
對於每個特定的 x 值來說,一個組的 y 值比另一個組的 y 值高。
聚類中的組
散點圖中的三個聚類指示三個組。
沒有與組相關的模式
這兩個組似乎相同。
如果您懷疑數據中包含組,則可以向圖形中添加分組變量以顯示組。雙擊某個數據點並選擇組索引標籤。
步驟 3:尋找其他模式
異常值可能表明數據中存在異常情況。基於時間的趨勢可能表明數據情況不斷變化。
異常值
異常值是遠離其他數據值的數據值,可能會顯著影響您的結果。
在散點圖上,孤立的點標識異常值。
嘗試確定導致任何異常值的原因。更正任何數據輸入錯誤或測量誤差。考慮刪除與異常的單次事件(也稱為特殊原因)相關聯的數據值。然後,重新執行分析。
基於時間的趨勢
如果 X 變量包含一個按順序記錄的時間或日期值序列,請尋找基於時間的趨勢。要向散點圖中添加連線線,請雙擊散點圖。當散點圖處於編輯模式時,右鍵單擊散點圖,選擇添加 > 數據顯示,然後選擇連線線。
註意
如果您是按照間隔均勻的時間間隔收集的數據,則可以使用時間序列圖。