8 שיעור-3 סטטיסטיקה
מכירות,) פרסום (ב"ת-משתני הרגרסיה והמדדים שלהם
Case Summariesa
שאריות, ניבויים,)(תלוי
1
2
(miss ing) 3
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Total
N
Mean
Sum of
Squars
הניבוי
טעויות/שאריות
X advertis e
expenses
3.70
6.00
.
6.10
9.00
12.50
12.50
12.50
12.50
15.00
22.50
24.00
25.00
26.60
31.90
35.00
37.60
38.60
40.00
41.20
42.30
42.60
43.50
50.00
52.00
60.00
25.00
28.10
Y s ales
55.00
85.00
78.00
89.00
82.00
100.00
148.00
155.00
111.00
81.00
77.00
191.00
127.00
250.00
312.00
222.00
541.00
266.00
126.00
379.00
312.00
140.00
400.00
338.00
650.00
994.00
25.00
249.24
PRED =
-41.586+10.348*X
-3.30
20.50
.
21.54
51.55
87.77
87.77
87.77
87.77
113.64
191.25
206.77
217.12
233.68
288.52
320.60
347.51
357.85
372.34
384.76
396.14
399.25
408.56
475.82
496.52
579.31
25.00
249.24
RES
=Y-PRED
58.30
64.50
.
67.46
30.45
12.23
60.23
67.23
23.23
-32.64
-114.25
-15.77
-90.12
16.32
23.48
-98.60
193.49
-91.85
-246.34
-5.76
-84.14
-259.25
-8.56
-137.82
153.48
414.69
25.00
.00
6430.91
1139036.56
688654.22
450382.34
ssy
ssreg
ssrez
a. Limited to first 100 cas es
.
ssx
Correlationsa
Pears on Correlation
X
X
Y
PRED
RES
1
.778**
1.000**
.000
Y
.778**
1
.778**
.629**
PRED
1.000**
.778**
1
.000
RES
.000
.629**
.000
1
**. Correlation is significant at the 0.01 level (2-tailed).
a. Listwise N=25
PRED לRES אין קשר בין המוסבר ללא מוסבר לפי המתאם בין
1 r מחושב כשורש של0.629 RES לY המתאם בין
2
בדיקת הקשר בין שטח הדירה למחירה באלפי דולרים:1 דוגמה
משוואה לניבוי ובדיקת מובהקות, מתאם,דיאגרמת פיזור וקו הרגרסיה
300
250
200
thousands $
150
100
50
Rsq = 0.6767
40
60
80
100
120
140
160
180
200
square meter
Case Summaries
N
Mean
SIZE square
meter
112
PRICE
thous ands $
112
Std. Deviation
Minimum
Maximum
116.7404
39.13942
50.46
179.76
185.0664
44.45345
86.20
286.56
Correlationsa
SIZE square meter
PRICE thous ands $
Pears on Correlation
Sig. (2-tailed)
Pears on Correlation
Sig. (2-tailed)
SIZE square
PRICE
meter
thous ands $
1
.823**
.
.000
.823**
1
.000
.
**. Correlation is significant at the 0.01 level (2-tailed).
a. Lis twise N=112
. יש שיפוע-'יש קשר באוכ
רווח סמך לתוחלת ולערך של המשתנה התלוי
תצוגה גרפית
Graph
300
250
200
150
thousands $
100
50
0
40
60
80
100
120
140
160
180
200
square meter
חישוב למס' תצפיות
Case Summariesa
1
2
3
4
5
6
7
8
9
10
Total
N
SIZE
s quare
meter
60.81
170.06
82.78
108.98
107.88
170.40
56.67
86.69
119.19
141.84
10
PRICE
thous ands $
115.05
235.20
150.69
172.15
133.77
192.26
126.15
201.94
185.68
202.81
10
a. Limited to firs t 10 cas es .
PRE_1
Uns tandardized
Predicted Value
132.808
234.884
153.341
177.818
176.789
235.200
128.944
156.987
187.352
208.521
10
LMCI_1 95%
L CI for PRICE
mean
124.489
226.825
147.034
172.970
171.913
227.108
120.207
150.983
182.588
202.865
10
UMCI_1 95%
U CI for
PRICE mean
141.126
242.943
159.648
182.666
181.666
243.292
137.681
162.992
192.116
214.177
10
רב"ס לתוחלת
LICI_1 95% L
CI for PRICE
individual
81.805
183.923
102.627
127.265
126.234
184.233
77.871
106.310
136.807
157.884
10
UICI_1
95% U CI
for PRICE
individual
183.811
285.845
204.055
228.371
227.345
286.167
180.017
207.665
237.897
259.158
10
רב"ס לערכים
הטווח של רב"ס לערכים גדול
מאשר הטווח של רב"ס לתוחלות
ניתוח שאריות
זהו ניתוח שנעשה באופן גס על ידי הסתכלות ובחינת הגרף("בעין")
צריך לבדוק שהתוחלת הטעויות שווה ל0
הפיזור צריך להיות זהה לכל ערך של Xi
הטעויות יתפלגו נורמלית עבור כל ערך של Xi
צריך לעמוד בכל ההנחות !
בנוסף:
מתאם צריך להיות שווה 0
צריך שהתצפיות יהיו אקראיות ולא עם דפוס מסוים.
דיאגרמת פיזור :ניבויים * שאריות
(בציוני תקן)
Scatterplot
Dependent Variable: thousands $
3
58
2
1
0
-1
52
-2
-3
2.0
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
-2.0
Regression Standardized Predi cted Val ue
מדובר בבדיקה גסה ("בעין")
נבדוק הנחות:
.1תחולת טעויות= - 0סביר שקיים(גם לפי הערכים הקיצוניים)
.2שוויון שונויות(פיזור שווה) -סביר שקיים
.3התפלגות נורמלית -ריכוז תצפיות סביב התוחלת -סביר שכן
מסקנה :סביר להניח שאנו עומדים בהנחות המודל.
Scatterplot
Dependent Variable: Y
3
2
1
0
-1
-2
Rsq = 0.0000
2
1
0
-1
-2
Regression Standardized Predi cted Val ue
נבדוק הנחות:
.1תחולת טעויות= - 0לא סביר שקיים (לא מתקזז)
.2שוויון שונויות(פיזור שווה) -סביר שקיים
.3התפלגות נורמלית -לא סביר שמתקיים -אין ריכוז מסביב לתוחלת.
מסקנה :לא סביר להניח שאנו עומדים בהנחות המודל.
בנוסף :יש דפוס לטעויות -מרמז על חוסר עמידה בהנחות המודל.
Scatterplot
Dependent Variable: Y
5
4
3
2
1
0
-1
-2
-3
-4
-5
Rsq = 0.0000
2
1
0
-1
-2
Regression Standardized Predi cted Val ue
נבדוק הנחות:
.1תחולת טעויות= - 0סביר שקיים
.2שוויון שונויות(פיזור שווה) -לא סביר שקיים
.3התפלגות נורמלית -סביר שמתקיים -ריכוז מסביב לתוחלת.
מסקנה :לא סביר להניח שאנו עומדים בהנחות המודל.
ניתוח פלט ,מודל הרגרסיה ,רווח בר סמך
© Copyright 2025