8 שיעור 3- סטטיסטיקה

8 ‫ שיעור‬-3 ‫סטטיסטיקה‬
‫ מכירות‬,)‫ פרסום (ב"ת‬-‫משתני הרגרסיה והמדדים שלהם‬
Case Summariesa
‫ שאריות‬,‫ ניבויים‬,)‫(תלוי‬
1
2
(miss ing) 3
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Total
N
Mean
Sum of
Squars
‫הניבוי‬
‫טעויות‬/‫שאריות‬
X advertis e
expenses
3.70
6.00
.
6.10
9.00
12.50
12.50
12.50
12.50
15.00
22.50
24.00
25.00
26.60
31.90
35.00
37.60
38.60
40.00
41.20
42.30
42.60
43.50
50.00
52.00
60.00
25.00
28.10
Y s ales
55.00
85.00
78.00
89.00
82.00
100.00
148.00
155.00
111.00
81.00
77.00
191.00
127.00
250.00
312.00
222.00
541.00
266.00
126.00
379.00
312.00
140.00
400.00
338.00
650.00
994.00
25.00
249.24
PRED =
-41.586+10.348*X
-3.30
20.50
.
21.54
51.55
87.77
87.77
87.77
87.77
113.64
191.25
206.77
217.12
233.68
288.52
320.60
347.51
357.85
372.34
384.76
396.14
399.25
408.56
475.82
496.52
579.31
25.00
249.24
RES
=Y-PRED
58.30
64.50
.
67.46
30.45
12.23
60.23
67.23
23.23
-32.64
-114.25
-15.77
-90.12
16.32
23.48
-98.60
193.49
-91.85
-246.34
-5.76
-84.14
-259.25
-8.56
-137.82
153.48
414.69
25.00
.00
6430.91
1139036.56
688654.22
450382.34
ssy
ssreg
ssrez
a. Limited to first 100 cas es
.
ssx
Correlationsa
Pears on Correlation
X
X
Y
PRED
RES
1
.778**
1.000**
.000
Y
.778**
1
.778**
.629**
PRED
1.000**
.778**
1
.000
RES
.000
.629**
.000
1
**. Correlation is significant at the 0.01 level (2-tailed).
a. Listwise N=25
PRED‫ ל‬RES ‫אין קשר בין המוסבר ללא מוסבר לפי המתאם בין‬
1  r  ‫ מחושב כשורש של‬0.629 RES ‫ ל‬Y ‫המתאם בין‬
2
‫ בדיקת הקשר בין שטח הדירה למחירה באלפי דולרים‬:1 ‫דוגמה‬
‫ משוואה לניבוי ובדיקת מובהקות‬,‫ מתאם‬,‫דיאגרמת פיזור וקו הרגרסיה‬
300
250
200
thousands $
150
100
50
Rsq = 0.6767
40
60
80
100
120
140
160
180
200
square meter
Case Summaries
N
Mean
SIZE square
meter
112
PRICE
thous ands $
112
Std. Deviation
Minimum
Maximum
116.7404
39.13942
50.46
179.76
185.0664
44.45345
86.20
286.56
Correlationsa
SIZE square meter
PRICE thous ands $
Pears on Correlation
Sig. (2-tailed)
Pears on Correlation
Sig. (2-tailed)
SIZE square
PRICE
meter
thous ands $
1
.823**
.
.000
.823**
1
.000
.
**. Correlation is significant at the 0.01 level (2-tailed).
a. Lis twise N=112
.‫ יש שיפוע‬-'‫יש קשר באוכ‬
‫רווח סמך לתוחלת ולערך של המשתנה התלוי‬
‫תצוגה גרפית‬
Graph
300
250
200
150
thousands $
100
50
0
40
60
80
100
120
140
160
180
200
square meter
‫חישוב למס' תצפיות‬
Case Summariesa
1
2
3
4
5
6
7
8
9
10
Total
N
SIZE
s quare
meter
60.81
170.06
82.78
108.98
107.88
170.40
56.67
86.69
119.19
141.84
10
PRICE
thous ands $
115.05
235.20
150.69
172.15
133.77
192.26
126.15
201.94
185.68
202.81
10
a. Limited to firs t 10 cas es .
PRE_1
Uns tandardized
Predicted Value
132.808
234.884
153.341
177.818
176.789
235.200
128.944
156.987
187.352
208.521
10
LMCI_1 95%
L CI for PRICE
mean
124.489
226.825
147.034
172.970
171.913
227.108
120.207
150.983
182.588
202.865
10
UMCI_1 95%
U CI for
PRICE mean
141.126
242.943
159.648
182.666
181.666
243.292
137.681
162.992
192.116
214.177
10
‫רב"ס לתוחלת‬
LICI_1 95% L
CI for PRICE
individual
81.805
183.923
102.627
127.265
126.234
184.233
77.871
106.310
136.807
157.884
10
UICI_1
95% U CI
for PRICE
individual
183.811
285.845
204.055
228.371
227.345
286.167
180.017
207.665
237.897
259.158
10
‫רב"ס לערכים‬
‫הטווח של רב"ס לערכים גדול‬
‫מאשר הטווח של רב"ס לתוחלות‬
‫ניתוח שאריות‬
‫זהו ניתוח שנעשה באופן גס על ידי הסתכלות ובחינת הגרף("בעין")‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫צריך לבדוק שהתוחלת הטעויות שווה ל‪0‬‬
‫הפיזור צריך להיות זהה לכל ערך של ‪Xi‬‬
‫הטעויות יתפלגו נורמלית עבור כל ערך של ‪Xi‬‬
‫צריך לעמוד בכל ההנחות !‬
‫בנוסף‪:‬‬
‫מתאם צריך להיות שווה ‪0‬‬
‫צריך שהתצפיות יהיו אקראיות ולא עם דפוס מסוים‪.‬‬
‫דיאגרמת פיזור‪ :‬ניבויים * שאריות‬
‫(בציוני תקן)‬
‫‪Scatterplot‬‬
‫‪Dependent Variable: thousands $‬‬
‫‪3‬‬
‫‪58‬‬
‫‪2‬‬
‫‪1‬‬
‫‪0‬‬
‫‪-1‬‬
‫‪52‬‬
‫‪-2‬‬
‫‪-3‬‬
‫‪2.0‬‬
‫‪1.5‬‬
‫‪1.0‬‬
‫‪.5‬‬
‫‪0.0‬‬
‫‪-.5‬‬
‫‪-1.0‬‬
‫‪-1.5‬‬
‫‪-2.0‬‬
‫‪Regression Standardized Predi cted Val ue‬‬
‫מדובר בבדיקה גסה ("בעין")‬
‫נבדוק הנחות‪:‬‬
‫‪ .1‬תחולת טעויות= ‪- 0‬סביר שקיים(גם לפי הערכים הקיצוניים)‬
‫‪ .2‬שוויון שונויות(פיזור שווה)‪ -‬סביר שקיים‬
‫‪ .3‬התפלגות נורמלית‪ -‬ריכוז תצפיות סביב התוחלת‪ -‬סביר שכן‬
‫מסקנה‪ :‬סביר להניח שאנו עומדים בהנחות המודל‪.‬‬
‫‪Scatterplot‬‬
‫‪Dependent Variable: Y‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪0‬‬
‫‪-1‬‬
‫‪-2‬‬
‫‪Rsq = 0.0000‬‬
‫‪2‬‬
‫‪1‬‬
‫‪0‬‬
‫‪-1‬‬
‫‪-2‬‬
‫‪Regression Standardized Predi cted Val ue‬‬
‫נבדוק הנחות‪:‬‬
‫‪ .1‬תחולת טעויות= ‪- 0‬לא סביר שקיים (לא מתקזז)‬
‫‪ .2‬שוויון שונויות(פיזור שווה)‪ -‬סביר שקיים‬
‫‪ .3‬התפלגות נורמלית‪ -‬לא סביר שמתקיים‪ -‬אין ריכוז מסביב לתוחלת‪.‬‬
‫מסקנה‪ :‬לא סביר להניח שאנו עומדים בהנחות המודל‪.‬‬
‫בנוסף‪ :‬יש דפוס לטעויות‪ -‬מרמז על חוסר עמידה בהנחות המודל‪.‬‬
‫‪Scatterplot‬‬
‫‪Dependent Variable: Y‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪0‬‬
‫‪-1‬‬
‫‪-2‬‬
‫‪-3‬‬
‫‪-4‬‬
‫‪-5‬‬
‫‪Rsq = 0.0000‬‬
‫‪2‬‬
‫‪1‬‬
‫‪0‬‬
‫‪-1‬‬
‫‪-2‬‬
‫‪Regression Standardized Predi cted Val ue‬‬
‫נבדוק הנחות‪:‬‬
‫‪ .1‬תחולת טעויות= ‪ - 0‬סביר שקיים‬
‫‪ .2‬שוויון שונויות(פיזור שווה)‪ -‬לא סביר שקיים‬
‫‪ .3‬התפלגות נורמלית‪ -‬סביר שמתקיים‪ -‬ריכוז מסביב לתוחלת‪.‬‬
‫מסקנה‪ :‬לא סביר להניח שאנו עומדים בהנחות המודל‪.‬‬
‫ניתוח פלט‪ ,‬מודל הרגרסיה‪ ,‬רווח בר סמך‬