• Không có kết quả nào được tìm thấy

Hàm hồi quy đa biến

N/A
N/A
Protected

Academic year: 2022

Chia sẻ "Hàm hồi quy đa biến"

Copied!
9
0
0

Loading.... (view fulltext now)

Văn bản

(1)

Hàm hồi quy đa biến

n Ý nghĩa của hệsốhồi quy

n Giảđịnh

1. Mô hình hồi qui tuyến tính

2. Giá trịkì vọng của biến sốngẫu nhiên=0

3. Phương sai của biến sốngẫu nhiên khôngđổi (Homoscedasticity

)

4. Không có hiện tượng tựtương quan giữa các biến sốngẫu nhiên

5. Không có tương quan giữa ui và Xi

6. Sốquan sát phải lớn hơn sốlượng tham số

7. Mô hình hồi qui được giảđịnh là chính xác

8. Không có tương quan tuyến tính chính xác giữa các biếnđộc lập

9. Biếnđộc lập Xi phải có sựbiến thiên

i i i

i X X u

Y =

β

1+

β

2 2 +

β

3 3 +
(2)

TS Nguyễn Minh Đức 2009 n Phương pháp bình phương tối thiểu

i ki i k

i

i X X X e

Y

= β

ˆ

+ β

ˆ

+ β

ˆ

+

...

+ β

ˆ

+

3 3 2 2 1

( )

2

1

3 3 2 2 1 1

2

ˆ ˆ ˆ ... ˆ

=

=

= n

i

ki k i

i i

n

i

i Y X X X

e β β β β

( )

( )

(

ˆ ˆ ˆ ... ˆ

)

0

2 ...

ˆ 0 ˆ ...

ˆ 2 ˆ

ˆ 0 ˆ ...

ˆ 2 ˆ

1

, ,

3 3 , 2 2 1 1

2

, 2 1

, ,

3 3 , 2 2 1 2

1 2

1

, ,

3 3 , 2 2 1 1

1 2

=

∂ =

=

∂ =

=

∂ =

∑ ∑

∑ ∑

∑ ∑

=

=

=

=

=

=

ki n

i

i K K i

i i

k n

i i

i n

i

i K K i

i i

n

i i

n

i

i K K i

i i

n

i i

X X X

X Y

e

X X X

X Y

e

X X

X Y

e

β β

β β β

β β

β β β

β β

β β β

n Kết quả:

3 3 2 2

1 Y ˆ X ˆ X

ˆ

= − β − β

β

n 2

1 i

i , 3 i , 2 n

1 i

2 n

1 i

2

n

1 i

i , 3 i , 2 n

1 i

i , 3 i n

1 i

2 n

1 i

i , 2 i 2

x x x

x

x x x

y x

x y ˆ

i , 3 i

, 2

i , 3



 



 



 



 



 



 



 

= β

=

=

=

=

=

=

=

n 2

1 i

i , 3 i , 2 n

1 i

2 n

1 i

2

n

1 i

i , 3 i , 2 n

1 i

i , 2 i n

1 i

2 n

1 i

i , 3 i 3

x x x

x

x x x

y x

x y ˆ

i , 3 i

, 2

i , 2

 

 

− 

 

 

 

 

 

 

 

 

− 

 

 

 

 

= β

=

=

=

=

=

=

=

(3)

TS Nguyễn Minh Đức 2009

TSS 1 RSS TSS R2 = ESS= −

k n

1 ) n R 1 ( 1

R

2 2

− −

− v =

Phân phối củaước lượng tham số

) var(

) (

^

^

k

se βk = β

=

=

=

= n

1 i

2 i , 3 n

1 i

2 i , 2 n

1 i

i , 3 i , 2 X

X

x x

x x r23

( )

n 2 2

1 i

i , 3 i , 2 n

1 i

2 i , 3 n

1 i

2 i , 2

n

1 i

2 i , 3 2

x x x

x

x

varˆ σ



 

−



 



 

= β

=

=

=

=

Quan hệgiữa R2và F

) ( ) 1 (

) 1 ( ) 1 )(

1 (

) ( ) (

) 1 SS(

2 2

2 2

k n R

k R R k

R k n k n RSS

k E F

=

=

=

( ) ( )

2 2 23 n

1 i

2 i , 2 2

r 1 x ˆ 1

var σ

=

β

=

Nếu r223 = 0, phương sai của hệsố ước lượngβ2 của hàm hồi quyđa biến và hồi quyđơn là giống nhau

Nếu X2và X3có tương quan tuyến tính hoàn hảo thì r223=1, phương sai của hệsố ước lượngβ2vô cùng lớn

Nếu X2và X3tương quan tuyến tính cao, nhưng không hoàn hảo thì hệsố ước lượngβ2là không chệch nhưng không hiệu quả

2

1 3 2 1

2 3 1

2 2

1 3 2 1

3 1

2 3 1

2 2

ˆ2

+

=

=

=

=

=

=

=

=

n

i i i n

i i n

i i

n

i i i n

i i i n

i i n

i i i

x x x

x

x x x x

x ε

ε β β

(4)

TS Nguyễn Minh Đức 2009

Không chệch

2

^ 2

)

( β = β

E

Khi thay đổi của giá trịbiến hồi qui càng lớn so với giá trị trung bình của nó thì phương sai hệsố ước lượng càng nhỏ, tham số ước lượng càng chính xác.

Thông thường biếnđổi của biến hồi qui càng lớn khi cỡmẫu (sốquan sát) của chuỗi dữliệu càng lớn.

Cóthểgiải thíchđiều này bằngđồthịhàm mậtđộxác xuất.

Nhưvậy sốquan sát nào làđủlớn cho một bộdữliệu?

Kiểm định mức ý nghĩa chung của mô hình H0: β2= β3= β4… = βk= 0 hay R2=0

H1: Không phải tất cảcác hệsốđồng thời =0

F* > F (k-1,n-k,α) thì bác bỏH0

F* ≤F (k-1,n-k,α) thì không thểbác bỏH0

) , 1 2 (

2

) ~ 1 )(

1 (

) ( k)

- SS(n

1) - SS(k

k n

Fk

k R

k n R R

E

F − −

= −

=

(5)

TS Nguyễn Minh Đức 2009

Kiểm định giảthuyết vềhệsốhồi quy

) (

~ ) (

^

^

^

*

t n k

se t

k k

k

− −

= β

β β

Kiểm định giảthuyết vềphương sai của sai số

ˆ ) ( e . s ˆ t

ˆ ) ( e . s ˆ t

m ) 2 / 1 , k n ( m m m ) 2 / 1 , k n (

m

− β ≤ β ≤ β + β

β

α α

Ước lượng phương sai của sai số

k n

e s

n

1 i

2 i 2

= ∑ −

ε =

s

2ε ước lượng không chệch củaσ2, hay E

( )

s2ε =σ2

2 0

2 δ

δ

H0: H1:

2 0

^ 2

2 ( )

δ χ

o n k

δ

= −

χ

α2/2(nk) p

χ

o2 p

χ

12−α/2(nk)

2 0

2 δ

δ =

Kiểmđịnh Wald (U)

(R)

H0: βm=…= βk-1=0 H1: có ít nhất mộtβj≠0

u X X

X X

X

Y = β

0

+ β

1 1

+ β

2 2

+ .... + β

m1 m1

+ β

m m

+ ... + β

k1 k1

+

v

X X

X

Y

= β

0

+ β

1 1

+ β

2 2

+

....

+ β

m1 m1

+

(6)

TS Nguyễn Minh Đức 2009

n Hồi quy mô hình không bịràng buộc (U), k tham số, RSS(U) có (n-k) bậc tựdo

n Hồi quy mô hình (R), m tham số, RSS(R) có (n-m) bậc tựdo

n Nếu FW> Fα(k-m, n-k): bác bỏH0

n Kiểmđịnh Wald thườngđược sửdụng khi kiểmđịnh tổhợp tuyến tính, kiểmđịnh thừa biến…

n Kiểm định tổhợp tuyến tính vềhệsốhồi quy

) , 2 (

2 2

) ~ )(

1 (

) ( )

/(

) /(

) (

k n m k U

R U U

U R

W F

k n R

m k R R k

n RSS

m k RSS F RSS

= −

= − (U)

u X X

Y = β

0

+ β

1 1

+ β

2 2

+

H0: β1= β2 H1: β1≠β2

n Cách 1: Kiểmđịnh Wald

u Z u

X X

Y01( 1+ 2)+ =β01 +

) 3 , 1 2 (

2 2

) ~ 3 )(

1 (

) 2 3 (

= − n

U R U

W F

n R

R F R

Cách 2: Kiểmđịnh t gián tiếp đặtδ=β12; H0: β1= β2; H0: δ=0

u X X X u

X X

Y

= β

0

+ β

1 1

+

(

β

1

− δ

) 2

+ = β

0

+ β

1( 1

+

2)

− δ

2

+

u

X Z

Y

= β

0

+ β

1

− δ

2

+

^ 3

^

^

* 0 ~

= −

tn

t

δ

δ

(7)

TS Nguyễn Minh Đức 2009 n Cách 3: Kiểmđịnh t trực tiếp

) ( ) (

0

^ 2

^ 1

^

^ 2

^ 1

^

^

^

*

β β

β β δ δ

= −

= −

se se

t

) ( var ) (

^ 2

^ 1

^

^ 2

^ 1

^

β

β

=

β

β

se

) , cov(

2 ) ( var ) ( var ) ( var

^ 2

^ 1

^ 2

^

^ 1

^

^ 2

^ 1

^ β −β = β + β − β β

Hàm hồi qui với biến giả

n Trong phân tích hồi qui biến giảthườngđược sửdụng cho những biếnđịnh tính: nam, nữ, việc thích hay không thích, tôn giáo, tốt nghiệpđại học hay chưa, sốngởthành thịhay nông thôn, màu da, quốc tịch

n Những biếnđịnh tính này có thểđược lượng hóa là 0, 1hoặc trong khoảng 1-9

n Yi= b1+ b2Xi+ b3Di+ ei Cách xây dựng biến giả:

Ví dụ: xemảnh hưởng của trìnhđộđối với lương của giáo viên

n Cách 1: D = 0: nếu là cửnhân, thuộc tính cơsở D=1: nếu là thạc sĩ

Y = b1+ b2D + u

n b1 lương trung bình của giáo viên có trìnhđộcửnhân (b + b) lương trung bình của giáo viên có trìnhđộthạc sĩ

(8)

TS Nguyễn Minh Đức 2009 n Nếu biến giảcó n thuộc tính, có (n-1) biến giả

n Giảsử: có 3 mứcđộvềtrìnhđộgiáo viên (cửnhân, thạc sĩ, tiến sĩ) Y = b1+ b2D1+ b3D2+ u

n b1 lương trung bình của giáo viên có trìnhđộcửnhân

n (b1+ b2) lương trung bình của giáo viên có trìnhđộthạc sĩ

n (b1+ b3) lương trung bình của giáo viên có trìnhđộtiến sĩ

n b2 chênh lệch giữa mức lương của giáo viên có trìnhđộcửnhân và thạc sĩ

n b3 chênh lệch giữa mức lương của giáo viên có trìnhđộcửnhân và tiến sĩ

kỹ thuật sử dụng biến giả

n Y = b1+ b2X+ b3D + u Y: lương của giáo viên X: sốnăm giảng dạy D: giới tính (nam=1, nữ=0)

Dịch chuyển sốhạng tung độgốc:lương khởiđiểm của giáo viên nam và nữ khác nhau nhưng tốcđộtăng lương theo sốnăm giảng dạy là nhưnhau

n PRF: Y = b1+ b2X+ b3D + u

n SRF: nữ: Y = β1+ β2X

n nam: Y = β1+ β2X+ β3

n Kiểmđịnh giảthuyết H0: β3 =0

Dịch chuyển sốhạng độdốc:lương khởiđiểm là nhưnhau nhưng tốcđộ tăng khác nhau

PRF: Y = b1+ b2X+ b3(D.X) + u (D.X): biến tương tác

SRF: nữ: Y = β1+ β2X

n nam: Y = β1+ β2X+ β3X= β1+ (β2+ β3)X

n Kiểmđịnh giảthuyết H0: β3 =0

(9)

TS Nguyễn Minh Đức 2009

Dịch chuyển sốhạng độdốc và sốhạng tung độgốc:lương khởi điểm khác nhau và tốcđộtăng lương khác nhau

n PRF: Y = b1+ b2X+ b3D + b4(D.X) + u

n SRF: nữ: Y = β1+ β2X

n nam: Y = (β1+ β3) + (β2 + β4) X

n Kiểmđịnh giảthuyết H0: β3 = β4=0

Tài liệu tham khảo

Tài liệu liên quan

l Phân tích hồi qui: quan tâm mối liên hệ của biến phụ thuộc với 1 hay nhiều biến giải thích (biến đ ộc lập) qua việc ước lượng hay dự đ oán giá trị trung bình

Người ta cắt ở bốn góc của tấm nhôm đó bốn hình vuông bằng nhau, mỗi hình vuông có cạnh bằng x (cm), rồi gập tấm nhôm lại như hình vẽ dưới đây để được một cái hộp không

Định lý Ptoleme hay đẳng thức Ptoleme là một đẳng thức trong hình học Euclid miêu tả quan hệ giữa độ dài bốn cạnh và hai đường chéo của một tứ giác nội tiếp.. Định lý

Bài 3: Ta cần truyền một công suất điện 1MW dưới một hiệu điện thế hiệu dụng 10 kV đi xa bằng đường dây một pha. Khi đó điện áp hiệu dụng giữa hai đầu cuộn thứ cấp để

[r]

Trên cơ sở áp dụng phương pháp PCA để phân tích các dữ liệu chất lượng nước sông Trà Bồng năm 2017, đã xác định được trọng số (w i ) của các thông số CLN một cách

Kết quả mô phỏng trong nghiên cứu cho thấy phương pháp đạt được độ chính xác khả quan trong cập nhật tham số và ước lượng SoC trong điều kiện điện áp và dòng điện

Lực đàn hồi là lực của vật bị biến dạng tác dụng lên vật làm nó biến dạng C.. Độ biến dạng của lò xo càng nhỏ thì lực đàn hồi