• Không có kết quả nào được tìm thấy

TS Nguyễn Minh Đức

N/A
N/A
Protected

Academic year: 2022

Chia sẻ "TS Nguyễn Minh Đức"

Copied!
10
0
0

Loading.... (view fulltext now)

Văn bản

(1)

Nguyen Minh Duc 2009 11

KINH TẾ LƯỢNG

GIỚI THIỆU HÀM HỒI QUY

TS Nguyễn Minh Đức

Một số khái niệm

l Tổng thể:là tập hợp tất cảnhững cá thểhay những nhân tốcĩ cùng 1 hoặc vài đặc tính chung.

Ví dụ: tập hợp tất cảnhững người Việt nam đang theo học các trường Trung cấp, cao đẳng và đại học là tổng thểcủa sinh viên Việt nam

l Mẫu:là tập hợp con của tổng thểhay nĩi cách khác mẫu là những phần tử được rút ra từtổng thể.

Ví dụ: những sinh viên của Trường đại học Mởthành phốHồ Chí Minh là 1 mẫu của tổng thểsinh viên Việt nam.

l Phân tích hồi qui:quan tâm mối liên hệcủa biến phụthuộc với 1 hay nhiều biến giải thích (biến độc lập) qua việc ước lượng hay dự đốn giá trịtrung bình của tổng thể.

Hay nĩi cách khác: kết quảphân tích hồi qui cĩ thể được dùng để ước lượng hay dự đốn giá trịtrung bình của 1 biến dựa trên số

(2)

TS Nguyễn Minh Đức 2009 3

Một số khái niệm

Biến phụthuộc và biến độc lập cịn cĩ 1 sốtên gọi khác:

l Biến phụthuộc hay cịn được xem như là biến được giải thích, biến được dựbáo, biến được hồi qui, biến phản ứng, biến nội sinh.

Giá trịcủa biến phụthuộc thường được tìm kiếm và phân tích sau khi kết thúc hồi qui.

l Biến độc lậphay cịn gọi là biến giải thích, biến dựbáo, biến hồi qui, biến tác nhân hay biến kiểm sốt, biến ngoại sinh.

l Đường hồi qui:làđường tập hợp (trình diễn) những giá trị (ước lượng) trung bình của biến phụthuộc dựa vào giá trị đã biết của biến giải thích (vẽđường hồi qui)

l Hàm hồi qui tổng thể(population regression function) PRF Cho thấy mối liên hệgiữa biến phụthuộc và biến giải thích dựa trên sốliệu đã biết của tồn bộtổng thể. Hàm hồi qui tổng thểcĩ thể dự đốn được giá trịchính xác của biến phụthuộc

Hàm hồi qui tổng thể PRF

l Ví dụ: khi phân tích mối liên hệgiữa giá trịxuất nhập khẩu và thuếnhập khẩuđối với mặt hàng xe hơi được nhập khẩu vào Việt nam

l Đểxây dựng được hàm hồi qui này, phải thu thập sốliệu vềthuế nhập khẩu do Việt nam ápđặtđối với tất cảxe hơi được nhập khẩu từcác nước trên thếgiới, đồng thời tìm giá trịnhập khẩu của tất cảxe hơi nhập khẩu.

l Trong thực tế, đối với những nghiên cứu vềkinh tếxã hội rất khĩ thu thập được sốliệu của tồn bộtổng thể.

l Ví dụ: khi phân tích mối liên hệgiữa chiều cao của cha và con trên lãnh thổViệt Nam. Những người tiến hành nghiên cứu khơng thểthu thập được sốliệu vềchiều cao của tất cả người cha trên tồn lãnh thổViệt Nam

l Hàm hồi qui tổng thểcĩ thể được nĩi tĩm gọn như hồi qui tổng thể

(3)

TS Nguyễn Minh Đức 2009 5 Hàm hi quy tng th

Y= β1 + β2X +εi

0 100 200 300 400 500 600 700

0 100 200 300 400 500 600 700 800 900

Thu nhập khả dụng, X (XD)

Tu dùng, Y (XD)

Xi E(Y/Xi)= β1 + β2Xi

Yi= β1 + β2Xi + εi

εi

Y = E(Y/Xi) Yi

β1

β2

Thu nhập X (XD)

Hàm hồi qui mẫu SRF

l Hồi qui mẫu (Sample Regression function): cho thấy mối liên hệgiữa biến phụthuộc với biến giải thích dựa trên giá trịtrung bình của tổng thểhay giá trị ñã biết của mẫu.

l Do khó khăn trong việc tìm kiếm giá trịcủa tổng thểhay những giới hạn về tài chính và nguồn lực trong quá trình tiến hành nghiên cứu, những mẫu nghiên cứu sẽ ñược quan sát và phân tích thay cho giá trịcủa tổng thể.

l Dựa vào ví dụtrên vềchiều cao của cha và con, sau khi tiến hành thu thập sốliệu mẫu vềchiều cao của 1000 cặp cha và con sốngởcác nơi trên lãnh thổViệt nam. Hàm hồi qui được xây dựng trên mẫu này với 1000 quan sát được gọi là hàm hồi qui mẫu.

l Một trong những mục tiêu của phân tích hồi qui là tìm giá trị ước lượng gần với giá trịthực tếhoặc giá trịtổng thể, mặc dù không biết trướcđược giá trị thật của tổng thể. Hay nói cách khác giá trị càng gần với b1, b2 thì kết quả hồi qui càng tốt hay , có thểđưa hàm hồi qui ứng dụng vào thực tế. Dựa vào biểuđồtrên, nếuđường hồi qui mẫu (SRF) càng gần vớiđường hồi qui tổng thểthì kết quảhồi qui càng có giá trịcao.

(4)

TS Nguyễn Minh Đức 2009 7 0

100 200 300 400 500 600

0 100 200 300 400 500 600 700 800 900

Thu nh

?

?d Thu nhập X ?

(PRF) (SRF)

Xi Yi

E(Y/Xi) Yi

ei

uii

1

Phân biệt các dạng quan hệ trong phân tích hồi qui

Quan hệthống kê và quan hệhàm số:

l Giảsửhàm sốy có dạng sau đây: y = a + bX1

l Nếu giá trịcủa X1thayđổi thì chỉcho duy nhất 1 giá trịcủa y. Quan hệ hàm số thường gặpởmột sốngành khoa học tựnhiên: vật lý, hóa học

l Ví dụ: trong thí nghiệm hóa học, mỗi lần thayđổi thành phần của nhân tố hóa học thì chỉcho 1 kết quảduy nhất, hay chỉcho 1 hợp chất mới duy nhất

l Đối với quan hệthống kê: từví dụtrên, nếu thayđổi giá trịcủa X thì y có thểnhận nhiều giá trịkhác, không thểbiết giá trịchính xác. Đó là do sự tác động của nhiều yếu tốkhác hoặc nhiều biến khác. Trong thực tế những biến ngẫu nhiên này rất khó nhận dạng ñược.

l Ví dụ: khi tiến hành thí nghiệm về ảnh hưởng của phân bónđối với năng suất của cây trồng. Có thểkết luận năng suất của cây trồng có thể tăng, giảm hay mất hoàn toàn bởi vì do ảnh hưởng của rất nhiều nhân tố như thiên tai (nắng, mưa,…) hoặc dịch hại (côn trùng, sâu, rầy…). Những nhân tốnày rất khó kiểm soát trong quá trình nghiên cứu, vì vậy mối quan hệtrong thí nghiệm trên ñược gọi là mối quan hệthống kê.

(5)

TS Nguyễn Minh Đức 2009 9

Phân biệt các dạng quan hệ trong phân tích hồi qui

Quan hệhồi qui và nhân quả

l Trong mối quan hệnhân quảcĩ 1 tác nhân gây ra biến động hoặc ảnh hưởngđến những biến khác.

l Ví dụ: số người hút thuốc lá cao thì sốbệnh nhân bịung thưphổi cao, mối quan hệnày cĩ thểnĩi là mối quan hệnhân quảvì thuốc lá là tác nhân gây ra bệnh ung thư

l Mặc dù trong phân tích hồi qui cũng quan tâm đến mối liên hệgiữa 2 biến sốvới nhau nhưng phân tích hồi quy khơngphải luơn bao hàm quan hệnhân quả, vì cịn rất nhiều yếu tốhay biến sốkhác ảnh hưởng đến mối liên hệnày.

l Ngồi ra trong phân tích hồi qui cĩ 1 sai lầm là quy kết mối quan hệnhân quảgiữa hai biến sốtrong khi thực tếchúngđều là hệquảcủa một nguyên nhân khác.

l Ví dụ: khi phân tích hồi qui tìm mối liên quan giữa số lượng tivi tính trên đầu người và tuổi thọ. Kết quảnghiên cứu đã tìm thấy, số lượng tivi tính theo đầu người và tuổi thọcĩ quan hệđồng biến, nếu số lượng tivi tính theo đầu người càng cao thì tuổi thọcủa người dân càng cao. Tuy nhiên mối quan hệnày khơng phải là quan hệnhân quả, số lượng tivi trên đầu người khơng thểlàm cho tuổi thọ tăng lên hay giảmđi.

Phân biệt các dạng quan hệ trong phân tích hồi qui

Quan hệhồi qui và tương quan

l Phân tích tương quan khơng quan tâm đến mối liên hệnhân quả.

l Mụcđích chính của phân tích tương quan làđo mức độmạnh, yếu trong mối liên hệtuyến tính giữa 2 biến.

l Trong khi đĩ phân tích hồi qui khơngđo lường mức độliên hệgiữa 2 biến mà chủyếu ước lượng hay dự đốn giá trịtrung bình của 1 biến (biến phụthuộc) dựa trên giá trị đã biết của những biến khác.

l Khi tiến hànhhồi qui cần cĩ sựphân biệt biến nào là biến độc lập và biến nào là biến phụthuộc, nhưng trong phân tích tương quan khơng cần phân biệt những biến này.

l Ví dụ: phân tích tương quan của 2 nghiên cứu sau là tương tựnhau Nghiên cứu tương quan giữa điểm mơn tốn và bài kiểm tra mơn thống kê. Cũng giống như nghiên cứu tương quan giữa điểm mơn thống kê và bài kiểm tra tốn

l Ngồi ra, những lý thuyết tương quan thường giảđịnh những biến số đang nghiên cứu là ngẫu nhiên. Trong khi lý thuyết hồi qui giảđịnh biến phụthuộc cĩ tính chất suy đốn và biến giải thích là đã được biết.

(6)

TS Nguyễn Minh Đức 2009 11

Tuyến tính trong hồi qui

l Trong hình học, đường tuyến tính làđường thẳng

l Trong hồi qui, mô hình tuyến tính hay hàm tuyến tính đối với biến khi biến độc lập (biến giải thích) có hệsốmũbằng 1.

l Mô hình tuyến tính đối với tham sốkhi tất cảcác tham sốcủa mô hình có hệsốmũbằng 1, hệsốmũcủa biến có thểnhận bất kỳgiá trịnào.

l Những mô hình gọi là tuyến tính đối với tham sốY = a + b X; Y = a + bX2; Y = a + b (1/X)

l Mô hình sau đây ñược gọi là tuyến tính đối với biến: Y =a + bX;

Y=a2+bX; Y = a + b3X

l Tính tuyến tính của các mô hình hồi qui thường dựa vào các tham số, không dựa vào biến số.

Hàm hồi quy hai biến Hàm hồi qui tổng thể (PRF)

E(Y/X i ) = f(X i ) = b

1

+ b

2

X

i

hoặc Y

i

= b

1

+ b

2

X

i

+ u

i

l

u

i

= Y

i

- E(Y/X

i

)

b1, b2là các tham sốcủa hàm hồi qui, giá trịcủa b1, b2 cần phải tìm vàước lượng trong quá trình hồi qui.

b1: hệsốtungđộ(intercept coefficient) b2: hệsốgốc (slope coefficient)

ui : sai sốhồi qui hay sai sốngẫu nhiên. Nguyên nhân tạo nên sai sốnày là do sai sót trong quá trình thu thập thông tin, sốliệu, hoặc do mô hình hồi qui không thích hợp, ngoài ra còn do các tácđộng khác không dựtrùđược.

X: biến giải thích, giá trịcủa X đã biết hoặc quan sátđược

(7)

TS Nguyễn Minh Đức 2009 13

Giả sử khi quan sát số lượng cá tra xuất khẩu và thuế nhập khẩu hàng n ă m trong giai đ oạn 2005-2009

l

i = 5 tượng trưng cho 5 quan sát trong 5 n ă m

l Y1= b1+ b2X1+ u1 i=1, giá trịquan sát trong năm 2005 l Y2= b1+ b2X2+ u2 i=2, giá trịquan sát trong năm 2006 l Y3= b1+ b2X3+ u3 i=3, giá trịquan sát trong năm 2007 l Y4= b1+ b2X4+ u4 i=4, giá trịquan sát trong năm 2008 l Y5= b1+ b2X5+ u5 i=5, giá trịquan sát trong năm 2009

Hàm hồi quy hai biến

: giá trị ước lượng của biến phụthuộc cho tổng thểY : biến giải thích, giá trịđãđược biết trước

: ước lượng tham sốcủa b1, b2, giá trịcủa cần phảiước lượng trong quá trình hồi qui.

Khi thêm biến ngẫu nhiên hay sai sốngẫu nhiên vào hàm số, hàm hồi qui bây giờlà hàm hồi qui tổng thể:

Yi= b1+ b2Xi + ei

ei: ước lượng của sai sốngẫu nhiên, hay nói cách khác eilà khoảng chênh lệch giữa giá trịthực và giá trị ước lượng của Y.

eicó thểnhận giá trịdương hoặc âm.

i 2 1

i ˆ ˆ X

Yˆ =β +β

Yˆi

X

i

2 1,ˆ ˆ β β

Hàm hồi qui mẫu (SRF)’’’

(8)

TS Nguyễn Minh Đức 2009 15

Phương pháp bình phương tối thiểu (Ordinary Least squares)

Thuộc tính của hệ số ước lượng

Hệsố ước lượng của hàm hồi qui có thuộc tính tuyến tính không chệch tốt nhất (BLUE)

l Tuyến tính: hàm sốtuyến tính của biến ngẫu nhiên l Không chệch:

l Ước lượng tốiưu: có phương sai tối thiểu2

^

2 β

β =

E

Phương pháp bình phương tối thiểu (Ordinary Least squares)

Giảđịnh

1. Mô hình hồi qui tuyến tính

2. Giá trịcủa X được giữcốđịnh trong những lần lặp lại mẫu

3. Giá trịkì vọng của biến sốngẫu nhiên=0 4. Phương sai của biến sốngẫu nhiên khôngđổi

(Homoscedasticity)

5. Không có hiện tượng tựtương quan giữa các biến số ngẫu nhiên

6. Không có tương quan giữa uivà Xi

7. Sốquan sát phải lớn hơn sốlượng tham số 8. Giá trịcủa X phải có biếnđộng

9. Mô hình hồi qui được giảđịnh là chính xác

10. Không có hiện tượngđa cộng tuyến hoàn hảo trong mô ( ) 2

varui Xi =δ

(

ui Xi

)

=0 E

( )

0

covui uj =

( ) 0

cov ui Xi =

(9)

TS Nguyễn Minh Đức 2009 17

Phương pháp bình phương tối thiểu (Ordinary Least squares)

l Phương pháp bình phương tối thiểu: là phương pháp làm cho tổng bình phương sai sốcó giá trịnhỏnhất

i 2 1 i i i

i Y Yˆ Y ˆ ˆ X

e = = β β

( )

2

n

1 i

i 2 1 i n

1 i

2

i Y ˆ ˆ X

e

=

= = β β

(

Y ˆ ˆ X

)

2 e 0

ˆ 2

e n

1 i

i n

1 i

i 2 1 i 1

n

1 i

2 i

=

= β

β

β =

=

=

=

(

Y ˆ ˆ X

)

X 2 eX 0

ˆ 2

e n

1 i

i i i

n

1 i

i 2 1 i 2

n

1 i

2 i

=

= β

β

β =

∑ ∑

=

=

=

(3.7)

(3.8)

Phương pháp bình phương tối thiểu (Ordinary Least squares)

Yi=nβˆ1+βˆ2 Xi

YiXi=βˆ1 Xi+βˆ2 Xi2

X Y

^ 2

^

1 β

β = −

( )( )

( )

=

=

=

β n

1 i

2 i n

1 i

i i

2

X X

X X Y Y

ˆ xi =Xi −X

Y Y yi = i

=

=

β n

2 n

1 i

i i 2

x x y ˆ

(10)

TS Nguyễn Minh Đức 2009 19

Phương pháp bình phương tối thiểu (Ordinary Least squares)

Thuộc tính thống kê của OLS estimators

l là duy nhấtứng với một mẫu xácđịnh gồm n quan sát (Xi,Yi), có thểđược tính toán dễdàng

l là cácước lượngđiểm của b1 và b2 . Giá trịcủa và thayđổi theo mẫu dùngđể ước lượng.

OLS estimates đạtđược từmẫu, do đóđường hồi qui mẫu có thuộc tính:

1. Giá trịtrung bình của sai sốeibằng 0

2. Ước lượng của sai sốeikhông tương quan vớiước lượng của Yi

3. Ước lượng của sai sốeikhông tương quan vớiước lượng của Yi

4. Giá trịtrung bình củaước lượng bằng giá trịtrung bình thực của Y

5. đi qua giá trịtrung bình của dữliệu graph 1.ppt

2 1,ˆ ˆ β β

ˆ X Y=βˆ1β2

( )

Yˆ Y

E =

( )

0

E ei =

= n =

1 i

i

iY 0

e

2 1,ˆ ˆ β β

Tài liệu tham khảo

Tài liệu liên quan

[r]

Do đó, hành vi động lực (hay hành vi được thúc đẩy, được khuyến khích) trong tổ chức là kết quả tổng hợp của sự kết hợp tác động của nhiều yếu tố như văn hóa của tổ

phổ biến ở người bệnh ĐTĐ với biểu hiện tăng nồng độ và hoạt tính của nhiều yếu tố đông cầm máu như fibrinogen, yếu tố VII, VIII, XI, XII, kallikrein, von

Chiến lược tiếp thị theo vòng đ ời sản phẩm Giai đ oạn chín muồi (Maturity Stage).. TS Nguyễn Minh Đức

Ở bệnh nhân Wilson mang đột biến trên gen ATP7B gây thiếu hụt enzym này làm r i loạn quá trình vận chuyển đồng trong cơ thể và gây ra các triệu chứng

Các bệnh nhân phát hiện đột biến gen gây bệnh Wilson kèm theo các biến đổi xét nghiệm sinh hóa máu, nước tiểu dù chưa có triệu chứng lâm sàng cũng được điều trị sớm

Sự thỏa mãn khách hàng là một khái niệm tổng quát, thể hiện sự hài lòng của họ khi tiêu dùng một dịch vụ.Trong khi đó chất lượng dịch vụ chỉ tập trung vào

Khi thay đổi của giá trị biến hồi qui càng lớn so với giá trị trung bình của nó thì phương sai hệ số ước lượng càng nhỏ, tham số ước lượng càng chính xác. Thông