• Không có kết quả nào được tìm thấy

Giai đoạn 4

Trong tài liệu KHÓA LUẬN TỐT NGHIỆP - GIS (Trang 56-64)

CHƢƠNG 4 KẾT QUẢ, THẢO LUẬN

4.4 Giai đoạn 4

Minh Tiến

45 Hình 4.11: Sơ đồ phƣơng pháp chi tiết thực hiện trong giai đoạn 3

Minh Tiến

46 Sau khi đã có dữ liệu nhị phân, đề tài sẽ tiếp tục phân tích mạng neural.

Về vấn đề chọn số đơn vị trong lớp ẩn thì căn cứ vào các vấn đề đã nêu ở chƣơng 2, việc chọn số lớp mạng tùy thuộc vào mỗi bài, mỗi yếu tố khác nhau. Do đó trong bài luận, đề tài sẽ chọn số lớp ẩn dao động từ bằng số lớp đầu ra (2 lớp) cho đến 3 lần tổng của đầu ra và vào.

Nên số lớp ẩn mà đề tài chọn sẽ nằm trong khoảng 2 đến 15 lớp.

Đề tài sẽ tiến hành chạy mạng khoảng 10 lần cho mỗi lớp và lấy trung bình để cho ra kết quả tƣơng đối chính xác hơn.

Đề tài sẽ dùng phần mêm MATLAB để phân tích mạng neural. Chi tiết quá trình thực hiện phân tích bằng công cụ mạng neuron trên Matlab đƣợc trình bày chi tiết trong phụ lục.

Nhóm dữ liệu thứ nhất:

 Đầu vào: Giờ, Thứ, Khu vực.

 Đầu ra: Tính lặp lại, Tình trạng.

Bảng quá trình phân tích sai số lớp ẩn xin xem phụ lục

Minh Tiến

47

Biểu đồ 4.4: Biểu đồ phân trăm sai số của các lớp ẩn

14,6 14,2 14,0 15,3 18,2

11,5

14,5 15,1 16,0 13,3

18,3 21,5

17,7

16,1 26,5 24,7 24,7 25,1

46,1

15,5 19,5

24,7

20,0 19,1

38,6

58,8

33,5

29,8

10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 0

10 20 30 40 50 60

2 3 4 5 6 7 8 9 10 11 12 13 14 15

%

Số lớp ẩn

BIỂU ĐỒ PHẦN TRĂM SAI SỐ CỦA CÁC LỚP ẨN Minh Tiến

Sai số trung bình Sai số cao nhất Sai số thấp nhất

Minh Tiến

48 Bảng 4.3: Bảng biến đ ng sai số của các lớp ẩn

Số lớp ẩn Biến động sai số (%)

2 16,0

3 14,2

4 14,2

5 14,6

6 35,6

7 5,0

8 9,0

9 14,2

10 9,5

11 8,6

12 28,1

13 48,3

14 23,0

15 19,3

Kết quả đánh giá sai số của các lớp ẩn cho thấy quá trình thực hiện các sai số trung bình đều thấp hơn 22%. Trong số 14 cách chọn lớp ẩn nhận thấy duy nhất chỉ có cách chọn 7 lớp ẩn là có sai số trung bình thấp nhất với 11,5%. Do đó đây là cách chọn lớp phù hợp nhất trong số 14 cách chọn. Ngoài ra sai số thấp nhất cảu tất cả các lớp ẩn đều bằng nhau 10,5%. Điều này cho thấy đƣợc sai số thấp nhất dƣờng nhƣ là cố định không bị ảnh hƣởng bởi cách chọn số lớp ẩn.

Nếu xét theo góc độ biến động giữa sai số lớn nhất và sai số thấp nhất thì cách chọn 7 lớp ẩn vẫn là tốt nhất do biến động là bé nhất chỉ 5% biến thiên từ 10,5% đến 15,5%. Trong khi cách chọn 13 lớp ẩn thì độ biến động lớn nhất đến 48,3% biến thiên từ 10,5% đến 58,8%.

Minh Tiến

49

Nhóm dữ liệu thứ hai:

 Đầu vào: Số lƣợng ngƣời bị nạn, Phƣơng tiện, Giao cắt.

 Đầu ra: Tính lặp lại, Tình trạng.

Bảng quá trình phân tích sai số lớp ẩn xin xem phụ lục

Minh Tiến

50

Biểu đồ 4.5: Biểu đồ phần trăm sai số của các lớp ẩn

14,5

13,4

19,2

15,9

20,3

14,8

12,7

15,0 18,1 14,5

11,3 15,2

18,4

12,4 26,2

19,9 48,3

30,5

46,6

22,1

20,4 32,6

39,9

20,5 13,5

35,2

39,3

19,5

10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5 10,5

0 5 10 15 20 25 30 35 40 45 50

2 3 4 5 6 7 8 9 10 11 12 13 14 15

%

Số lớp ẩn

BIỂU ĐỒ PHÂN TRĂM SAI SỐ CÁC LỚP ẨN Minh Tiến

Sai số trung bình Sai số cao nhất Sai số thấp nhất

Minh Tiến

Nguyễn Ngọc Minh Tiến DH12GI 12162073 51 Bảng 4.4: Bảng biến đ ng sai số của các lớp ẩn

Số lớp ẩn Biến động sai số (%)

2 15,7

3 9,4

4 37,8

5 20,0

6 36,1

7 11,6

8 9,9

9 22,1

10 29,4

11 10,0

12 3,0

13 24,7

14 28,8

15 9,0

Kết quả đánh giá sai số của các lớp ẩn cho thấy quá trình thực hiện các sai số trung bình đều thấp hơn 21%. Trong số 14 cách chọn lớp ẩn nhận thấy duy nhất chỉ có cách chọn 12 lớp ẩn là có sai số trung bình thấp nhất với 11,3%. Do đó đây là cách chọn lớp phù hợp nhất trong số 14 cách chọn. Ngoài ra sai số thấp nhất cảu tất cả các lớp ẩn đều bằng nhau 10,5%. Điều này cho thấy đƣợc sai số thấp nhất dƣờng nhƣ là cố định không bị ảnh hƣởng bởi cách chọn số lớp ẩn. Minh Tiến

Nếu xét theo góc độ biến động giữa sai số lớn nhất và sai số thấp nhất thì cách chọn 12 lớp ẩn vẫn là tốt nhất do biến động là bé nhất chỉ 3,0% biến thiên từ 10,5% đến 13,5%. Trong khi cách chọn 4 lớp ẩn thì độ biến động lớn nhất đến 37,8% biến thiên từ 10,5% đến 48,3%.

Minh Tiến

Nguyễn Ngọc Minh Tiến DH12GI 12162073 52

Kết luận sau 4 giai đoạn:

Trong quá trình phân tích mạng neural dựa trên 2 lựa chọn tổ hợp khác nhau, cho thấy sai số thấp nhất của các lớp ẩn đều không phụ thuộc vào cách chọn số lớp ẩn, đồng thời các kết quả sai số trung bình của từng cách chọn của mỗi tổ hợp đều cho ra kết quả nhƣ mong muốn với sai số có thể chấp nhận đƣợc.

Tuy nhiên nhƣ đã nêu ở trên, do thời gian hạn chế và điều kiện không cho phép dẫn đến chƣa thể thử hết các tổ hợp. Do đó mặc dù sai số của 2 tổ hợp lựa chọn ngẫu nhiên này có thể tạm chấp nhận trong đề tài nhƣng chƣa hẳn đã tốt hơn so với các tổ hợp chƣa thử khác.

Dựa trên phân tích, đánh giá và nhận xét sai số của 2 tổ hợp nói trên, đề tài sẽ dựa vào 2 yếu tố là sai số trung bình thấp nhất, mức độ biến động của từng tổ hợp để chọn loại tổ hợp tốt nhất. Nên sau khi xem xét, đánh giá thì đề tài sẽ chọn tổ hợp thứ 2 là loại tổ hợp tốt nhất của đề tài. Vì sai số trung bình thấp nhất của tổ hợp này thấp hơn (11,3%) so với của tố hợp đầu (11,5%). Đồng thời biến động sai số của tổ hợp này vẫn thấp hơn (3,0%) và ổn định hơn khi phần trăm biến động sai số chỉ dao động từ 3,0% đến 37,8% so với tổ hợp thứ nhất lần lƣợt là 5% và 5% đến 48,3%.

Minh Tiến

Nguyễn Ngọc Minh Tiến DH12GI 12162073 53

Trong tài liệu KHÓA LUẬN TỐT NGHIỆP - GIS (Trang 56-64)