• Không có kết quả nào được tìm thấy

PDF Báo Cáo Tóm Tắt Nghiên Cứu Phát Triển Mô Hình Dự Báo Dữ Liệu

N/A
N/A
Protected

Academic year: 2024

Chia sẻ "PDF Báo Cáo Tóm Tắt Nghiên Cứu Phát Triển Mô Hình Dự Báo Dữ Liệu"

Copied!
36
0
0

Loading.... (view fulltext now)

Văn bản

Project Title: Research and Development of a Time Series Forecasting Model Using a Moving Window Concept and Support Vector Machines Optimized by Swarm Intelligence Algorithm. Develop an integrated forecasting model for predicting time series data by integrating the moving-window concept and the support vector model optimized by the firefly algorithm. The research developed a time series forecasting model by integrating the moving window concept and machine learning regression optimized by the swarm intelligence.

The research pointed to a necessity of using the concept of moving window to forecast time series data. The results in this study indicated that the proposed forecasting model MFA-LSSVR outperforms other models including MARIMA and MLSSVR in predicting time series data. Truong, Forecasting Time Series Data Using Moving-Window Swarm Intelligence-Optimized Machine Learning Regression, International Journal of Intelligent Engineering Informatics 7 (2019).

TÍNH CẤP THIẾT CỦA VẤN ĐỀ NGHIÊN CỨU

MỤC TIÊU NGHIÊN CỨU

This study also shows the necessity of using the moving window approach and its effect on the forecast accuracy. Tang, Forecasting urban electric load consumption using a hybrid of moving window concept and swarm intelligence-optimized machine learning regression, Journal of Science and Technology-The University of Danang. Places for application: Investors, agencies and companies of interest; researchers in the field of time series forecasting;.

The findings of this study could be used in practice to forecast time series data in energy, finance, tourism, environment, etc.

CÁCH TIẾP CẬN

PHƯƠNG PHÁP NGHIÊN CỨU

ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

NỘI DUNG NGHIÊN CỨU

Tóm lại, dự báo điện năng (nói chung) là cơ sở để lập kế hoạch đầu tư hàng năm cho phát triển mạng lưới điện phân phối, kế hoạch vận hành hệ thống điện phân phối, kế hoạch vận hành hệ thống điện quốc gia và kế hoạch vận hành hệ thống điện phân phối. kế hoạch vận hành thị trường điện [4] . Giá trị thực tế và dự đoán của các mô hình sử dụng dữ liệu xác nhận. Dữ liệu trong 2 tuần tiếp theo được sử dụng để kiểm tra độ chính xác dự báo của mô hình MFA-LSSVR.

Giá trị thực tế và dự đoán của các mô hình được hiển thị trong Hình.

TỔNG QUAN VỀ DỰ BÁO DỮ LIỆU CHUỖI

Dự báo dữ liệu chuỗi thời gian: khái niệm và phân loại . 3

  • Phân loại dự báo dữ liệu chuỗi thời gian

Dữ liệu chuỗi thời gian là một chuỗi các điểm dữ liệu, được đo tại các thời điểm liên tiếp với tần số thời gian đều nhau. Dự báo chuỗi thời gian là việc sử dụng mô hình để dự đoán các điểm dữ liệu trong tương lai dựa trên dữ liệu trong quá khứ. Dự báo dựa trên các mô hình toán học giả định rằng mối quan hệ giữa các yếu tố được thiết lập trong quá khứ sẽ được lặp lại trong tương lai.

Tìm một phương pháp hiệu quả để dự báo chuỗi thời gian là rất quan trọng trong cả kỹ thuật và kinh tế.

Tầm quan trọng của dự báo dữ liệu chuỗi thời gian

  • Trong lĩnh vực năng lượng
  • Trong lĩnh vực tài chính

Dự báo nhu cầu phụ tải điện liên quan chặt chẽ đến quy hoạch đầu tư, vận hành hệ thống năng lượng, dự báo doanh thu, kinh doanh năng lượng,… và còn có tác động đến quy hoạch của nhiều ngành dịch vụ. Ở Việt Nam, dự báo nhu cầu phụ tải điện của hệ thống điện phân phối là dự báo cho tất cả các phụ tải điện do hệ thống điện phân phối cung cấp, trừ các phụ tải có nguồn điện riêng. Ngoài ra, các công ty năng lượng còn dự báo điện thương mại, nhận điện và cung cấp điện từ đó dự đoán tổn thất.

Dự đoán chính xác giá cổ phiếu giúp nhà đầu tư xác định thời điểm mua (bán) phù hợp và từ đó thu được lợi nhuận đáng kể; là cơ sở để Chính phủ và các doanh nghiệp đánh giá kế hoạch đầu tư và phân bổ nguồn lực hợp lý. Ngoài dự báo chứng khoán, dự báo chuỗi thời gian trong lĩnh vực tài chính còn bao gồm dự báo tỷ giá hối đoái, dự báo giá vàng, v.v. Dự báo chính xác về tỷ giá giúp đưa ra những quyết định phù hợp về quan hệ kinh tế đối ngoại, tình hình cán cân thanh toán, tăng trưởng kinh tế, lạm phát và thất nghiệp.

CÁC NGHIÊN CỨU VỀ DỰ BÁO DỮ LIỆU

Dự báo chuỗi thời gian trên thế giới

  • Các mô hình dự báo trong lĩnh vực năng lượng
  • Các mô hình dự báo trong lĩnh vực tài chính
  • Dự báo chuỗi thời gian trong các lĩnh vực khác

SVR cố gắng giảm thiểu giới hạn trên của lỗi tổng quát hóa thay vì giảm thiểu lỗi thử nghiệm như mô hình mạng thần kinh. Tuy nhiên, nhược điểm của mô hình SVR là độ chính xác dự đoán phụ thuộc rất nhiều vào các tham số của mô hình, đặc biệt là tham số điều khiển (C) và tham số hàm kernel (C). Chào). Trong lĩnh vực tài chính, các mô hình dự báo truyền thống như làm mịn hàm mũ, hồi quy tuyến tính, Box-Jenkins, v.v.

Tuy nhiên, các mô hình này tạo ra sai số khá lớn với dữ liệu phi tuyến tính và không ổn định. Với ưu điểm là không cần đưa ra giả định trước về đặc điểm của dữ liệu, mô hình ANN được sử dụng rộng rãi trong các lĩnh vực như phân loại, xử lý ảnh và tài chính [16-19]. Ví dụ, Alameer và các đồng nghiệp của ông đã phát triển mô hình ANN được tối ưu hóa bằng thuật toán cá voi để dự đoán biến động giá vàng hàng tháng.

Kết quả cho thấy khả năng dự đoán vượt trội của mô hình đề xuất so với mô hình ARIMA và mô hình ANN đơn. Cùng với ANN, mô hình SVM được áp dụng thành công vào chuỗi dữ liệu dự báo nói chung và lĩnh vực tài chính nói riêng [20–22]. Thông qua dự báo xu hướng hàng tuần của chỉ số NIKKEI 225, Huang và các đồng nghiệp kết luận rằng mô hình SVM thể hiện khả năng dự đoán xu hướng tốt hơn các mô hình bước đi ngẫu nhiên (RW) và phân tích phân biệt tuyến tính (LDA). , phân tích phân biệt bậc hai (QDA) và mạng lưới thần kinh lan truyền ngược Elman (EBNN).

Như đã phân tích ở phần 2.1.1, độ chính xác dự đoán của mô hình SVM hoặc SVR phụ thuộc đáng kể vào hai tham số C và eu. Vì vậy, các mô hình lai đã ra đời, trong đó một thuật toán được sử dụng để tối ưu hóa hai tham số trên.

Dự báo chuỗi thời gian ở Việt Nam

Kết luận

PHÁT TRIỂN MÔ HÌNH DỰ BÁO DỮ LIỆU

Phương pháp cửa sổ dịch chuyển

Các mô hình Support Vector Machine learning được tối ưu hóa bằng thuật toán trí tuệ bầy đàn.

Mô hình máy học véc-tơ hỗ trợ được tối ưu bởi thuật

  • Mô hình máy học véc-tơ hỗ trợ
  • Thuật toán con đom đóm

Trong nghiên cứu này, thuật toán đom đóm (FA), một thuật toán dựa trên trí tuệ bầy đàn, được sử dụng để tối ưu hóa hai tham số C và σ của mô hình LSSVR. Mô hình dự đoán sử dụng phương pháp Cửa sổ di chuyển và hỗ trợ máy học vectơ, được tối ưu hóa bằng thuật toán Firefly. Mô hình dự đoán đề xuất Moving Window FA-LSSVR (MFA-LSSVR) được thể hiện bằng ngôn ngữ lập trình MATLAB (Hình 3.2).

Tập huấn luyện được sử dụng để huấn luyện mô hình dự đoán, "học" và nhận biết các tính năng quan trọng trong dữ liệu. Bộ kiểm tra được sử dụng để kiểm tra độ chính xác của mô hình dự đoán trong quá trình đào tạo. Hàm mục tiêu của mô hình dự báo MFA-LSSVR là căn bậc hai của sai số bình phương trung bình gốc (RMSE).

Trong quá trình huấn luyện này, thuật toán firefly đồng thời và tự động chọn các giá trị cho hai tham số C và eu. Cuối cùng, bộ xác thực được sử dụng để kiểm tra độ chính xác của mô hình dự đoán sau khi tối ưu hóa. Độ chính xác dự đoán của mô hình được đánh giá bằng cách sử dụng tập dữ liệu thử nghiệm.

RMSE đo lường sự khác biệt giữa giá trị thực tế và giá trị được mô hình dự đoán. Giá trị của SI nằm trong [0,1]; Giá trị SI của mô hình càng gần 0 thì kết quả dự đoán của mô hình càng chính xác.

Hình 3.2. Mô hình dự báo đề xuất.
Hình 3.2. Mô hình dự báo đề xuất.

ỨNG DỤNG MÔ HÌNH DỰ BÁO DỮ LIỆU

  • Thu thập và tiền xử lý dữ liệu
    • Bộ dữ liệu 1 – Điện năng tiêu thụ hàng tháng ở
    • Bộ dữ liệu 2 – Nhu cầu điện tiêu thụ hàng ngày ở
    • Bộ dữ liệu 3 – Giá cổ phiếu đóng cửa hàng ngày
  • Thiết lập tham số cho mô hình dự báo
  • Kết quả và thảo luận
    • Trình tự thực hiện
    • Kết quả và thảo luận
    • Kết luận
  • Kết luận
  • Kiến nghị

Độ chính xác dự đoán của mô hình MFA-LSSVR đề xuất được so sánh với mô hình cửa sổ chuyển động ARIMA (MARIMA) và cửa sổ chuyển động LSSVR (MLSSVR). Windows có độ dài khác nhau đã được sử dụng để kiểm tra khả năng dự đoán của mô hình MFA-LSSVR. Bảng 4.3 cho thấy mô hình MFA-LSSVR có độ chính xác dự đoán cao nhất.

Rõ ràng giá trị dự đoán của mô hình MFA-LSSVR gần với mức giá hiện tại hơn giá trị dự đoán của hai mô hình MARIMA và MLSSVR. Từ Bảng 4.4 có thể thấy mô hình MFA-LSSVR có sai số dự đoán thấp nhất. So với giá trị dự đoán của hai mô hình MARIMA và MLSSVR, giá trị dự đoán của mô hình MFA-LSSVR gần với giá trị thực tế hơn.

20 giá trị tiếp theo được sử dụng để kiểm tra độ chính xác dự đoán của mô hình MFA-LSSVR. Rõ ràng là giá trị dự báo của mô hình MFA-LSSVR gần với giá trị thực tế hơn giá trị dự báo của mô hình MARIMA và MLSSVR. Với dữ liệu tiêu thụ điện, mô hình MARIMA có độ chính xác dự đoán cao hơn mô hình MLSSVR.

Với dữ liệu giá đóng cửa của mã chứng khoán, khả năng dự đoán của mô hình MLSSVR tốt hơn mô hình MARIMA. Mô hình dự đoán đề xuất được xây dựng trên ngôn ngữ lập trình MATLAB. Sử dụng thuật toán đom đóm, mô hình MFA-LSSVR đã cải thiện đáng kể độ chính xác dự đoán của LSSVR.

Kết quả phân tích cho thấy mô hình MFA-LSSVR có khả năng dự báo tốt hơn so với cả hai mô hình MARIMA và LSSVR.

Hình 4.2. Đồ thị nhu cầu tiêu thụ điện hàng ngày ở TP. Đà Nẵng.
Hình 4.2. Đồ thị nhu cầu tiêu thụ điện hàng ngày ở TP. Đà Nẵng.

Tài liệu tham khảo

Tài liệu liên quan