• Không có kết quả nào được tìm thấy

đồ án tốt nghiệp - Elib.vn

Protected

Academic year: 2024

Chia sẻ "đồ án tốt nghiệp - Elib.vn"

Copied!
53
0
0

Loading.... (view fulltext now)

Văn bản

Lớp: CT1301 Ngành: Công nghệ thông tin Tên chủ đề: Tìm hiểu một số phương pháp trích xuất đặc trưng để nhận dạng. Giới thiệu về trích xuất tính năng: Tính năng bất biến, khả năng phục hồi. Trích xuất đặc trưng đa cấp từ ảnh thang độ xám: khớp mẫu, mẫu biến dạng, chuyển đổi ảnh đồng nhất, bất biến hình học, bất biến Zenith.

Trích xuất đặc trưng từ ảnh nhị phân: so khớp mẫu, mẫu biến dạng, chuyển đổi ảnh đơn nhất, bất biến hình học. Trích xuất các đặc trưng từ biên ảnh: chiếu nghiêng, tách vùng, xấp xỉ đường cong, mô tả Fourier. Trích xuất đặc trưng từ biểu diễn vectơ: khớp mẫu, mẫu biến dạng, đặc điểm rời rạc, biểu diễn đồ họa, biểu diễn Fourier.

Nhận dạng chữ viết tay: với các mức hạn chế khác nhau về kiểu viết và phông chữ. Báo cáo đồ án tốt nghiệp của tôi, nghiên cứu “Một số phương pháp trích chọn đặc trưng cho nhận dạng chữ viết tay”.

TỔNG QUAN VỀ CHỮ VIẾT VÀ LÝ THUYẾT NHẬN DẠNG 8

MÔ HÌNH TỔNG QUÁT CỦA MỘT HỆ NHẬN DẠNG CHỮ VIẾT TAY 8

  • Khối tách chữ
  • Trích chọn đặc trƣng
  • Huấn luyện và nhận dạng
  • Hậu xử lý

Hàm này được sử dụng cho các ký tự gạch ngang ngẫu nhiên. Hình ảnh bị vỡ khiến việc phân tách các từ trở nên khó khăn, dễ nhầm lẫn hai phần ký tự được kết nối với nhau thành hai ký tự riêng biệt, gây ra lỗi trong quá trình nhận dạng. Đây là bước quan trọng để lộ bộ xương của nhân vật bằng cách loại bỏ dần các điểm ranh giới bên ngoài của các đặc điểm.

Chỉ khi văn bản được phân tách và cách ly chính xác từng ký tự với tổng thể văn bản thì hệ thống mới có thể nhận dạng chính xác ký tự đó. Không giống như chữ viết tay, kích thước và kiểu dáng của các chữ cái là cố định, chúng phải tuân theo những quy tắc in ấn nhất định, các chữ cái phải nằm gọn trong một khung, do đó việc tách một ký tự đơn có thể giống như việc tìm hộp giới hạn của chữ đó ở vị trí của nó trong bảng chữ cái. chữ. Tách văn bản theo chiều ngang và chiều dọc có nghĩa là tìm một hình chữ nhật có các cạnh dọc và ngang chứa toàn bộ ký tự bên trong.

Đối với chữ viết tay, thường rất khó tìm được ranh giới phân chia giữa dòng và ký tự trong văn bản. Trích xuất đặc trưng đóng vai trò cực kỳ quan trọng trong hệ thống nhận dạng. Trong trường hợp đơn giản nhất, hình ảnh thang độ xám hoặc nhị phân được sử dụng để nhận dạng.

Tuy nhiên, trong hầu hết các hệ thống nhận dạng, để giảm độ phức tạp và tăng độ chính xác của các thuật toán phân loại, yêu cầu các đặc trưng được trích xuất phải giảm thiểu nhất có thể nhưng vẫn cung cấp được thông tin ký tự. Đây là giai đoạn quan trọng nhất, giai đoạn này quyết định tính chính xác của hệ thống nhận dạng. Có nhiều phương pháp phân loại khác nhau được áp dụng cho hệ thống nhận dạng chữ viết tay.

Việc phát hiện sai sót, sai sót trong nhận dạng ở bước này góp phần không nhỏ.

Hình 1.2. Nhị phân hóa ảnh.
Hình 1.2. Nhị phân hóa ảnh.

CÁC PHƢƠNG PHÁP NHẬN DẠNG CHỮ VIẾT TAY

  • Đối sánh mẫu
  • Phƣơng pháp tiếp cận cấu trúc
  • Mạng nơ ron
  • Mô hình Markov ẩn (HMM - Hidden Markov Model)
  • Máy véc tơ tựa (SVM)
  • Kết hợp các kỹ thuật nhận dạng
  • Kết luận

Phương pháp này đặt ra một bài toán để giải bài toán nhận dạng từ tổng quát. Mặc dù các nguyên tắc khác nhau nhưng hầu hết các kiến ​​trúc mạng nơ-ron đều tương đương với các phương pháp nhận dạng mẫu thống kê. Trong các hệ thống nhận dạng từ, mạng nơron được sử dụng rộng rãi nhất là mạng perceptron đa lớp của nhóm mạng.

Mạng perceptron nhiều lớp do Rosenblatt đề xuất được nhiều tác giả sử dụng trong các hệ thống nhận dạng chữ viết tay. Hầu hết các nghiên cứu hiện nay về phát triển nhận dạng chữ viết đều tập trung vào mạng SOM. SOM kết hợp trích xuất đặc trưng và nhận dạng trên một số lượng lớn các ký tự huấn luyện.

Các cách tiếp cận giải quyết bài toán nhận dạng chữ viết khá khác nhau, một số phương pháp học máy thường được áp dụng như: mô hình Markov ẩn, mạng nơ-ron hay phương pháp máy vectơ hỗ trợ (SVM - Support Vector). Ô tô). Trong phần này chúng ta sẽ tập trung xây dựng mô hình nhận dạng chữ viết rời rạc bằng phương pháp phân loại SVM. Phần trình bày ở trên cho thấy có nhiều phương pháp phân loại có thể áp dụng cho hệ thống nhận dạng chữ viết tay.

Câu hỏi đặt ra là liệu các phương pháp trên có thể được kết hợp theo cách nào đó để cải thiện chất lượng nhận dạng hay không. Chương này đã giới thiệu tổng quan về lĩnh vực nhận dạng chữ viết tay. Cho đến nay, kết quả nghiên cứu trong lĩnh vực nhận dạng chữ viết vẫn còn hạn chế, ứng dụng chủ yếu tập trung vào một số lĩnh vực còn hạn chế.

Có nhiều kỹ thuật tiên tiến được áp dụng cho bài toán nhận dạng chữ viết tay như HMM, mạng nơ-ron, k-láng giềng gần nhất, luật quyết định Bayesian, SVM.

Hình 2.1. Mô hình nhận dạng chữ viết tay rời rạc.
Hình 2.1. Mô hình nhận dạng chữ viết tay rời rạc.

TỔNG QUAN VỀ TRÍCH CHỌN ĐẶC TRƢNG VÀ MỘT SỐ

  • Trích chọn đặc trƣng
    • Biến đổi toàn cục và khai triển chuỗi
    • Đặc trƣng thống kê
    • Đặc trƣng hình học và hình thái
  • Đặc trƣng bất biến
  • Khả năng khôi phục
  • Trích chọn đặc trƣng từ ảnh đa cấp xám
    • Giới thiệu
    • Đối sánh mẫu
    • Mẫu biến dạng
    • Biến đổi ảnh Unitar
    • Bất biến Zenite
  • Trích chọn đặc trƣng từ ảnh nhị phân
    • Giới thiệu
    • Biến đổi ảnh Unitar
    • Bất biến hình học
  • Trích chọn đặc trƣng từ biên ảnh
    • Giới thiệu
    • Tách vùng
    • Xấp xỉ đƣờng cong
    • Mô tả Fourier
  • Trích chọn đặc trƣng từ biểu diễn véc tơ
    • Giới thiệu
    • Đối sánh mẫu
    • Mẫu biến dạng
    • Đặc trƣng rời rạc
    • Biểu diễn Fourier

Các tính năng thống kê của hình ảnh văn bản bảo tồn các biến thể đa dạng trong dạng văn bản. Các tính năng này tạo ra chuỗi tín hiệu một chiều từ hình ảnh hai chiều. Đặc điểm định hướng: Các ký tự bao gồm các nét chữ, là các đoạn thẳng, vòng cung hoặc đường cong có hướng.

Do đó, tập hợp số lượng các đoạn có hướng sẽ tạo thành một biểu đồ gọi là đồ thị hướng và các đặc điểm trên đồ thị hướng có thể gọi chung là các đặc điểm chỉ hướng. Các thuộc tính cục bộ và toàn cục khác nhau của các ký tự có thể được biểu diễn bằng các đặc điểm hình học và hình thái. Các loại đối tượng này cũng có thể giải mã một số kiến ​​thức về cấu trúc của đối tượng ảnh hoặc có thể cung cấp một số kiến ​​thức, chẳng hạn như cách sắp xếp các thành phần để tạo ra đối tượng.

Số vị trí hoặc quan hệ vị trí của các kết cấu có ký tự này tạo thành đặc điểm biểu diễn ký tự. Các đại lượng hình học đo được có thể được tính gần đúng bằng một tập hợp các đặc điểm hình học đầy đủ và thuận tiện hơn. Cây cũng có thể được sử dụng để biểu diễn các từ và ký tự với một tập hợp các đặc điểm trong mối quan hệ phân cấp.

Tuy nhiên, việc nhị phân hóa một hình ảnh với nhiều mức xám có thể xóa một số thông tin quan trọng về các ký tự. Trong trường hợp này, cũng có một số công trình nghiên cứu trích xuất đặc trưng trực tiếp từ ảnh đa mức xám. Bằng cách khôi phục hình ảnh trong quá trình trích xuất đặc điểm, trình hiển thị trực quan có thể kiểm tra xem các đặc điểm nhất định có được sử dụng để chụp cấu trúc cơ bản của đối tượng hay không.

Phục hồi cũng có thể được sử dụng để kiểm soát chính thức xem việc triển khai có chính xác hay không. Một biểu đồ đối tượng có thể được bắt nguồn từ các khung vì nó xấp xỉ số lượng đường phân đoạn và giao điểm. Các phương pháp mô tả Fourier cho các đường viền ký tự cũng có thể được sử dụng.

CHƢƠNG TRÌNH THỬ NGHIỆM

  • Giới thiệu
  • Xây dựng giao diện vẽ
  • Xử lý dữ liệu (phân tích ảnh)
  • Kết quả nhận dạng
  • Đánh giá, nhận xét

Quá trình phân tích này dựa trên sự nhận dạng từ hình ảnh do người dùng vẽ trên bản đồ. Value: Lưu trữ giá trị của các chữ mẫu dùng để trích xuất - Identifier: Vùng để vẽ chữ. Trích xuất đặc trưng: Trích xuất và chọn lọc các đặc điểm có trọng số của vùng viết - Xóa văn bản: Xóa một chữ cái mẫu đã chọn khỏi tệp TapMau.xml - Nhận dạng: Nhận dạng văn bản được vẽ.

Quá trình trích xuất hoàn tất, việc nhận dạng văn bản có thể được thực hiện bằng cách vẽ văn bản rồi nhấp chuột. Chữ nhận dạng tương ứng với chữ rút ra cần nhận dạng sẽ hiển thị trên màn hình. Nếu các chữ cái khi nhận dạng gần giống nhau và dễ nhầm lẫn với nhau thì khi trích xuất chúng ta thêm các ví dụ trùng khớp với các chữ cái cho đến khi đạt tỷ lệ nhận dạng cao.

Quá trình đào tạo này giải quyết được khía cạnh phức tạp của bài toán nhận dạng chữ viết, đó là sự đa dạng của chữ viết, đặc biệt là chữ viết tiếng Việt. Như vậy, chương trình minh họa trực tuyến nhận dạng chữ viết tiếng Việt đã đạt được mục tiêu giải bài toán phức tạp. Mặt khác, các ký tự rất giống nhau nên dễ bị nhầm lẫn trong quá trình nhận dạng.

Giải quyết được mức độ tổng quát, đa dạng và phong phú trong quá trình xây dựng và trích xuất để đạt được độ chính xác nhận dạng cao. Trong đồ án của mình, tôi đã cố gắng tìm hiểu và nghiên cứu tổng quan về lý thuyết nhận dạng chữ viết tay và các phương pháp trích chọn đặc trưng để nhận dạng chữ viết tay. Một bản cài đặt thử nghiệm của chương trình trích xuất tính năng để nhận dạng các chữ cái không dấu.

Trong thời gian tới tôi sẽ cố gắng nghiên cứu sâu hơn và có thêm kiến ​​thức về trích chọn đặc trưng cho nhận dạng chữ viết nói riêng và lý thuyết nhận dạng nói chung.

Hình 2.2 Quá trình tìm giới hạn ký tự
Hình 2.2 Quá trình tìm giới hạn ký tự

Tài liệu tham khảo

Tài liệu liên quan