• Không có kết quả nào được tìm thấy

PDF Chương I Tổng Quan Về Xử Lý Ảnh

Protected

Academic year: 2024

Chia sẻ "PDF Chương I Tổng Quan Về Xử Lý Ảnh"

Copied!
56
0
0

Loading.... (view fulltext now)

Văn bản

Tôi xin cảm ơn các thầy cô và cán bộ Khoa Công nghệ thông tin Trường Đại học Dân lập Hải Phòng đã trang bị cho tôi những kiến ​​thức cần thiết và hữu ích để hoàn thành đồ án này. Do thời gian và kiến ​​thức có hạn nên đồ án không thể tránh khỏi những sai sót. Trong những thập kỷ qua, nhiều nhà nghiên cứu đã phát triển mạnh mẽ vấn đề nhập dữ liệu tự động.

Nhập dữ liệu tự động là việc tải thông tin vào máy mà không cần sự can thiệp thủ công của con người. Đề tài nghiên cứu một số thuật toán khắc phục nhược điểm của việc nhập liệu tự động, bước đầu cài đặt và thử nghiệm bài toán nhập liệu tự động (nhận dạng bảng câu hỏi). Khoa Công nghệ thông tin - Trường Đại học Du lịch Hải Phòng 5 tài liệu sau đó chọn phương pháp so sánh Histogram để nghiên cứu chuyên sâu và cài đặt, thử nghiệm chương trình.

TỔNG QUAN VỀ XỬ LÝ ẢNH

Tổng quan về xử lý ảnh

Các quá trình xử lý ảnh

Việc lựa chọn thiết bị thu nhận ảnh sẽ phụ thuộc vào đặc điểm của đối tượng cần xử lý. Tiền xử lý: Ở bước này, ảnh sẽ được nâng cao về độ tương phản, giảm nhiễu, loại bỏ bóng, làm mờ nét, v.v. Trong cả hai trường hợp, việc chuyển đổi dữ liệu thô này sang dạng phù hợp hơn để xử lý trên máy tính là cần thiết.

Khoa Công nghệ thông tin - Trường Đại học Du lịch Hải Phòng 8 chuyển đổi một phần dữ liệu ảnh thô sang dạng phù hợp hơn để xử lý sau này. Chúng ta cũng cần nghĩ ra cách mô tả dữ liệu được chuyển đổi sao cho các thuộc tính mà chúng ta cần biết được làm nổi bật, thuận tiện cho việc xử lý chúng. Chúng ta cũng có thể thấy rằng không có ứng dụng XLA nào bắt buộc phải thực hiện đầy đủ các bước xử lý nêu trên, chẳng hạn các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý.

Ảnh và biểu diễn ảnh

Khi số hóa, nó thường được biểu diễn bằng mảng 2 chiều I(n,p): n là hàng và p là cột. Hình ảnh có thể được biểu diễn theo một trong hai mô hình: mô hình vector hoặc mô hình raster. Mô hình vector: Ngoài việc tiết kiệm không gian lưu trữ và dễ dàng hiển thị, in ấn, hình ảnh được trình bày dưới dạng mô hình vector còn có ưu điểm là cho phép dễ dàng lựa chọn, sao chép, di chuyển, tìm kiếm... Phù hợp với yêu cầu đó, kỹ thuật vector trình bày vector có vẻ vượt trội.

Trong mô hình này, người ta sử dụng hướng vectơ của các pixel lân cận để mã hóa và tái tạo lại hình ảnh gốc. Tùy theo nhu cầu thực tế, mỗi pixel có thể được biểu diễn bằng một hoặc nhiều bit. Các hình ảnh được sử dụng trong phạm vi chủ đề này cũng là những hình ảnh được thể hiện theo mô hình Raster.

Phạm vi ứng dụng của xử lý ảnh

Các loại tệp cơ bản trong xử lý ảnh

  • File ảnh IMG
  • File ảnh PCX
    • Kỹ thuật nén ảnh PCX
    • Giải nén ảnh PCX
  • Định dạng ảnh TIFF
  • Định dạng ảnh GIF(Graphics Interchanger Format)
  • File ảnh BMP (BITMAP)
    • Khái niệm về ảnh đen trắng, ảnh màu, ảnh cấp xám
    • Cấu trúc ảnh BMP

Khoa Công nghệ thông tin - Đại học Du lịch Hải Phòng 11 Hình 1.2 Mối quan hệ lân cận giữa các pixel. Khoa Công nghệ thông tin - Đại học Du lịch Hải Phòng 23 Quá trình ẩn thông tin trong ảnh màu cũng tương tự như ảnh đen trắng, nhưng trước tiên chúng ta cần chọn ra từ mỗi pixel bit có trọng số nhỏ nhất (LSB) để tạo thành ảnh nhị phân . nó được gọi là hình ảnh thứ cấp. Do đó, đối với ảnh nhiều mức xám, bit LSB của mỗi pixel là bit cuối cùng của mỗi pixel.

Đây là phần chứa giá trị màu của các pixel trong ảnh BMP, các dòng ảnh được lưu từ dưới lên trên, các pixel được lưu từ trái sang phải. Giá trị của mỗi pixel là một chỉ số trỏ đến phần tử màu tương ứng trong bảng màu. Thành phần BitCount của cấu trúc BitmapHeader chỉ định số bit cho mỗi pixel và số lượng màu tối đa trong hình ảnh.

Nếu bit có giá trị 0 thì pixel có màu đen, nếu bit có giá trị 1 thì pixel có màu trắng. Khoa Công nghệ thông tin - Đại học Du lịch Hải Phòng 26 16: Bitmap là ảnh có độ màu cao, mỗi hàng 2 byte liên tiếp trong bitmap biểu thị cường độ tương đối của các màu đỏ, lục, lam của một pixel.

Hình 1.3 Cấu trúc tệp ảnh dạng PCX.
Hình 1.3 Cấu trúc tệp ảnh dạng PCX.

Cấu trúc ảnh PNG

Phần tử ColorUsed của cấu trúc BitmapHeader xác định có bao nhiêu màu từ bảng màu thực sự được sử dụng để hiển thị bitmap. Nếu mục này được đặt thành 0, bitmap sẽ sử dụng số lượng màu tối đa tương ứng với giá trị BitCount. Khoa Công nghệ thông tin - Đại học Du lịch Hải Phòng 27 Tóm lại, định dạng PNG mang lại cho chúng ta những ưu điểm vượt trội so với các định dạng phổ biến hiện nay như JPG, GIF, BMP... Ưu điểm rõ ràng càng mạnh mẽ hơn khi sử dụng trong môi trường web đồ họa .

Giảm thiểu kích thước: Trong số tất cả các định dạng hình ảnh phổ biến hiện nay, hình ảnh PNG có thể được coi là có kích thước nhỏ nhất.

Sự cần thiết phát hiện độ dịch chuyển của phiếu điều tra so với phiếu mẫu

Khoa Công nghệ thông tin - Đại học Du lịch Hải Phòng 28 Để loại bỏ những vấn đề này, cần phải chuyển đổi hình ảnh quét cho phù hợp với hình ảnh xem trước. Nó giúp tăng độ chính xác khi chấm điểm bài kiểm tra hoặc bảng câu hỏi.

  • Các định nghĩa cơ bản về Histogram
    • Định nghĩa histogram là gì?
  • Các kỹ thuật phát hiện độ dịch chuyển văn bản
    • Kỹ thuật so sánh theo histogram
    • Phƣơng pháp đánh giá độ dịch chuyển cấu trúc văn bản theo mẫu
    • Phát hiện độ dịch chuyển của ảnh mẫu so với ảnh cần nhận dạng dựa theo
  • Phát biểu và phân tích bài toán ứng dụng, lựa chọn giải pháp sử lý
    • Phát biểu bài toán và phân tích bài toán
    • Phƣơng pháp xử lý
  • Bƣớc đầu cài đặt bài toán và nhận dạng phiếu điều tra
    • Học form ảnh mẫu
    • Nhận dạng bài toán

Việc đánh giá độ dịch chuyển của văn bản so với văn bản mẫu sẽ được thực hiện bằng cách tạo biểu đồ ngang và dọc của hai tài liệu. Sự chuyển động của văn bản so với mẫu được đánh giá dựa trên mức độ tương tự của biểu đồ văn bản với biểu đồ của văn bản mẫu tương ứng. Đầu tiên chúng ta vẽ mô hình biểu đồ dọc của văn bản mẫu và văn bản cần nhận dạng, sau đó chúng ta chồng hai biểu đồ của hai văn bản lên cùng một trục tọa độ.

Ta thấy nếu 2 biểu đồ của 2 văn bản trùng nhau thì ảnh mẫu và ảnh cần nhận dạng không có sự khác biệt, ngược lại nếu thấy 2 biểu đồ của 2 văn bản khác nhau thì văn bản mẫu và văn bản cần nhận dạng nhận dạng Việc nhận dạng đã di chuyển trong quá trình quét. Việc đánh giá độ lệch của văn bản so với văn bản mẫu sẽ được thực hiện bằng cách xây dựng lưới dựa trên các diện tích hình chữ nhật cơ bản của mẫu và đánh giá độ lệch của vùng so với lưới. Độ dịch chuyển của văn bản so với mẫu sẽ được đánh giá dựa trên mức độ tương đồng của văn bản và mẫu với lưới tương ứng.

Khoa Công nghệ thông tin - Đại học Du lịch Hải Phòng 37 MGGrid- là một lưới gồm hai lưới tạo thành các vùng văn bản hình chữ nhật và các bản xem trước. Lưới xây dựng kết hợp các lưới văn bản và các khu vực mẫu hình chữ nhật. Đối với mỗi ô, chúng tôi lưu trữ tọa độ trên cùng bên trái và dưới cùng bên phải trong tệp văn bản file1.DBF.

Để khắc phục nhược điểm này, ảnh cần nhận dạng phải được điều chỉnh để có cấu trúc giống với ảnh mẫu, trong quá trình nhận dạng (ví dụ trong bài toán thu nhận), bước đầu tiên là tách tọa độ ô trong văn bản, các hình vuông được trộn lẫn. Sau đó lưu tọa độ và diện tích của các ô trong ảnh mẫu vào tệp văn bản (DBF). Để nhận dạng hình ảnh, chúng ta tiếp tục lấy tọa độ các hình vuông đã lưu trong file văn bản ở bước 1.

Tự động hiệu chỉnh độ lệch của hình ảnh mẫu và hình ảnh được nhận dạng. Phát hiện và điều chỉnh offset văn bản: Với tính năng này, chương trình đã mang lại kết quả khá chính xác cho văn bản. Câu hỏi nghiên cứu và phương pháp phát hiện offset trang văn bản so với văn bản gốc.

Hình 2.4: Histogram của ảnh quá tối
Hình 2.4: Histogram của ảnh quá tối

CÀI ĐẶT CHƢƠNG TRÌNH

KẾT QUẢ

Khoa Công nghệ thông tin - Đại học Du lịch Hải Phòng 50 + Hình ảnh sau khi điều chỉnh dịch chuyển được đưa về đúng vị trí so với ảnh gốc. Hiệu chỉnh độ lệch trang ảnh: Với chức năng này, chương trình cho kết quả tương đối chính xác, tuy nhiên phương pháp đề xuất trong luận án yêu cầu khối lượng tính toán lớn nên thời gian thực hiện chương trình ngắn. khá lâu.

Ý NGHĨA ỨNG DỤNG

KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI

Khoa Công nghệ thông tin - Trường Đại học Du lịch Hải Phòng 51 Đây là bài toán phức tạp liên quan đến nhập liệu tự động. Hiện nay, loại bài toán này đã được nhiều tác giả nghiên cứu. InitBitmapInfoHeader(&bmi, (DWORD)(pcx.window.xmax- pcx.window.xmin+1). DWORD)(pcx.window.ymax- pcx.window.ymin+1), pcx.bitsperpixel);. BOOL WINAPI ReadPCXHeader(HFILE hf, LPPCXHEADER pcxh) {. pcxh->bitsperpixel*pcxh->nplanes != 8)) trả về SAI;.

Tài liệu tham khảo

Tài liệu liên quan