• Không có kết quả nào được tìm thấy

Tìm hiểu phương pháp cực tiểu năng lượng dựa trên độ đồng nhất và độ không ổn định cho phân đoạn ảnh

Protected

Academic year: 2024

Chia sẻ "Tìm hiểu phương pháp cực tiểu năng lượng dựa trên độ đồng nhất và độ không ổn định cho phân đoạn ảnh"

Copied!
58
0
0

Loading.... (view fulltext now)

Văn bản

Sự hướng dẫn của thầy đã giúp em hiểu thêm về phân đoạn ảnh, đặc biệt là phương pháp giảm thiểu năng lượng dựa trên tính đồng nhất và không ổn định cho phân đoạn ảnh. Phân đoạn là nhiệm vụ nổi bật nhất trong các ứng dụng hình ảnh cụ thể, chẳng hạn như các ứng dụng liên quan đến phân loại đối tượng, phân tích hình dạng và chuyển động. Vì nhiều lý do, việc xác định chính xác và hiệu quả các đối tượng là quan trọng trong xử lý ảnh máy tính và nhiệm vụ này được gọi là phân đoạn ảnh.

Mục tiêu chính của tôi là tìm hiểu phương pháp giảm thiểu năng lượng dựa trên tính đồng nhất và độ biến động của phân đoạn hình ảnh. Trong chương này tôi xin trình bày thêm hai thuật toán phân đoạn ảnh đó là thuật toán Entropy tối đa và thuật toán phân chia tối thiểu.

TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÂN ĐOẠN ẢNH

Tổng quan về xử lý ảnh

  • XLA là gì?
  • Sơ đồ tổng quát XLA
  • Mô tả (biểu diễn ảnh)
  • Các khái niệm cơ bản

Phương pháp nhận dạng hình ảnh được sử dụng khi nhận dạng tế bào, nhiễm sắc thể, nhận dạng chữ cái, v.v. Bản chất của công việc nhận dạng là phân loại các đối tượng thành các lớp đối tượng đã biết hoặc thành các lớp đối tượng chưa biết. Bài toán nhận dạng hình ảnh là một bài toán lớn, có nhiều ý nghĩa thực tiễn và chúng ta cũng có thể thấy rằng để công việc nhận dạng được dễ dàng thì hình ảnh cần được tách thành các đối tượng riêng biệt - đó chính là mục tiêu của chúng ta. vấn đề chính của việc phân đoạn ảnh.

Nếu phân đoạn ảnh không tốt sẽ dẫn đến sai sót trong quá trình nhận dạng ảnh nên người ta coi việc phân đoạn ảnh là một bài toán then chốt trong quá trình xử lý ảnh nói chung. Phân đoạn hình ảnh là tách hình ảnh gốc thành các vùng thành phần để biểu diễn phân tích hoặc nhận dạng hình ảnh.

1.1.2  Sơ đồ tổng quát XLA
1.1.2 Sơ đồ tổng quát XLA

Tổng quan về phân đoạn ảnh

Trước hết, cần làm rõ khái niệm “vùng ảnh” (đoạn) và đặc điểm vật lý của vùng. Các điểm ảnh trong vùng ảnh có mức độ biến đổi mức xám tương đối đồng nhất hoặc kết cấu tương tự. Dựa vào số lượng ngưỡng áp dụng cho cùng một tập dữ liệu, người ta sẽ phân loại các phương pháp áp dụng ngưỡng đơn, ngưỡng kép hoặc ngưỡng bội.

Nếu trên cơ sở sự biến đổi của giá trị ngưỡng, trong cùng một lĩnh vực ứng dụng, người ta sẽ chia thành phương pháp sử dụng ngưỡng cố định (Không đổi|Ngưỡng cố định) và ngưỡng không cố định (Ngưỡng thích ứng). Thông thường, giá trị này được xác định bằng cách kiểm tra tập dữ liệu bằng phương pháp thống kê.

CÁC HƢỚNG TIẾP CẬN CHÍNH TRONG PHÂN ĐOẠN ẢNH

  • Các phƣơng pháp dựa trên không gian đặc trƣng
  • Các phƣơng pháp dựa trên không gian ảnh
  • Các phƣơng pháp dựa trên mô hình vật lý
  • Một số thuật toán phân đoạn ảnh
    • Thuật toán Entropy cực đại
    • Thuật toán độ lệch nhỏ nhất

Đặc tính này là quan trọng thứ hai sau đặc tính đồng nhất của các vùng hình ảnh. Bởi vì các phương pháp phân cụm trên cũng như xác định ngưỡng biểu đồ đều bỏ qua thông tin về vị trí pixel trong ảnh. Trong các báo cáo khoa học về phân đoạn ảnh mức xám, có khá nhiều kỹ thuật cố gắng thỏa mãn đồng thời cả tiêu chí về tính đồng nhất về không gian đặc trưng ảnh và tính đồng nhất của nội dung ảnh.

Tất cả các thuật toán được thảo luận ở mức độ lớn hơn hoặc thấp hơn đều có khả năng tạo ra lỗi phân đoạn trong các trường hợp đặc biệt khi các đối tượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng. Độ sáng hoặc độ bóng, những hiện tượng này khiến màu sắc đồng nhất trong ảnh thay đổi ít nhiều một cách đột ngột. Các công cụ toán học được sử dụng trong các phương pháp này không khác nhiều so với các phương pháp được trình bày ở trên, điểm khác biệt chính là việc sử dụng các mô hình vật lý để minh họa tính chất phản xạ ánh sáng lên màu sắc bề mặt của vật thể. Ông đã trình bày một mô hình phản xạ lưỡng sắc cho vật liệu điện môi không đồng nhất.

Hai người đàn ông cùng tên Tsang đã áp dụng mô hình phản xạ lưỡng sắc trong không gian HSV để xác định ranh giới trong ảnh màu. Các phương pháp được đề cập trong phần này chỉ áp dụng cho hai loại vật liệu: kim loại và chất điện môi không đồng nhất. Có tính liên tục trong không gian hình ảnh và khả năng thích ứng cục bộ với các vùng hình ảnh.

Dựa vào độ sáng của pixel để chia nhỏ vùng sao cho các vùng đều nhau. Việc xác định tính đồng nhất của màu sắc có thể phức tạp và khó khăn. Xem xét hình ảnh từ các vùng nhỏ nhất và sau đó kết hợp chúng nếu chúng đáp ứng cùng tiêu chí, chẳng hạn như cùng màu, cùng mức xám... để có được vùng đồng nhất lớn hơn.

Rất khó để thu thập tập hợp các điểm giống và xác định các điều kiện đồng nhất đầy đủ. Tuy nhiên, nhược điểm của hầu hết các phương pháp phân đoạn dựa trên biểu đồ là chúng không quan tâm đến vị trí pixel trong không gian và dễ bị ảnh hưởng bởi nhiễu.

Hình 2.1. Phân đoạn theo thuật toán Entropy cực đại  a)  và f). Ảnh gốc. b) và g). Ảnh sau khi phân đoạn
Hình 2.1. Phân đoạn theo thuật toán Entropy cực đại a) và f). Ảnh gốc. b) và g). Ảnh sau khi phân đoạn

PHƢƠNG PHÁP CỰC TIỂU NĂNG LƢỢNG DỰA TRÊN ĐỘ

  • Giới thiệu
    • Cơ sở lý thuyết
    • Tối ƣu và tự động ngƣỡng
  • Lý thuyết
    • Cƣờng độ dựa trên độ không ổn định
    • Bề mặt năng lƣợng và tối ƣu ngƣỡng
  • Phƣơng pháp
    • Phân bố xác suất tiên nghiệm đối tƣợng o ( )và nền B ( )
    • Hàm mật độ
    • Bản đồ gradient chuẩn ∇ σ
    • Tối ƣu giá trị của và σ trên bề mặt năng lƣợng E
  • Tiến trình giải thuật

Đặt o( ) biểu thị xác suất lấy nét mà đối tượng pixel có giá trị cường độ. Tương tự đối với xác suất tiêu điểm B( ) đối với nền pixel có giá trị cường độ. Theo phương trình trên, mỗi pixel p tham gia năng lượng theo hai cách - Độ không đảm bảo cao và độ dốc thấp.

Như đã trình bày ở phần trên, E là hàm năng lượng thay đổi theo hai tham số: ngưỡng và gradient σ. Hai tham số này biểu thị bề mặt năng lượng cho hàm E và hàm E giúp tối ưu hóa hai tham số này trên bề mặt năng lượng. Bây giờ tôi xin trình bày các phương pháp tối ưu hóa tham số ngưỡng và gradient σ.

Vì vậy, yếu tố quan trọng nhất ở đây là xác định hình dạng của các điểm tối ưu trên bề mặt năng lượng. Đối với tham số ngưỡng, phạm vi cường độ là [IMIN, IMAX], được sử dụng để tìm kiếm các vị trí tối ưu. Vị trí tối ưu của loại II tạo thành một thung lũng có ý nghĩa về dòng năng lượng.

Ví dụ minh họa dòng năng lượng và bề mặt năng lượng. a) Các đường màu đỏ biểu thị dòng năng lượng và biểu thị ngưỡng tối ưu hoặc lỗ trống hợp lệ. Trong hình 3.1, các đường màu đen biểu thị các dòng năng lượng thuộc dải cường độ [IMIN, IMAX] tại giá trị gradient cho trước σ0, mỗi màu thể hiện mỗi lưu vực sẽ cho một đầu ra tiểu cục bộ riêng biệt, còn độ sâu của thung lũng là khoảng cách từ đỉnh của màu đến đáy của nó, trong khi các thung lũng màu đỏ là điểm nhiễu hoặc các điểm thung lũng không hợp lệ. Xác định vị trí tối ưu loại I trên bề mặt năng lượng E và loại II của dòng năng lượng Eσ.

Hình 3.2. Ví dụ minh họa dòng năng lƣợng và bề mặt năng lƣợng.
Hình 3.2. Ví dụ minh họa dòng năng lƣợng và bề mặt năng lƣợng.

CÀI ĐẶT CHƢƠNG TRÌNH VÀ ĐÁNH GIÁ

Cài đặt chƣơng trình

  • Định dạng ảnh BMP
  • Cài đặt thử nghiệm

Chứa chữ ký hình ảnh có giá trị 0x4D42, kích thước file, dung lượng lưu trữ, thông tin về thông tin bitmap (lưu trữ địa chỉ của vùng dữ liệu). Bảng màu (4*n byte), n là số lượng màu trong ảnh: xác định các màu sẽ được sử dụng trong ảnh. Khi hình ảnh được lưu, các pixel được ghi trực tiếp vào tệp - một pixel sẽ được mô tả bằng một hoặc nhiều byte tùy thuộc vào giá trị n của hình ảnh.

Vì vậy, ảnh lưu dưới dạng BMP thường có dung lượng rất lớn, lớn gấp nhiều lần so với ảnh nén (như GIF, JPEG hay PNG). IMIN –IMAX)] và với mỗi giá trị gradient σ ngưỡng thay đổi trong phạm vi [IMIN, IMAX].

Một số kết quả và đánh giá

Kết quả phân đoạn hình ảnh cô gái và sơ đồ dòng năng lượng. a) Ảnh gốc. Phương pháp giảm thiểu năng lượng dựa trên tính đồng nhất và không ổn định có thể tự động xác định nhiều ngưỡng cần thiết cho một hình ảnh. Trong quá trình nghiên cứu tài liệu và triển khai đề tài dưới sự chủ trì của PGS. giáo sư bác sĩ

Sau khi tìm hiểu tổng quan về XLA và phân đoạn ảnh, tôi đã có cái nhìn hệ thống về các phương pháp tiếp cận chính trong phân đoạn ảnh và một số thuật toán. Tôi đã học và triển khai phương pháp giảm thiểu năng lượng dựa trên tính đồng nhất và không ổn định để phân đoạn hình ảnh. Một phương pháp bề mặt năng lượng để tối ưu hóa đồng thời ngưỡng và độ dốc nhằm cải thiện khả năng phân đoạn.

Là một phần của đồ án tốt nghiệp, tôi chỉ trình bày những kiến ​​thức đã học chứ không đề xuất một phương pháp hoàn toàn mới. Do thời gian có hạn nên việc trình bày thuật toán phân đoạn chưa đầy đủ và khoa học. Dựa trên những kết quả đầu tiên đạt được trong dự án, tôi đã đề xuất một số cải tiến về thuật toán phân đoạn để phân đoạn hiệu quả hơn trong tương lai.

Xây dựng một ứng dụng xử lý ảnh hoàn chỉnh dựa trên các thuật toán được trình bày trong đồ án. Ứng dụng này nhằm mục đích phân đoạn hình ảnh để xác định các thành phần trong hình ảnh. Các thuật toán phân đoạn trình bày trong luận án đều có thể áp dụng cho ảnh tĩnh, trong thời gian tới tôi hy vọng có thể tìm hiểu và phát triển một phương pháp giảm thiểu năng lượng dựa trên tính đồng nhất và không ổn định cho ảnh động hoặc video ngắn.

Tài liệu tham khảo

Đề cương

Tài liệu liên quan