Tách biên ảnh (hay Phát hiện biên ảnh,tiếng Anh Image Edge Detection) là xác định các điểm ảnh tại đó có sự thay đổi đột ngột về mức xám hoặc màu sắc, đặc điểm hình học hay bản chất vật lý của đối tượng. Đường biên được tạo ra khi kết nối các điểm biên là đường liên thông. tách biên ảnh là một pha quan trọng trong chuỗi xử lý ảnh cấp thấp, thường được thực hiện sau các pha tiền xử lý như loại bỏ nhiễu, lọc ảnh.
Mô hình biên là mô hình biểu diễn biên, được phân loại theo hình dáng của hàm thay đổi mức xám của các điểm ảnh. Có 3 loại mô hình biên: Mô hình bước nhảy (step model) là mô hình biên lý tưởng trong đó sự dịch chuyển giữa hai mức xám là một điểm ảnh. Hầu hết các giải thuật phát hiện biên đều dựa trên mô hình này. Mô hình dốc (ramp model) là mô hình trong đó các biên ảnh bị mờ và nhiễu (do hệ thống thu nhận ảnh và ống kính). Khi đó sự dịch chuyển giữa hai mức xám lớn hơn một điểm ảnh. Điểm biên sẽ là bất kỳ điểm nào nằm trong phần dịch chuyển này. Mô hình mái (roof model) là mô hình biên xuất hiện khi các đối tượng là mảnh (ví dụ vạch làn đường)
Nguyên lý tách biên ảnh[sửa]
Điểm biên là điểm có sự thay đổi đột ngột của các giá trị điểm ảnh (mức xám, màu sắc). Vì vậy phát hiện biên là phát hiện sự thay đổi đột ngột các giá trị này. Ảnh được biểu diễn bởi một hàm toán học hai chiều I (x, y). Sự thay đổi sẽ được xác định bởi các đạo hàm của I (x, y) theo các hướng. Đạo hàm bậc một lớn hơn 0 tại điểm biên và bằng 0 ở các vùng không phải biên. Đạo hàm bậc 2 có điểm qua 0 tại miền bậc thang. Như vậy biên độ của đạo hàm bậc một lớn hoặc sự đổi dấu của đạo hàm bậc 2 là các dấu hiệu cho phép xác định điểm biên trong ảnh. Khi ảnh bị nhiễu, các dấu hiệu để phát hiện biên sẽ bị ảnh hưởng. Vì vậy, cần thực hiện loại bỏ nhiễu ảnh trước khi thực hiện PHB.
Lịch sử nghiên cứu[sửa]
Bài toán tách biên ảnh đã được nghiên cứu từ những năm 70 của thập kỷ trước. Các giải thuật tách biên ảnh được phân thành hai nhóm. Nhóm thứ nhất gồm các phương pháp tách biên ảnh mà không quan tâm đến thông tin cần phải biết trước về biên cần phát hiện. Nhóm thứ 2 tách biên ảnh có tính đến yếu tố ngữ cảnh. Các phương pháp thuộc cả hai nhóm đều thực hiện các bước cơ bản như lọc nhiễu; tính toán đạo hàm; gán nhãn điểm biên. Lọc nhiễu là loại bỏ các điểm nhiễu có thể ảnh hưởng đến kết quả tách biên ảnh. Lọc nhiễu thường được tiến hành thông qua việc áp dụng các giải thuật làm mịn ảnh. Do tính chất thay đổi đột ngột giá trị điểm ảnh tại các điểm biên, việc tính toán đạo hàm cho phép làm nổi bật các dấu hiệu tách biên ảnh. Việc gán nhãn là xác định vị trí của điểm biên khi nó thỏa mãn các dấu hiệu phát hiện. Gradient của một hàm hai chiều tại một điểm là một vector 2 chiều, mỗi thành phần của nó là đạo hàm bậc nhất theo chiều ngang hoặc chiều dọc. Hướng của vector gradient vuông góc với hướng của đường biên. Laplace là một toán tử đối xứng tròn của đạo hàm bậc hai của ảnh. Toán tử Laplacian khi áp dụng trên ảnh thường làm nổi bật các vùng ảnh có sự thay đổi đột ngột của giá trị mức xám và thường được sử dụng cho tách biên ảnh. Năm 1970, Sobel, Prewitt đề xuất áp dụng các bộ lọc phát hiện biên trực tiếp lên ảnh mà không qua lọc nhiễu. Các phương pháp này tính toán trực tiếp Gradient cho mỗi điểm ảnh sau đó tìm cực trị địa phương để xác định các điểm biên. Sobel là một phép toán tích chập 2D lên ảnh, được sử dụng rộng rãi để tính toán Gradient theo hai hướng. Giải thuật Sobel đơn giản nhưng khá nhạy với nhiễu. Các đường biên phát hiện được có độ dày lớn hơn một điểm ảnh.
Năm 1986, Canny đã đề xuất một giải thuật phát hiện biên và là giải thuật sử dụng phổ biến nhất cho đến hiện nay bởi hiệu năng vượt trội của nó so với một số giải thuật mới hơn sau này. Canny coi bài toán tách biên ảnh là một bài toán tối ưu với ba tiêu chí: phát hiện tốt; định vị tốt và độ dày biên có giá trị một điểm ảnh.
Năm 1980, Marr and Hildreth đưa thang đo vào trong bài toán phát hiện biên. Trước khi tách biên ảnh, các ảnh được làm mịn bởi các bộ lọc Gauss có kích thước khác nhau. Mỗi kích thước tương ứng với một giá trị thang đo. Sau này, các giải thuật tách biên ảnh được thực hiện ở đa phân giải nhằm tạo ra đường biên có chất lượng tốt hơn.
Năm 1987, Schunck đề xuất tách biên ảnh từ ảnh lọc từ các hàm Gauss, sau đó mới áp dụng giải thuật Canny. Năm 1990, Lacroix tránh hiện tượng phân mảnh biên bằng cách theo vết các đường biên từ nhỏ đến lớn. Cũng năm đó, William và Shah đưa ra một chiến thuật tách biên ảnh đa phân giải và kết nối các đường biên trong không gian thang đo. Năm 1990, Perona and Malik đề xuất biểu diễn ảnh dựa trên khuếch tán không đẳng hướng và áp dụng vào tách biên ảnh. Năm 1992, Jeong and Kim đưa ra chiến thuật xác định thang đo tối ưu cho mỗi điểm biên. Năm 1995, Bennamoun giới thiệu một bộ tách biên ảnh 2 kênh đồng thời làm nhiệm vụ định vị biên và giảm nhiễu.
Phương trình khuếch tán không đẳng hướng của Perona và Malick không thực sự ổn định cân bằng. Vì vậy năm 1998, Fontaine và Basu đã đề xuất sử dụng wavelet để giải phương trình này nhằm tách biên ảnh tốt hơn. Năm 2003, Lu và cộng sự đề xuất mạng neuron mờ để tách biên ảnh. Năm 2004, Chang và cộng sự thiết kế mạng neuron ngữ cảnh để tách biên ảnh ảnh y tế CT và MRI. Năm 2005, Shih và Tseng kết hợp tách biên ảnh dựa trên gradient với theo vết biên đa phân giải dựa trên wavelet. Năm 2007, Heric và Zazula đề xuất một giải thuật sử dụng biến đổi wavelet Haar. Cùng năm đó, Wu và các cộng sự đề xuất giải thuật tách biên ảnh mờ đa mức cho kết quả tốt hơn giải thuật tách biên ảnh của Canny.
Ứng dụng[sửa]
Tách biên ảnh ảnh là một bài toán trung gian, cho phép xác định vùng chứa đối tượng (bao bởi đường biên) hoặc tính toán các đặc điểm về hình dáng của đối tượng dựa trên đường biên. tách biên ảnh có nhiều ứng dụng khác nhau như:
- Phân vùng ảnh
- Tìm kiếm và theo vết đối tượng ảnh
- Nhận dạng đặc điểm sinh trắc học (khuôn mặt, vân tay)
- Phân tích ảnh y tế
Tách biên ảnh đã được nghiên cứu và phát triển từ hơn 50 mươi năm qua. Các giải thuật cũng đã đạt được hiệu năng nhất định. tách biên ảnh có triển vọng ứng dụng vào các bài toán với các đối tượng hình học tương đối đơn giản. Một số phương pháp hiện nay triển khai phát hiện biên dựa trên kỹ thuật học sâu cũng đang được phát triển với mục đích tập trung phát hiện biên của đối tượng quan tâm hơn là phát hiện biên trên toàn bộ ảnh.
Bài toán tách biên ảnh cũng đã được các nhà khoa học tại Việt Nam nghiên cứu và ứng dụng chủ yếu trong phân tích ảnh y tế, ảnh vệ tinh, đặc tả đối tượng, sinh trắc học.
Tài liệu tham khảo[sửa]
- Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing. -Second Edition, Prentice Hall, 2002
- R. M. Haralick, Digital step edges from zero-crossings of second directional derivatives. -IEEE Trans. Pattern Anal. Machine Intell., 6 (1984)
- D. Marr, E. Hildreth, Theory of edge detection, Proc. R. Soc. London, 207 (1980) pp.187–217
- J. Canny, A computational approach to edge detection. - IEEE Trans. Pattern Anal. Machine Intell., 8: 6 (1986) pp.679–698.
- P. Perona, J. Malik, Scale-space and edge detection using anisotropic diffusion. - IEEE Trans. Pattern Anal. Machine Intell., 12: 7 (1990) pp.629–639.