Mục từ này cần được bình duyệt
Khác biệt giữa các bản “Biến đổi ảnh số”
 
(Không hiển thị 3 phiên bản của cùng người dùng ở giữa)
Dòng 2: Dòng 2:
 
'''Biến đổi ảnh số''' là quá trình biến đổi từ miền biểu diễn này sang miền biểu diễn khác của ảnh. Thông thường hình ảnh được biểu diễn trong miền quan sát (cg. miền không gian). Nếu biến đổi hình ảnh từ miền quan sát sang miền tần số hay sang miền không gian khác (vd. không gian Hough) thì có thể tự động nhận biết các đặc trưng hình ảnh mà chúng không thể dễ dàng nhận biết trong miền quan sát. Biến đổi ảnh số được sử dụng trong phân tích, xử lý hình ảnh và thị giác máy tính.
 
'''Biến đổi ảnh số''' là quá trình biến đổi từ miền biểu diễn này sang miền biểu diễn khác của ảnh. Thông thường hình ảnh được biểu diễn trong miền quan sát (cg. miền không gian). Nếu biến đổi hình ảnh từ miền quan sát sang miền tần số hay sang miền không gian khác (vd. không gian Hough) thì có thể tự động nhận biết các đặc trưng hình ảnh mà chúng không thể dễ dàng nhận biết trong miền quan sát. Biến đổi ảnh số được sử dụng trong phân tích, xử lý hình ảnh và thị giác máy tính.
  
Mục đích của biến đổi ảnh số là để làm lộ ra hoặc làm nổi bật một số thông tin mong muốn có trên hình ảnh. Các phép biến đổi hình ảnh thông dụng bao gồm biến đổi Hough, biến đổi Fourier rời rạc, biến đổi Cosin rời rạc, biến đổi Wavelet rời rạc và biến đổi khoảng cách.
+
Mục đích của biến đổi ảnh số là để làm lộ ra hoặc làm nổi bật một số thông tin mong muốn có trên hình ảnh. Các phép biến đổi hình ảnh thông dụng bao gồm [[biến đổi Hough]], [[biến đổi Fourier rời rạc]], [[biến đổi cosin rời rạc]], [[biến đổi wavelet rời rạc]] [[biến đổi khoảng cách]].
  
==Các thể loại biến đổi ảnh số==
+
==Các loại biến đổi==
 
===Biến đổi Hough===
 
===Biến đổi Hough===
 
[[File:Hough transform diagram.svg|nhỏ|phải|350px|Một ví dụ bước đầu tiên của biến đổi Hough, cho 3 điểm, với 5 nhóm góc khả dĩ.]]
 
[[File:Hough transform diagram.svg|nhỏ|phải|350px|Một ví dụ bước đầu tiên của biến đổi Hough, cho 3 điểm, với 5 nhóm góc khả dĩ.]]
Dòng 10: Dòng 10:
  
 
===Biến đổi Fourier===
 
===Biến đổi Fourier===
Biến đổi Fourier là hàm toán học tách tín hiệu dạng sóng (cg. hàm thời gian) thành các tần số tạo nên nó. Ảnh số được xem như hàm biến đổi, tuy nhiên nó không biến đổi theo thời gian mà biến đổi theo hai chiều không gian của hình ảnh. Ví dụ với ảnh số đa cấp xám thì mỗi điểm ảnh có giá trị từ 0 đến 255 để biểu diễn độ xám (cg. cường độ) của điểm ảnh. Vậy, mức xám của điểm ảnh là hàm số của tọa độ điểm ảnh đó. Biến đổi Fourier rời rạc là dạng số của biến đổi Fourier áp dụng cho ảnh số, được sử dụng để tách hình ảnh trong miền không gian thành các thành phần tần số. Biến đổi Fourier rời rạc là biến đổi Fourier áp dụng cho các điểm mẫu, do vậy nó không cho lại toàn bộ tần số để hình thành ảnh số mà chỉ cho lại tập điểm mẫu đủ lớn với khả năng mô tả đầy đủ hình ảnh trong miền không gian. Tổng số tần số tương ứng với tổng số điểm ảnh trong miền không gian. Biến đổi Fourier rời rạc thường được sử dụng để lọc nhiễu hay làm nét hình ảnh. Một hình thức của biến đổi Fourier rời rạc là biến đổi cosin rời rạc. Tương tự như biến đổi Fourier rời rạc, nó được sử dụng để biểu diễn dữ liệu dạng sóng, nhưng chỉ sử dụng phần số thực (thành phần cosin). Biến đổi cosin rời rạc phù hợp với nén ảnh (vd. JPEG) và nén video vì thông tin của ảnh có xu hướng tập trung vào một vài thành phần tần số thấp của biến đổi cosin rời rạc. Ta có thể áp dụng biến đổi cosin rời rạc ngược (IDCT) để có được hình ảnh trong miền thời gian từ hình ảnh trong miền tần số.
+
[[File:Chest radiograph 2D Fourier Spectrum.jpg|nhỏ|trái|Bên trái là một ảnh chụp phổi, bên phải là biểu diễn biến đổi Fourier 2 chiều của ảnh này]]
 +
[[Biến đổi Fourier]] là hàm toán học tách tín hiệu dạng sóng (còn gọi là hàm [[thời gian]]) thành các [[tần số]] tạo nên nó. Ảnh số được xem như hàm biến đổi, tuy nhiên nó không biến đổi theo thời gian mà biến đổi theo hai chiều không gian của hình ảnh. Ví dụ với ảnh số đa cấp xám thì mỗi điểm ảnh có giá trị từ 0 đến 255 để biểu diễn độ xám (hay [[cường độ]]) của điểm ảnh. Vậy, mức xám của điểm ảnh là hàm số của tọa độ điểm ảnh đó. Biến đổi Fourier rời rạc là dạng số của biến đổi Fourier áp dụng cho ảnh số, được sử dụng để tách hình ảnh trong miền không gian thành các thành phần tần số. Biến đổi Fourier rời rạc là biến đổi Fourier áp dụng cho các điểm mẫu, do vậy nó không cho lại toàn bộ tần số để hình thành ảnh số mà chỉ cho lại tập điểm mẫu đủ lớn với khả năng mô tả đầy đủ hình ảnh trong miền không gian. Tổng số tần số tương ứng với tổng số điểm ảnh trong miền không gian. Biến đổi Fourier rời rạc thường được sử dụng để lọc nhiễu hay làm nét hình ảnh. Một hình thức của biến đổi Fourier rời rạc là biến đổi cosin rời rạc. Tương tự như biến đổi Fourier rời rạc, nó được sử dụng để biểu diễn dữ liệu dạng sóng, nhưng chỉ sử dụng phần số thực (thành phần cosin). Biến đổi cosin rời rạc phù hợp với nén ảnh (vd. [[JPEG]]) và nén video vì thông tin của ảnh có xu hướng tập trung vào một vài thành phần tần số thấp của biến đổi cosin rời rạc. Ta có thể áp dụng biến đổi cosin rời rạc ngược (IDCT) để có được hình ảnh trong miền thời gian từ hình ảnh trong miền tần số.
  
 
===Biến đổi sóng con===
 
===Biến đổi sóng con===
Biến đổi sóng con được đề xuất để giải quyết những vấn đề tồn tại của biến đổi Fourier. Biến đổi Fourier cho biết phổ tần số của tín hiệu, nhưng không cho ta biết tần số nào xảy ra vào thời điểm nào. Để giải quyết vấn đề này có thể chia tín hiệu thành các đoạn nhỏ, sau đó áp dụng biến đổi Fourier cho chúng. Nếu ta sử dụng cửa sổ thời gian lớn hơn cho tần số thấp và cửa sổ nhỏ hơn cho tần số cao, thì đó là ý tưởng của biến đổi sóng con. Tương tự như biến đổi Fourier rời rạc, nhiều nhà toán học đã đề xuất biến đổi sóng con rời rạc (DWT) khác nhau để giảm nhiễu (vd. nhiễu Gauss) hay nén ảnh số (vd. JPEG2000).
+
[[Biến đổi sóng con]] (biến đổi wavelet) được đề xuất để giải quyết những vấn đề tồn tại của biến đổi Fourier. Biến đổi Fourier cho biết phổ tần số của tín hiệu, nhưng không cho ta biết tần số nào xảy ra vào thời điểm nào. Để giải quyết vấn đề này có thể chia tín hiệu thành các đoạn nhỏ, sau đó áp dụng biến đổi Fourier cho chúng. Nếu ta sử dụng cửa sổ thời gian lớn hơn cho tần số thấp và cửa sổ nhỏ hơn cho tần số cao, thì đó là ý tưởng của biến đổi sóng con. Tương tự như biến đổi Fourier rời rạc, nhiều nhà toán học đã đề xuất biến đổi sóng con rời rạc (DWT) khác nhau để giảm nhiễu (vd. nhiễu Gauss) hay nén ảnh số (vd. JPEG2000).
 +
 
 
===Biến đổi khoảng cách===
 
===Biến đổi khoảng cách===
 
Biến đổi khoảng cách ảnh số là kỹ thuật tạo ra bản đồ khoảng cách từ một điểm bất kỳ đến một điểm thuộc loại khác (vd. biên của đối tượng) gần nhất trên hình ảnh. Ví dụ biến đổi khoảng cách của ảnh nhị phân là tạo ra bản đồ khoảng cách trong đó với mỗi điểm ảnh sẽ được gán một số là khoảng cách giữa nó tới điểm ảnh gần nhất có giá trị khác không. Biến đổi khoảng cách thường được sử dụng để xác định độ dày của đặc trưng trong ảnh.
 
Biến đổi khoảng cách ảnh số là kỹ thuật tạo ra bản đồ khoảng cách từ một điểm bất kỳ đến một điểm thuộc loại khác (vd. biên của đối tượng) gần nhất trên hình ảnh. Ví dụ biến đổi khoảng cách của ảnh nhị phân là tạo ra bản đồ khoảng cách trong đó với mỗi điểm ảnh sẽ được gán một số là khoảng cách giữa nó tới điểm ảnh gần nhất có giá trị khác không. Biến đổi khoảng cách thường được sử dụng để xác định độ dày của đặc trưng trong ảnh.
 
===Biến đổi hình học===
 
===Biến đổi hình học===
 
Biến đổi hình học (cg. biến đổi không gian) ảnh số là sự sắp xếp lại các điểm ảnh trong hình ảnh. Nói cách khác, biến đổi hình học là một hàm ánh xạ tập điểm ảnh này sang tập điểm ảnh khác theo một số thao tác nào đó. Có bốn loại biến đổi hình học cơ sở, đó là dịch chuyển, co giãn, xoay và phản chiếu. Biến đổi hình học ảnh được sử dụng để loại bỏ sự biến dạng hình học của các đối tượng trên ảnh.
 
Biến đổi hình học (cg. biến đổi không gian) ảnh số là sự sắp xếp lại các điểm ảnh trong hình ảnh. Nói cách khác, biến đổi hình học là một hàm ánh xạ tập điểm ảnh này sang tập điểm ảnh khác theo một số thao tác nào đó. Có bốn loại biến đổi hình học cơ sở, đó là dịch chuyển, co giãn, xoay và phản chiếu. Biến đổi hình học ảnh được sử dụng để loại bỏ sự biến dạng hình học của các đối tượng trên ảnh.
 +
 
==Lịch sử==
 
==Lịch sử==
 
Phương pháp biến đổi Hough do Paul Hough phát minh năm 1962 được Hoa Kỳ cấp chứng nhận bản quyền số US3069654A “Phương pháp và công cụ nhận dạng mẫu phức tạp”. Năm 1972 Richard Duda và Peter Hart đã khái quát hóa biến đổi Hough trong bài báo có tên “Biến đổi Hough tổng quát”. Năm 1981 Dana Ballard đã tổng kết biến đổi Hough trong bài báo khoa học “Tổng quát hóa biến đổi Hough để nhận dạng hình dạng bất kỳ” với khả năng phát hiện các hình dạng có thể biểu diễn bằng tham số trên ảnh số.
 
Phương pháp biến đổi Hough do Paul Hough phát minh năm 1962 được Hoa Kỳ cấp chứng nhận bản quyền số US3069654A “Phương pháp và công cụ nhận dạng mẫu phức tạp”. Năm 1972 Richard Duda và Peter Hart đã khái quát hóa biến đổi Hough trong bài báo có tên “Biến đổi Hough tổng quát”. Năm 1981 Dana Ballard đã tổng kết biến đổi Hough trong bài báo khoa học “Tổng quát hóa biến đổi Hough để nhận dạng hình dạng bất kỳ” với khả năng phát hiện các hình dạng có thể biểu diễn bằng tham số trên ảnh số.

Bản hiện tại lúc 09:31, ngày 13 tháng 10 năm 2022

Biến đổi ảnh số là quá trình biến đổi từ miền biểu diễn này sang miền biểu diễn khác của ảnh. Thông thường hình ảnh được biểu diễn trong miền quan sát (cg. miền không gian). Nếu biến đổi hình ảnh từ miền quan sát sang miền tần số hay sang miền không gian khác (vd. không gian Hough) thì có thể tự động nhận biết các đặc trưng hình ảnh mà chúng không thể dễ dàng nhận biết trong miền quan sát. Biến đổi ảnh số được sử dụng trong phân tích, xử lý hình ảnh và thị giác máy tính.

Mục đích của biến đổi ảnh số là để làm lộ ra hoặc làm nổi bật một số thông tin mong muốn có trên hình ảnh. Các phép biến đổi hình ảnh thông dụng bao gồm biến đổi Hough, biến đổi Fourier rời rạc, biến đổi cosin rời rạc, biến đổi wavelet rời rạcbiến đổi khoảng cách.

Các loại biến đổi[sửa]

Biến đổi Hough[sửa]

Một ví dụ bước đầu tiên của biến đổi Hough, cho 3 điểm, với 5 nhóm góc khả dĩ.

Biến đổi Hough là một kỹ thuật trích chọn đặc trưng hình ảnh. Biến đổi Hough cổ điển được Paul Hough đề xuất năm 1962, để nhận biết vị trí các đoạn thẳng trên ảnh số. Vào năm 1972, Richard Duda và Peter Har đã mở rộng biến đổi Hough cổ điển để có khả năng nhận biết vị trí của hình dạng bất kỳ trên ảnh số như hình tròn, hình elip, đường cong tham số... Biến đổi Hough thực hiện chuyển đổi một hình ảnh từ tọa độ Descartes sang hệ tọa độ cực. Mỗi điểm bất kỳ trong không gian ảnh được biểu diễn bởi đường cong hình sin trong không gian Hough. Hơn nữa, hai điểm trên cùng đoạn thẳng sẽ tạo ra hai đường cong và chúng cắt nhau tại vị trí tương ứng với nơi đoạn thẳng đi qua trong không gian ảnh. Mô hình biến đổi Hough đơn giản nhưng tính toán khá phức tạp, đặc biệt trong trường hợp ảnh có nhiễu hay hình dạng không đầy đủ..

Biến đổi Fourier[sửa]

Bên trái là một ảnh chụp phổi, bên phải là biểu diễn biến đổi Fourier 2 chiều của ảnh này

Biến đổi Fourier là hàm toán học tách tín hiệu dạng sóng (còn gọi là hàm thời gian) thành các tần số tạo nên nó. Ảnh số được xem như hàm biến đổi, tuy nhiên nó không biến đổi theo thời gian mà biến đổi theo hai chiều không gian của hình ảnh. Ví dụ với ảnh số đa cấp xám thì mỗi điểm ảnh có giá trị từ 0 đến 255 để biểu diễn độ xám (hay cường độ) của điểm ảnh. Vậy, mức xám của điểm ảnh là hàm số của tọa độ điểm ảnh đó. Biến đổi Fourier rời rạc là dạng số của biến đổi Fourier áp dụng cho ảnh số, được sử dụng để tách hình ảnh trong miền không gian thành các thành phần tần số. Biến đổi Fourier rời rạc là biến đổi Fourier áp dụng cho các điểm mẫu, do vậy nó không cho lại toàn bộ tần số để hình thành ảnh số mà chỉ cho lại tập điểm mẫu đủ lớn với khả năng mô tả đầy đủ hình ảnh trong miền không gian. Tổng số tần số tương ứng với tổng số điểm ảnh trong miền không gian. Biến đổi Fourier rời rạc thường được sử dụng để lọc nhiễu hay làm nét hình ảnh. Một hình thức của biến đổi Fourier rời rạc là biến đổi cosin rời rạc. Tương tự như biến đổi Fourier rời rạc, nó được sử dụng để biểu diễn dữ liệu dạng sóng, nhưng chỉ sử dụng phần số thực (thành phần cosin). Biến đổi cosin rời rạc phù hợp với nén ảnh (vd. JPEG) và nén video vì thông tin của ảnh có xu hướng tập trung vào một vài thành phần tần số thấp của biến đổi cosin rời rạc. Ta có thể áp dụng biến đổi cosin rời rạc ngược (IDCT) để có được hình ảnh trong miền thời gian từ hình ảnh trong miền tần số.

Biến đổi sóng con[sửa]

Biến đổi sóng con (biến đổi wavelet) được đề xuất để giải quyết những vấn đề tồn tại của biến đổi Fourier. Biến đổi Fourier cho biết phổ tần số của tín hiệu, nhưng không cho ta biết tần số nào xảy ra vào thời điểm nào. Để giải quyết vấn đề này có thể chia tín hiệu thành các đoạn nhỏ, sau đó áp dụng biến đổi Fourier cho chúng. Nếu ta sử dụng cửa sổ thời gian lớn hơn cho tần số thấp và cửa sổ nhỏ hơn cho tần số cao, thì đó là ý tưởng của biến đổi sóng con. Tương tự như biến đổi Fourier rời rạc, nhiều nhà toán học đã đề xuất biến đổi sóng con rời rạc (DWT) khác nhau để giảm nhiễu (vd. nhiễu Gauss) hay nén ảnh số (vd. JPEG2000).

Biến đổi khoảng cách[sửa]

Biến đổi khoảng cách ảnh số là kỹ thuật tạo ra bản đồ khoảng cách từ một điểm bất kỳ đến một điểm thuộc loại khác (vd. biên của đối tượng) gần nhất trên hình ảnh. Ví dụ biến đổi khoảng cách của ảnh nhị phân là tạo ra bản đồ khoảng cách trong đó với mỗi điểm ảnh sẽ được gán một số là khoảng cách giữa nó tới điểm ảnh gần nhất có giá trị khác không. Biến đổi khoảng cách thường được sử dụng để xác định độ dày của đặc trưng trong ảnh.

Biến đổi hình học[sửa]

Biến đổi hình học (cg. biến đổi không gian) ảnh số là sự sắp xếp lại các điểm ảnh trong hình ảnh. Nói cách khác, biến đổi hình học là một hàm ánh xạ tập điểm ảnh này sang tập điểm ảnh khác theo một số thao tác nào đó. Có bốn loại biến đổi hình học cơ sở, đó là dịch chuyển, co giãn, xoay và phản chiếu. Biến đổi hình học ảnh được sử dụng để loại bỏ sự biến dạng hình học của các đối tượng trên ảnh.

Lịch sử[sửa]

Phương pháp biến đổi Hough do Paul Hough phát minh năm 1962 được Hoa Kỳ cấp chứng nhận bản quyền số US3069654A “Phương pháp và công cụ nhận dạng mẫu phức tạp”. Năm 1972 Richard Duda và Peter Hart đã khái quát hóa biến đổi Hough trong bài báo có tên “Biến đổi Hough tổng quát”. Năm 1981 Dana Ballard đã tổng kết biến đổi Hough trong bài báo khoa học “Tổng quát hóa biến đổi Hough để nhận dạng hình dạng bất kỳ” với khả năng phát hiện các hình dạng có thể biểu diễn bằng tham số trên ảnh số.

Nhà toán học và vật lý học người Pháp Jean-Baptiste Joseph Fourier (1768-1830) đã phát minh ra chuỗi số có thể áp dụng phân tích các hài tín hiệu. Nó là nền tảng cho các thuật toán biến đổi ảnh số như biến đổi Fourier rời rạc, biến đổi cosin rời rạc... được áp dụng rộng rãi trong xử lý ảnh và thị giác máy tính. Năm 1972 Nasir Ahmed, lần đầu tiên đưa ra khái niệm biến đổi cosin rời rạc để áp dụng cho nén ảnh số. Đến 1974 Nasir Ahmed cùng Natarajan và Rao công bố bài báo đầu tiên về biến đổi cosin rời rạc, được nhiều nhà khoa học tham khảo. Năm 1992 bài báo này được xem như nền tảng để nhóm Joint Photographic Experts Group lựa chọn thuật toán xây dựng lược đồ nén ảnh số hao hụt thông tin JPEG (cg. chuẩn JPEG).

Nhà toán học Hungary Alfréd Haar phát minh ra biến đổi sóng con rời rạc đầu tiên vào năm 1909. Biến đổi sóng con Haar được sử dụng trong nén ảnh và ngày nay còn được sử dụng nhiều trong giảng dạy. Nhà toán học người Bỉ Ingrid Daubechies (sinh năm 1954) đã đề xuất một họ biến đổi sóng con trực giao làm cho biến đổi sóng con rời rạc có khả năng ứng dụng thực tế cao hơn. Năm 1992, Daubechies cùng Cohen và Feauveau đề xuất biến đổi sóng con CDF 9/7. Năm 1988, LeGall-Tabatabai đề xuất biến đổi sóng con LGT 5/3. Chuẩn nén ảnh và video JPEG 2000 sử dụng LGT 5/3 để nén hao hụt thông tin và CDF 9/7 để nén không hao hụt thông tin.

Biến đổi ảnh số là nền tảng của xử lý ảnh số, được sử dụng vào loại bỏ nhiễu trên ảnh, nâng cao chất lượng ảnh thông qua bộ lọc thông thấp hay bộ lọc thông cao. Biến đổi ảnh số được sử dụng trong các lược đồ nén ảnh và trích chọn các đặc trưng trên ảnh như tách cạnh, tách góc đối tượng trên ảnh. Ngoài ra, Biến đổi ảnh số còn được sử dụng để nắn chỉnh, loại bỏ biến dạng hình ảnh.

Tài liệu tham khảo[sửa]

  • Borko Furht, Esad Akar, Whitney A. Andrews, Digital Image Processing: Practical Approach, Springer Nature Switzerland, 2018
  • Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing, Fourth Edition, Pearson Education, 2018.
  • Solomon Chris, Breckon Toby, Fundamentals of digital image processing: a practical approach with examples in Matlab, John Wiley & Sons, 2011
  • William K. Pratt, Introduction to Digital Image Processing, Taylor & Francis Group, 2014