Sửa đổi Nhận dạng ảnh

Chú ý: Bạn chưa đăng nhập và địa chỉ IP của bạn sẽ hiển thị công khai khi lưu các sửa đổi.

Bạn có thể tham gia như người biên soạn chuyên nghiệp và lâu dài ở Bách khoa Toàn thư Việt Nam, bằng cách đăng ký và đăng nhập - IP của bạn sẽ không bị công khai và có thêm nhiều lợi ích khác.

Các sửa đổi có thể được lùi lại. Xin hãy kiểm tra phần so sánh bên dưới để xác nhận lại những gì bạn muốn làm, sau đó lưu thay đổi ở dưới để hoàn tất việc lùi lại sửa đổi.

Bản hiện tại Nội dung bạn nhập
Dòng 1: Dòng 1:
{{sơ}}[[File:Aircraft-recognition-and-tracking-by-dsp-based-signal-processing.jpg|nhỏ|Các tiến trình của một phương pháp và hệ thống nhận dạng và theo dõi máy bay tự động]]
+
{{sơ}}'''Nhận dạng ảnh''' (còn gọi là '''nhận dạng đối tượng'''; tiếng Anh ''image recognition'', ''object recognition'') là thuật ngữ dùng để chỉ các công nghệ [[máy tính]] có khả năng nhận biết người, động vật, vật thể hoặc các đối tượng mục tiêu khác thông qua việc sử dụng các phương pháp, thuật toán trong [[học máy]]. Thuật ngữ nhận dạng ảnh liên quan chặt chẽ với các thuật ngữ [[thị giác máy tính]] (''computer vision''), một thuật ngữ bao quát cho quá trình huấn luyện máy tính để chúng có thể “nhìn” được như con người, và [[xử lý ảnh]] (''image processing''), thuật ngữ đề cập đến việc thực hiện các công việc chuyên sâu trên dữ liệu ảnh bằng máy tính (xt. Thị giác máy tính, Xử lý ảnh).
'''Nhận dạng ảnh''' (còn gọi là '''nhận dạng đối tượng'''; tiếng Anh ''image recognition'', ''object recognition'') là thuật ngữ dùng để chỉ các công nghệ [[máy tính]] có khả năng nhận biết người, động vật, vật thể hoặc các đối tượng mục tiêu khác thông qua việc sử dụng các phương pháp, thuật toán trong [[học máy]]. Thuật ngữ nhận dạng ảnh liên quan chặt chẽ với các thuật ngữ [[thị giác máy tính]] (''computer vision''), một thuật ngữ bao quát cho quá trình huấn luyện máy tính để chúng có thể “nhìn” được như con người, và [[xử lý ảnh]] (''image processing''), thuật ngữ đề cập đến việc thực hiện các công việc chuyên sâu trên dữ liệu ảnh bằng máy tính (xt. Thị giác máy tính, Xử lý ảnh).
 
 
   
 
   
 
Các hệ thống nhận dạng ảnh tạo thành một thành phần cốt lõi và có mặt trong hầu hết các hệ thống thông minh hiện đại. Nghiên cứu về các thuật toán nhận dạng đã dẫn đến những tiến bộ vượt bậc trong tự động hóa nhà máy, văn phòng thông qua việc tạo ra các hệ thống nhận dạng ký tự quang học, hệ thống kiểm tra dây chuyền lắp ráp công nghiệp, hệ thống nhận dạng khiếm khuyết trong các sản phẩm điện tử. Nó cũng đã thúc đẩy những tiến bộ đáng kể trong xử lý ảnh y học, quốc phòng, xe tự lái, robotics, sinh trắc học... Tuy có thể chứng kiến hiệu suất vượt xa khả năng con người của các hệ thống như vậy trong những môi trường được kiểm soát chặt chẽ nhưng nhìn chung cho đến nay, các hệ thống nhận dạng ảnh, từ hệ thống nhận dạng ký tự đến các hệ thống có thị giác hiện đại..., đều phải đối mặt với khả năng khái quát hóa so với hệ thống thị giác của con người. Những tác nhân dẫn tới mất kiểm soát bao gồm:  
 
Các hệ thống nhận dạng ảnh tạo thành một thành phần cốt lõi và có mặt trong hầu hết các hệ thống thông minh hiện đại. Nghiên cứu về các thuật toán nhận dạng đã dẫn đến những tiến bộ vượt bậc trong tự động hóa nhà máy, văn phòng thông qua việc tạo ra các hệ thống nhận dạng ký tự quang học, hệ thống kiểm tra dây chuyền lắp ráp công nghiệp, hệ thống nhận dạng khiếm khuyết trong các sản phẩm điện tử. Nó cũng đã thúc đẩy những tiến bộ đáng kể trong xử lý ảnh y học, quốc phòng, xe tự lái, robotics, sinh trắc học... Tuy có thể chứng kiến hiệu suất vượt xa khả năng con người của các hệ thống như vậy trong những môi trường được kiểm soát chặt chẽ nhưng nhìn chung cho đến nay, các hệ thống nhận dạng ảnh, từ hệ thống nhận dạng ký tự đến các hệ thống có thị giác hiện đại..., đều phải đối mặt với khả năng khái quát hóa so với hệ thống thị giác của con người. Những tác nhân dẫn tới mất kiểm soát bao gồm:  
Dòng 28: Dòng 27:
 
Nhận dạng ảnh có khởi đầu của mình từ các ứng dung nhận dạng chữ quang học. Qua hơn sáu thập kỷ, lĩnh vực này đã trải qua các mốc phát triển như sau:  
 
Nhận dạng ảnh có khởi đầu của mình từ các ứng dung nhận dạng chữ quang học. Qua hơn sáu thập kỷ, lĩnh vực này đã trải qua các mốc phát triển như sau:  
 
*Từ những năm 1960 cho đến cuối những năm 1980: Thời kỳ phát triển của các phương pháp dựa trên căn chỉnh và các dạng hình học nguyên thủy như các xấp xỉ đường cong, các hình ellipses, các khối hình trụ...  
 
*Từ những năm 1960 cho đến cuối những năm 1980: Thời kỳ phát triển của các phương pháp dựa trên căn chỉnh và các dạng hình học nguyên thủy như các xấp xỉ đường cong, các hình ellipses, các khối hình trụ...  
*Đầu những năm 1990 xuất hiện các phương pháp dựa trên sự xuất hiện (''appearance-based methods'') của các cấu phần, các nghiên cứu về tính bất biến theo các yếu tố như điểm nhìn, sự chiếu sáng...  
+
*Đầu những năm 1990 xuất hiện các phương pháp dựa trên sự xuất hiện (Appearance-Based Methods) của các cấu phần, các nghiên cứu về tính bất biến theo các yếu tố như điểm nhìn, sự chiếu sáng...  
*Nửa cuối 1990 xuất hiện các phương pháp cửa sổ trượt (''sliding window approaches'') để biểu diễn đối tượng thông qua trích chọn các đặc trưng cục bộ của chúng.  
+
*Nửa cuối 1990 xuất hiện các phương pháp cửa sổ trượt (Sliding Window Approaches) để biểu diễn đối tượng thông qua trích chọn các đặc trưng cục bộ của chúng.  
*Đầu những năm 2000 các mô hình cấu phần-hình dạng (''parts-and-shape models'') được nghiên cứu và áp dụng.
+
*Đầu những năm 2000 các mô hình cấu phần-hình dạng (Parts-and-Shape Models) được nghiên cứu và áp dụng.
*Sau nửa cuối 2000 cho đến nay các mô hình gói đặc trưng/từ (''bags of features''/''words models'') nhanh chóng thể hiện tính ưu việt trong nhiều ứng dụng.  
+
*Sau nửa cuối 2000 cho đến nay các mô hình gói đặc trưng/từ (Bags of Features/Words Models) nhanh chóng thể hiện tính ưu việt trong nhiều ứng dụng.  
 
*Những năm gần đây các phương pháp học sâu, đặc biệt mạng nơ ron tích chập, đã mang lại các tiến bộ mang tính đột phá trong nhận dạng ảnh.  
 
*Những năm gần đây các phương pháp học sâu, đặc biệt mạng nơ ron tích chập, đã mang lại các tiến bộ mang tính đột phá trong nhận dạng ảnh.  
*Xu thế trong tương lai là việc kết hợp các phương pháp cục bộ với các phương pháp toàn cục, mô hình hóa ngữ cảnh nhằm giải quyết các bài toán hiểu cảnh quan (''scene understanding'').
+
*Xu thế trong tương lai là việc kết hợp các phương pháp cục bộ với các phương pháp toàn cục, mô hình hóa ngữ cảnh nhằm giải quyết các bài toán hiểu cảnh quan (''scene understanding'').  
 
 
 
==Ứng dụng==
 
==Ứng dụng==
 
Nhận dạng ảnh hiện đang được ứng dụng rộng rãi trong nhiều lĩnh vực và tạo nên những thay đổi sâu sắc trong mọi mặt đời sống xã hội. Có thể điểm qua vài ví dụ tiêu biểu:
 
Nhận dạng ảnh hiện đang được ứng dụng rộng rãi trong nhiều lĩnh vực và tạo nên những thay đổi sâu sắc trong mọi mặt đời sống xã hội. Có thể điểm qua vài ví dụ tiêu biểu:
Dòng 42: Dòng 40:
 
*Giám sát quân sự. Phát hiện các hoạt động bất thường ở khu vực biên giới và khả năng ra quyết định tự động có thể giúp ngăn chặn sự xâm nhập và dẫn đến cứu mạng sống của binh lính.
 
*Giám sát quân sự. Phát hiện các hoạt động bất thường ở khu vực biên giới và khả năng ra quyết định tự động có thể giúp ngăn chặn sự xâm nhập và dẫn đến cứu mạng sống của binh lính.
 
*Hoạt động trong rừng. Máy bay không người lái có thể giám sát rừng, dự đoán những thay đổi có thể dẫn đến cháy rừng và ngăn chặn nạn săn trộm. Nó cũng có thể cung cấp giám sát đầy đủ trên một vùng rộng lớn mà con người không thể dễ dàng tiếp cận.
 
*Hoạt động trong rừng. Máy bay không người lái có thể giám sát rừng, dự đoán những thay đổi có thể dẫn đến cháy rừng và ngăn chặn nạn săn trộm. Nó cũng có thể cung cấp giám sát đầy đủ trên một vùng rộng lớn mà con người không thể dễ dàng tiếp cận.
*Chăm sóc sức khỏe. Một trong những khả năng nổi bật nhất của nhận dạng ảnh là hỗ trợ tạo ra [[hiện thực ảo tăng cường]] (''augmented reality'' - AR) ứng dụng trong y học - một công nghệ hình ảnh siêu âm được tạo ra trên máy tính từ góc nhìn của người dùng. Khi cung cấp cho một hệ thống [[trí tuệ nhân tạo]] công nghệ hiện thực ảo tăng cường với cơ sở dữ liệu chứa các dấu hiệu trực quan về bệnh lý hoặc bệnh tật sẽ tạo ra một trợ lý y tế với trí nhớ tuyệt vời. Với nó, các bác sĩ có thể nhận được các đề xuất chẩn đoán chi tiết theo thời gian thực khi theo dõi thực trạng bệnh nhân hoặc các tài liệu y tế trong khi khám. Cũng có thể sử dụng các kỹ thuật thị giác máy tính để giúp người khiếm thị trong các tương tác hàng ngày của họ, giống như một chiếc gậy đi bộ công nghệ cao...
+
*Chăm sóc sức khỏe. Một trong những khả năng nổi bật nhất của nhận dạng ảnh là hỗ trợ tạo ra hiện thực ảo tăng cường (Augmented Reality - AR) ứng dụng trong y học - một công nghệ hình ảnh siêu âm được tạo ra trên máy tính từ góc nhìn của người dùng. Khi cung cấp cho AI công nghệ AR với cơ sở dữ liệu chứa các dấu hiệu trực quan về bệnh lý hoặc bệnh tật sẽ tạo ra một trợ lý y tế với trí nhớ tuyệt vời. Với nó, các bác sĩ có thể nhận được các đề xuất chẩn đoán chi tiết theo thời gian thực khi theo dõi thực trạng bệnh nhân hoặc các tài liệu y tế trong khi khám. Cũng có thể sử dụng các kỹ thuật thị giác máy tính để giúp người khiếm thị trong các tương tác hàng ngày của họ, giống như một chiếc gậy đi bộ công nghệ cao...
 
*An ninh và trật tự an toàn xã hội. Nhận dạng vân tay, nhận dạng mặt người, nhận dạng biển số xe, nhận dạng thẻ tín dụng...
 
*An ninh và trật tự an toàn xã hội. Nhận dạng vân tay, nhận dạng mặt người, nhận dạng biển số xe, nhận dạng thẻ tín dụng...
 
*Tìm kiếm thông tin. Nhận dạng ảnh cũng đã được ứng dụng để tìm kiếm thông tin trong Google, Bing...
 
*Tìm kiếm thông tin. Nhận dạng ảnh cũng đã được ứng dụng để tìm kiếm thông tin trong Google, Bing...
 
 
==Xu thế==
 
==Xu thế==
 
Nhận dạng ảnh là công cụ mạnh mở ra kỷ nguyên trong đó máy bắt đầu “hiểu” những gì chúng “nhìn thấy” nhờ được trang bị các thiết bị quang học. Nếu so sánh với nhận dạng tiếng nói, nhận dạng ảnh hứa hẹn mang lại lợi ích, như người ta vẫn nói “Trăm nghe không bằng một thấy” hay “Một bức tranh đáng giá hơn ngàn lời nói”.
 
Nhận dạng ảnh là công cụ mạnh mở ra kỷ nguyên trong đó máy bắt đầu “hiểu” những gì chúng “nhìn thấy” nhờ được trang bị các thiết bị quang học. Nếu so sánh với nhận dạng tiếng nói, nhận dạng ảnh hứa hẹn mang lại lợi ích, như người ta vẫn nói “Trăm nghe không bằng một thấy” hay “Một bức tranh đáng giá hơn ngàn lời nói”.
Dòng 62: Dòng 59:
  
 
[[Thể loại:Thị giác máy]]
 
[[Thể loại:Thị giác máy]]
[[Thể loại:Nhận dạng]]
 
 
[[Thể loại:Công nghệ thông tin]]
 
[[Thể loại:Công nghệ thông tin]]

Lưu ý rằng tất cả các đóng góp của bạn tại Bách khoa Toàn thư Việt Nam sẽ được phát hành theo giấy phép Creative Commons Ghi công–Chia sẻ tương tự (xem thêm Bản quyền). Nếu bạn không muốn những gì mình viết ra sẽ có thể được bình duyệt và có thể bị sửa đổi, và không sẵn lòng cho phép phát hành lại, xin đừng nhấn nút “Lưu trang”. Đảm bảo rằng chính bạn là tác giả của những gì mình viết ra, hoặc chép nó từ một nguồn thuộc phạm vi công cộng hoặc tự do tương đương. ĐỪNG ĐĂNG NỘI DUNG CÓ BẢN QUYỀN MÀ CHƯA XIN PHÉP!

Hủy bỏ Trợ giúp sửa đổi (mở cửa sổ mới)

Bản mẫu dùng trong trang này: