Bảo quản tài liệu điện tử (tiếng Anh e-document archive) là hoạt động lưu trữ, cập nhật và cung cấp các đối tượng (đa phương tiện) dạng số hóa như văn bản, hình ảnh, biểu đồ, phim, âm thanh, video, dữ liệu, … trên các thiết bị mang tin như băng, đĩa, trống, ổ lưu trữ dạng từ tính, quang học, … Hoạt động này được thực hiện thông qua một hệ thống bao gồm mô hình, các nguyên lý, kiến trúc, phương pháp, và các phương thức quản lý và khai thác các đối tượng. Các tài liệu điện tử thường được lưu trữ cùng với các phương thức quản lý các tài liệu đó. Thông tin được lưu trữ có thể bao gồm: thể loại số hóa, thời điểm, vị trí (địa chỉ) chuyển dịch các tài liệu từ dạng thức này sang dạng thức khác (vd. từ băng từ sang đĩa) và các chỉ dẫn về việc hủy các nguồn cũ.
Một kỹ thuật thường dùng trong lưu trữ các tài liệu điện tử là quản lý phân cấp. Kỹ thuật này cho phép chuyển đổi tự động dữ liệu lưu trữ giữa các dạng thức lưu trữ chi phí cao và lưu trữ chí phí thấp. Các thiết bị lưu trữ tốc độ cao như ổ đĩa trạng thái rắn (SSD) đòi hỏi chi phí cao hơn các thiết bị có tốc độ thấp như ổ đĩa cứng, đĩa quang học hoặc băng từ. Khi cần lưu trữ ổn định, lâu dài với mức độ khai thác thấp, các tài liệu sẽ được sao lại trên các thiết bị tốc độ thấp. Khi cần khai thác với mức độ cao, các tài liệu sẽ được sao chép qua các thiết bị tốc độ cao hoặc bộ nhớ đệm.
Lịch sử
Quá trình phát triển của hoạt động bảo quản tài liệu điện tử gắn bó chặt chẽ với sự phát triển của các thiết bị lưu trữ và mạng viễn thông.
Khoảng thời gian từ những năm 1950 đến 1970, các tài liệu điện tử được lưu trữ chủ yếu tại các trung tâm tính toán trên các thiết bị từ tính với số lượng người dùng hạn chế và được cấp phép đặc biệt về quyền truy cập/truy nhập và khai thác.
Thời gian 1970 đến 1980 là giai đoạn bùng nổ các thiết bị lưu trữ cá nhân như đĩa mềm và các thiết bị lưu trữ theo công nghệ laser như đĩa quang, dung lượng lưu trữ và tốc độ xử lý được phát triển nhanh chóng cộng với năng lực của các phần mềm nén dữ liệu, chuyển đổi định dạng dữ liệu, sử dụng bộ nhớ đệm và các thuật toán truy nhập tối ưu hóa, đã tạo điều kiện ra đời các công ty chuyên trách về số hoá, lữu trữ và bảo quản các tài liệu điện tử. Các bộ chuẩn về thiết bị, định dạng và trao đổi dữ liệu được phát triển theo quy mô toàn cầu.
Từ năm 1990, mạng máy tính ra đời và đặc biệt là từ năm 2000, điện toán đám mây được hình thành và phát triển đã làm thay đổi căn bản các quy trình, nguyên lý và luật số hóa các hoạt động phát sinh, thuê bao, quản lý và khai thác các tài liệu điện tử. Các công ty và tập đoàn riêng lẻ đã liên kết với nhau để hình thành mạng lưới bảo quản và khai thác tài liệu điện tử theo nguyên tắc hợp tác lưu trữ tích cực và sáng tạo.
Sau khi điện toán đám mây ra đời, nhiều công ty và tập đoàn công nghệ thông tin cung cấp cho khách hàng những dung lượng lưu trữ hàng trăm giga (tỷ) byte với các mức khuyến mại khác nhau. Các công nghệ và kỹ thuật sao lưu, cấp phát và chuyển đổi theo đó được phát triển nhanh chóng. Các chuẩn định dạng dữ liệu cũng được thống nhất giữa các tập đoàn và các quốc gia. Nhu cầu ngày một gia tăng của khách hàng đòi hỏi phải giải quyết hàng loạt vấn đề về an toàn và an ninh dữ liệu.
Xu thế
Một xu thế tất yếu là tri thức của nhân loại sẽ được điện tử hóa và mỗi cá nhân trên toàn cầu sẽ hoạt động trong các hệ thống điện tử như chính phủ điện tử, trường học điện tử, kinh doanh và sản xuất điện tử, chăm sóc sức khỏe điện tử, thư giãn và vui chơi điện tử… Các hệ thống này đều được xây dựng trên các tài liệu điện tử với các mức độ lưu trữ và phát triển khác nhau từ thấp như các file đến các cơ sở dữ liệu, ngân hàng dữ liệu, kho dữ liệu và mạng dữ liệu và tri thức.
Công nghệ nano, quang tử và vi sinh học sẽ là những hứa hẹn tương lai cho hoạt động lưu trữ các tri thức của nhân loại dưới dạng số hóa. Hai hướng phát triển quan trọng trong lĩnh vực bảo quản các tài liệu điện tử được quan tâm hiện nay là:
- Về phần cứng: nghiên cứu, sản xuất các thiết bị lưu trữ dung lượng cao và ổn định.
- Về phần mềm: nghiên cứu các thuật toán tối ưu hóa nén dữ liệu, diệt virus, lưu trữ, cập nhật, chuyển đổi định dạng.
Các vấn đề được quan tâm ở Việt Nam:
- tham gia định chuẩn các tài liệu điện tử (vd. tham gia định chuấn bộ font tiếng Việt trong dự án Unicode);
- chỉnh lý các luật về lưu trữ, bảo mật và khai thác các tài liệu số hóa;
- số hóa các tài liệu lưu trữ để phục vụ nghiên cứu khoa học, trị thủy, bảo vệ thiên nhiên và an ninh quốc phòng.
Tài liệu tham khảo
- Buckland, M. K. (1997). Dictionnaire encyclopédique de l'information et de la documentation. (Collection REF). Editions Nathan, Paris, pp.105-106.
- Levy, D. M. (1994). "Document stability and new media ", in: European Conference on Hypertext Technology 1994 Proceedings. (Pp.24-31). Association for Computing Machinery, New York.
- Sebeok, T. A. (1994). Encyclopedic dictionary of semiotics.2nd ed., Mouton de Gruyter, Berlin.
- Otlet, P. (1990). International organization and dissemination of knowledge: Selected essays. (FID 684). Elsevier, Amsterdam.