MOS (mean opinion score) là một thước đo được dùng trong lĩnh vực chất lượng trải nghiệm và kỹ thuật viễn thông, đại diện cho chất lượng tổng thể của một hệ thống. Nó là trung bình cộng của tất cả các giá trị độc lập dựa trên một thang đo đã được định sẵn mà một người gán cho ý kiến cá nhân của họ về hiệu suất của chất lượng hệ thống. Những đánh giá này thường được tập hợp lại trong những bài kiểm tra đánh giá chất lượng chủ quan, nhưng những đánh giá này cũng có thể được ước lượng theo thuật toán.
MOS là một thước đo thông thường dùng để đánh giá chất lượng âm thanh và video nhưng không chỉ giới hạn ở những phương thức đó. Liên minh Viễn Thông Quốc tế (ITU-T) đã định nghĩa một vài cách để đề cập đến một MOS tùy vào điểm số được lấy từ bài kiểm tra chất lượng về cuộc đối thoại, nghe, nói hoặc nghe nhìn.
Thang điểm đánh giá và định nghĩa toán học[sửa]
MOS được diễn tả bằng một số hữu tỉ, thường từ 1 đến 5, trong đó 1 là chất lượng thấp nhất và 5 là chất lượng cao nhất. Có thể có các quãng đánh giá trung bình khác, tùy thuộc vào thước đo được dùng trong các bài kiểm tra trước đó. Thước đo thể loại tuyệt đối đánh giá là một thước đo được sử dụng phổ biến
Điểm số | Đánh giá |
---|---|
5 | Excellent (xuất xắc) |
4 | Good (tốt) |
3 | Fair (bình thường) |
2 | Poor (kém) |
1 | Bad (tồi) |
Các thước đo chất lượng chuẩn khác có thể được tìm thấy trong các đề cử của ITU-T. Ví dụ như thước đo tiếp diễn từ 1 đến 100. Thang đo nào được dùng tùy thuộc vào mục đích của bài kiểm tra. Trong nhiều tình huống thì không có nhiều khác biệt thống kê đáng kể giữa các xếp hạng cho cùng một hệ thống khi mà các kết quả đó được thu về từ các thước đo khác nhau.
MOS được tính là trung bình cộng của tất cả các kết quả đơn lẻ của một tác động trong một bài kiểm tra đánh giá chất lượng chủ quan.
trong đó R là đánh giá đơn lẻ cho một hệ thống bởi N người.
Các tính chất của MOS[sửa]
MOS tuân theo các tính chất và thành kiến toán học nhất định. Nói chung thì có cuộc tranh luận đang diễn ra về sự hữu ích của MOS để xác định chất lượng trải nghiệm bằng một giá trị vô hướng.
Khi nhận được kết quả MOS bằng thang đánh giá phân loại, nó được dựa trên - giống như thang đo Likert - một loại thang đo thứ tự. Trong trường hợp này, xếp hạng của các thứ bậc được biết rõ ràng, còn khoảng cách giữa các thứ bậc thì không. Vì thế, việc tính trung bình cộng của các số đo đơn lẻ để lấy xu hướng chung là không chính xác về mặt lý thuyết toán học; nên sử dụng điểm ở giữa thay vì trung bình cộng. Nhưng trong thực tế và trong định nghĩa của MOS, việc sử dụng trung bình cộng là việc chấp nhận được.
Khi sử dụng các thang đánh giá phân loại, mỗi người sẽ thấy khoảng cách giữa các thứ bậc khác nhau. Ví dụ như là khoảng cách giữa bình thường và tốt sẽ lớn hơn khoảng cách giữa tốt và xuất xắc. Khoảng cách giữa các thứ bậc này cũng còn tùy thuộc vào ngôn ngữ mà thang đánh giá được dịch sang. Tuy nhiên, có những nghiên cứu không thể chứng minh được ảnh hưởng đáng kể của bản dịch của thang đo đối với kết quả nhận được.
Tài liệu tham khảo[sửa]
- ITU-T Rec. P.10 (2006) Vocabulary for performance and quality of service.
- Đ. T. Hạnh, Đ. V. Chuyết, and V. Đ. Hoà (Aug. 2017) GIẢI PHÁP CẢI TIẾN NÂNG CAO CHẤT LƯỢNG TRUYỀN VIDEO TRÊN MÔI TRƯỜNG WIRELESS LAN doi: 10.15625/vap.2017.00025.