ngữ hệ của khoảng 170 ngôn ngữ, phân bố ở nhiều nước châu Á: Trung Quốc, Ấn Độ, Miến Điện, Thái Lan, Lào, Việt Nam, Campuchia, Malaysia và đảo Nicobar thuộc Ấn Độ Dương. (Nam Á (Austroasiatic, hoặc Austro-asiatic, trong đó Austro - “nam, phương nam” và Asia - “Á, châu Á”)).
Hiện nay có những ý kiến chưa thống nhất về số lượng các chi (dòng) trong ngữ hệ Nam Á. Có ý kiến cho là có hai chi: Mun Đa (Munda) và Môn - Khơ Me (Mon-Khmer). Có ý kiến cho là có ba chi, bốn chi: Ngoài Munda và Mon-Khmer, những cái tên chi khác nữa được nhắc tới là: Nicobar, Aslian... Ý kiến cho là có hai chi (Mun Đa và Môn-Khơ Me) phổ biến hơn: Đa số các nhà khoa học thừa nhận quan hệ cội nguồn rất gần giữa Mun Đa và Môn-Khơ Me và xem chúng như các thành viên chính thức của ngữ hệ Nam Á. Chi Mun Đa có ở đông bắc Ấn Độ và Nepan; Môn-Khơ Me ở đông bắc Ấn Độ, Mianma, Thái Lan, Lào, Việt Nam, Campuchia, Malaysia, Trung Quốc (Vân Nam và Quảng Tây) và đảo Nicobar.
Số lượng các tiểu chi, nhánh, nhóm và các ngôn ngữ thành viên cũng được quan tâm và nhiều điểm chưa thể khẳng định. Năm 1992, trong Từ điển Bách khoa quốc tế ngôn ngữ học, G. Diffloth đưa ra một cách phân loại cho CNNNA nói chung và chi Môn-Khơ Me nói riêng:
Chi Mun Đa: Nhánh Mun Đa Bắc: a, Korku; b, Kherwarian (Santali, Munđari, Ho); Nhánh Mun Đa Nam: a, Kharia-Juang b, Koraput.
Chi Môn-Khơ Me: Tiểu chi Môn-Khơ Me Bắc, gồm các nhánh: Khơ Mú; Paluang; Khasi; Mảng (Palju, Pu Kan).
Tiểu chi Môn-Khơ Me Đông, gồm các nhánh: Ka Tu; Ba Na; Khơ Me; Pear; Việt; Môn; Asli; Nicobar.
Đến nay, phần lớn CNNNA chưa hoặc ít được nghiên cứu. Chưa đầy đủ những miêu tả ngữ âm, ngữ pháp, bảng từ vựng của nhiều ngôn ngữ Nam Á. Trong nghiên cứu so sánh lịch sử ngôn ngữ Nam Á, chưa có các công trình phục nguyên hệ thống ngữ âm, ngữ pháp, các từ điển từ nguyên của các nhóm, nhánh, chi ngôn ngữ thuộc ngữ hệ Nam Á.
Khu vực Đông Nam Á lục địa, trong đó có Việt Nam được xem là cái nôi hình thành những dân tộc nói CNNNA. Đó là một khu vực rộng lớn và liên tục từ Trung Quốc đến Ấn Độ (hướng đông - tây) và từ nam Trung Quốc đến Malaysia (hướng bắc - nam). Trong số CNNNA, tiếng Việt - ngôn ngữ quốc gia ở Việt Nam là ngôn ngữ Nam Á có số lượng người nói đông nhất (tiếng mẹ đẻ của khoảng trên 73 triệu người), sau đó là tiếng Khơ Me - ngôn ngữ quốc gia ở Campuchia, với khoảng gần 10 triệu người. Tiếng Việt cũng là ngôn ngữ được nghiên cứu nhiều nhất trong CNNNA. Dựa trên những kết quả nghiên cứu mới đây một số nhà khoa học cho rằng, cái nôi hình thành ngôn ngữ proto Việt-Chứt là khu vực hiện nay thuộc tỉnh Nghệ An, Hà Tĩnh, Quảng Bình (Việt Nam), Khăm Muộn, Borikhamsay (Lào).
Trên lãnh thổ Việt Nam, trong số 54 dân tộc, có 25 dân tộc nói CNNNA. Trong các dân tộc nói CNNNA, một số dân tộc bao gồm nhiều nhóm địa phương, có thể nói một hoặc một vài ngôn ngữ khác nhau. Số lượng ngôn ngữ Nam Á ở Việt Nam chắc chắn nhiều hơn số lượng dân tộc: khoảng trên 40 ngôn ngữ.
Việt Nam chỉ có những ngôn ngữ đại diện cho chi Môn-Khơ Me. Trong chi Môn-Khơ Me có nhiều nhánh, trong đó có những nhánh không có đại diện ở Việt Nam: Khasi, Mon, Pear... Các nhánh có đại diện ở Việt Nam: Việt (Vietic, còn gọi là Việt – Chứt); Mảng (Mangic); Khơ Mú - Xinh Mun (Khmuic); Cơ Tu - Bru (Katuic); Ba Na (Bahnaric); Khơ Me (Khmeric). Cụ thể là:
1/ Các ngôn ngữ đại diện cho nhánh Việt: Việt, Mư¬ờng, Nguồn, Poọng, Thổ, Đan Lai, Cuối, Rục, Mày, Sách, Má Liềng, Kari (Phoọng), Arem...
2/ Ngôn ngữ đại diện cho nhánh Mảng: Mảng.
3/ Các ngôn ngữ đại diện cho nhánh Khơ Mú - Xinh Mun: Khơ Mú, Xinh Mun, Kháng, Ơ Đu.
4/ Các ngôn ngữ đại diện cho nhánh Cơ Tu - Bru: Cơ Tu, Bru, Pa Cô, Ta Ôi.
5/ Các ngôn ngữ đại diện cho nhánh Ba Na:
- Nhóm Ba Na-Xơ Đăng (Ba Na Bắc - North Bahnaric): Ba Na, Co (Cua), Ca Dong, Ha Lăng, Gié (Jeh), Triêng, Pơ Noong, Xơ Đăng (Stẹang), Tơ Đrạ, Rơ Ngao, Hrê, Mơ Nâm, Rơ Măm...
- Nhóm Laven-Brao (Ba Na Tây - West Bahnaric): Brâu.
- Nhóm Mnông - Mạ (Ba Na Nam - South Bahnaric): Mnông, Cơ Ho, Mạ, Xtiêng, Chơ Ro.
6/ Ngôn ngữ đại diện cho nhánh Khơ Me (Khmeric): Khơ Me.
Một số đặc trưng cơ bản của CNNNA:
- Có những nét chung và cơ bản nhất của loại hình ngôn ngữ đơn lập, trong đó đặc điểm phi hình thái ("vô dạng") là nổi bật nhất và quan trọng nhất, chi phối hoặc kéo theo hầu như tất cả các đặc điểm khác.
- Trong loại hình đơn lập này, có sự phân biệt ước lệ thành hai tiểu loại là “cổ” và “trung” (không có “mới”) trong CNNNA.
Các ngôn ngữ “cổ”: có nhiều từ âm vị học đa tiết (chưa xảy ra, hoặc chưa chịu tác động nhiều của quá trình đơn tiết hóa), phần lớn không có thanh điệu, là đa số CNNNA: Mã Liềng, Arem, Poọng, Rục, Mày, Sách, Khạ Phọong... (nhánh Việt); Mảng (nhánh Mảng); Xinh Mun, Ơ Đu, Khơ Mú... (nhánh Khơ Mú); Bru , Pa Cô, Ta Ôi, Cơ Tu... (nhánh Cơ Tu); Ba Na, Co, Ca Dong, Ha Lăng, Gié, Triêng, Xơ Đăng, Xơ Rá, Rơ Ngao, Hrê, Mơ Nâm, Ve, Rơ Măm, Brâu, Cơ Ho, Mnông, Mạ, Xtiêng, Chơ Ro (nhánh Ba Na); Khơ Me (nhánh Khơ Me)... Các ngôn ngữ thuộc loại thứ hai có các từ âm vị học đa tiết (song tiết, và có thể là ba hoặc bốn âm tiết) cùng một loạt tính chất đi kèm trong thành phần của âm tiết chính: các tổ hợp phụ âm đa dạng; hệ thống phụ âm cuối phong phú; số lượng nguyên âm khá lớn... Các ngôn ngữ thuộc loại thứ hai này, bên cạnh những nét chung của loại hình ngôn ngữ đơn lập, còn mang một số đặc tính của loại hình chắp dính (agglutinating): còn tồn tại cách cấu tạo từ bằng phụ tố (tiền tố và trung tố). Trong các ngôn ngữ này, hình vị có thể nhỏ hay lớn hơn âm tiết.
Các ngôn ngữ “trung”: từ âm vị học đơn tiết (quá trình đơn tiết hóa đã hoàn tất, có hiện tượng"đơn lập hóa âm tiết"), có thanh điệu, là: Việt, Mường, Nguồn, Cuối, Rục, Mã Liềng, Poọng, Mảng, Arem, Sách, Mày... (nhánh Việt), Kháng (nhánh Khơ Mú), tiếng Mạ và một vài tiếng địa phương của Cơ Ho (nhánh Ba Na)... Tính đơn tiết của các ngôn ngữ này mang đến kết quả là thường gặp một đơn vị hiển nhiên trong cảm thức bản ngữ: một đơn vị vừa là âm tiết, vừa có thể là hình vị hoặc từ (gọi là "tiếng"). Trong các ngôn ngữ này, hình vị và từ thường có kích cỡ bằng nhau và trùng với âm tiết.
- Tương ứng với sự phân biệt trên là sự phân bố địa lí: Ở Việt Nam, CNNNA tiểu loại "cổ" phần lớn tập trung ở phía Nam và Đông Nam; các ngôn ngữ "trung" phần lớn tập trung ở phía Bắc và Tây Bắc.
Tài liệu tham khảo
1. Solncev V.M... (1982), "Về ý nghĩa của việc nghiên cứu các ngôn ngữ phương đông đối với sự phát triển của ngôn ngữ học đại cương", T/c Ngôn ngữ, số 4.
2. Hoàng Tuệ, Hoàng Văn Ma..., Ngôn ngữ các dân tộc thiểu số Việt Nam và chính sách ngôn ngữ, Nxb KHXH, H., 1984.
3. Solncev V.M. - Hoàng Tuệ, "Một số kết quả khảo sát điều tra ngôn ngữ các dân tộc ở nước CHXHCN Việt Nam", T/c Ngôn ngữ, số 3, 1984.
4. Nguyễn Văn Lợi, “Tiếng Việt và họ ngôn ngữ Nam Á”, T/c Ngôn ngữ, số 4, 1990.
5. Nguyễn Tài Cẩn, Giáo trình lịch sử ngữ âm tiếng Việt, Nxb Giáo dục, H, 1995.
6. Nguyễn Hữu Hoành, Nguyễn Văn Lợi, Tạ Văn Thông, Ngôn ngữ, chữ viết các dân tộc thiểu số ở Việt Nam (Những vấn đề chung), Nxb Từ điển Bách khoa, H, 2013.
7. Tạ Văn Thông, Tạ Quang Tùng, Ngôn ngữ các dân tộc ở Việt Nam, Nxb Đại học Thái Nguyên, Thái Nguyên, 2017.
8. Haudricourt, A.G., "The Limits and Connections of Austroasiatic in the Northeast", In Studies in Comparative Austroasiatic Linguistics, N.H. Zide, 1966 ed. pp. 44-56. The Hague: Mouton.
9. Thomas D. and Headley R.K, "More on Mon-Khmer supgroupings", Lingua 25, 1970, 398-418.
10. Haudricourt, A.G., "Two-Way and Three-Way Splitting of Tonal Systems in some Far Eastern Languages", In Tai Phonetics and Phonology, 1972.
1. Diffloth G, "Austro-Asiatic languages", Interrational Encyclopedia of Linguistics, Vol 1, Ed. by William Bright. Oxford Univ. Press, 1992.
12. Banker, Miriam A., "Bibliography of Muong and other Vietic language groups, with notes". Mon-Khmer Studies 23, 1993, p.197-243.
13. Bradley, David, ed., "Papers in Southeast Asian linguistics", Tibeto-Burman languages of the Himalayas. PL, No. 14, A-86, 1997.