Đợt
xếp hạng này đã đánh giá 177 đơn vị và xếp hạng 132 đơn vị (theo trang
web xephangvanban.com) bao gồm 7 khu vực: 1) Bộ và Văn phòng Trung
ương; 2) Ủy ban nhân dân Tỉnh và Thành phố trực thuộc Trung ương; 3) Cơ
quan thuộc Chính phủ và thuộc Bộ; 4) Đại học và Viện nghiên cứu; 5) Báo
chí, nhà xuất bản và cơ quan truyền thông; 6) Doanh nghiệp Việt nam; 7)
Tổ chức và doanh nghiệp nước ngoài tại Việt Nam.
Nhóm Tác giả
đã thống kê trên 67.000 mẫu với kết quả cho ra, tỷ lệ lỗi chính tả
trung bình của văn bản tiếng Việt là 7.79%, cao hơn nhiều so với mức
yêu cầu tối thiểu.
Các kết quả đánh giá chi tiết được công bố
trên trang Web www.xephangvanban.com cho thấy, tỷ lệ lỗi chính tả cao
nhất như sau: “soi mói” 74,33%,“sáng lạn” 41,66%, “cọ sát” 28,38% và
“thăm quan” 20,61%.
Khu vực báo chí và truyền thông có tỷ lệ
lỗi chính tả cao nhất, gần mức báo động 10%. Đặc biệt, Đài tiếng nói
Việt Nam là cơ quan truyền thông lớn của Chính phủ, có tỷ lệ lỗi hơn
30%, đứng đầu về tỷ lệ lỗi.
Khu vực Đại học và Viện nghiên cứu có
tỷ lệ lỗi xấp xỉ mức trung bình của xã hội, chưa phát huy được sự mẫu
mực và tiên phong trong vấn đề dùng chữ nghĩa. Đặc biệt, cả hai khu vực
này đều có các đại diện có tỷ lệ lỗi vượt mức 30%.
Khu vực
chính quyền địa phương, và các cơ quan thuộc chính phủ, thuộc Bộ có tỷ
lệ lỗi chính tả khá cao. Đặc biệt, có đơn vị có tỷ lệ lỗi gần 40%.
Ngay cả các khu vực khá nhất là doanh nghiệp và các Bộ vẫn còn phải tiếp tục cải thiện chất lượng để có thể đạt được mức 1%.
Kết
quả nói trên đã phản ánh tình hình báo động của chính tả tiếng Việt.
Ông Nguyễn Ái Việt, Phó Viện trưởng Viện CNTT, Đại học Quốc gia Hà Nội,
thành viên của nhóm tác giả chia sẻ, công bố xếp hạng này với mong muốn
cố gắng giúp toàn thể xã hội và các đơn vị được xếp hạng bước đầu nhận
thức được tầm quan trọng của vấn đề chính tả tiếng Việt.
Các
đợt đánh giá tiếp sau sẽ được tiến hành 3 tháng một lần và sẽ liên tục
được mở rộng về quy mô để hậu thuẫn cho một chiến dịch cộng đồng về
quét lỗi chính tả.
Việc giới thiệu các sản phẩm soát lỗi chính
tả tiếng Việt một cách khách quan trong bản đánh giá xephangvanban sẽ
là cần thiết cho chiến dịch quét lỗi chính tả. Dựa trên một phân tích
thống kê, nhóm tác giả đã ước lượng được tỷ lệ giữa lỗi phi từ và lỗi
thực từ là 31.69%: 68.31%.
Trái với quan niệm của một số chuyên
gia CNTT, khác với trong tiếng Anh, lỗi thực từ chiếm đa số trong tiếng
Việt. Điều đó có thể giải thích tại sao, các sản phẩm không có khả năng
quét lỗi thực từ đã không nhận được hưởng ứng mạnh mẽ từ phía người
dùng.
Để đánh giá khách quan, nhóm tác giả đã đề nghị sử dụng
các độ đo như độ nhận biết, độ chính xác và khả năng gợi ý để đánh giá
hiệu năng cho các phần mềm soát lỗi. Nhóm chuyên gia cũng đưa ra độ đo
VIE: độ đo cân bằng giữa các yếu tố nói trên và tỷ lệ với tần số xuất
hiện các lỗi phi từ và lỗi từ thực.
Được biết, trước khi đánh
giá chất lượng chính tả văn bản tiếng Việt, nhóm tác giả đã tiến hành
một cuộc điều tra nhỏ trong hai nhóm Chuyên gia ngôn ngữ và Chuyên gia
CNTT: Nhóm chuyên gia ngôn ngữ yêu cầu tỷ lệ lỗi chính tả trong văn bản
Việt phải là dưới 1%. Nhóm chuyên gia CNTT chấp nhận tỷ lệ này trong
khoảng 2,5-5%.
Cả hai nhóm chuyên gia đều nhất trí cho rằng báo
chí và truyền thông có trách nhiệm nhiều nhất đối với tình hình chính
tả tiếng Việt. Tuyệt đại đa số các chuyên gia cũng cho rằng tỷ lệ 10%
là ngưỡng báo động đối với các lỗi chính tả và 30% là ngưỡng mà một lỗi
chính tả đã trở thành một cách viết có thể đồng thời được chấp nhận.
Trong
tương lai, các doanh nghiệp, chuyên gia và người sử dụng có thể tiếp
tục giới thiệu các sản phẩm mới giúp ích cho chính tả tiếng Việt với
cộng đồng trên trang Web ww.xephangvanban.com.