Friday 9 November 2012

Cấu trúc số của vốn từ trong bản báo cáo của Hồ Cẩm Đào tại đại hội toàn quốc Đảng Cộng Sản Trung Quốc lần thứ 17



Căn cứ vào bản danh sách tần số các chữ Hán đã đượcthiết lập cho bản báo cáo của Hồ Cẩm Đào tại đại hội toàn quốc Đảng Cộng Sản Trung Quốc lần thứ 17, ta thấy vốn từ có kích thước là 1152 đơn vị trên một văn bản dài 23757 lượt từ. Tính trung bình mỗi từ được sử dụng khoảng 21 lần.
Có từ được dùng đến 537 lần (). Mười từ vị đứng đầu danh sách (的和国会主民发展社人) phủ 14% văn bản trong khi 282 hapax (chiếm tỷ lệ 24.47% vốn từ) chỉ phủ được 1.19% bề mặt văn bản). Nói một cách khác, khoảng 1/4 vốn từ ông Hồ Cẩm Đào sử dụng trong bài báo cáo đó chỉ để nghe xong rồi quên. Đố ai nhớ được ông có dùng từ. hay không mặc dù đó là một từ vị rất thông dụng trong sinh hoạt.
Số phận của 123 từ vị có tần số là 2 chắc cũng không khá hơn gì mấy. Nhưng dù sao thì khả năng để chúng lọt từ tai này ra tai kia luôn cũng không đến nỗi tệ như những từ vị thuộc nhóm hapax.
Ông Hồ Cầm Đào liên tục dội các từ vị thuộc nhóm top ten vào tai người nghe. Cứ 20 từ nói ra là có 3 từ nằm trong nhóm đó rồi. Bài diễn văn dài 150 phút, tính ra mỗi phút đều đều nói được khoảng 158 từ thì có 22 từ thuộc về nhóm từ vị top ten với đủ kiểu kết hợp: toàn bài có đến 274社会, 247 发展, 129 人民, 65 民主... Từ xuất hiện 210 lần thì có 19全国, 11 全民, 43 全面 . Nếu ta để ý rằng có tần số là 81, có thể thấy là cứ 2 lần dùng đến  thì có 1 lần xuất hiện tổ hợp全面

No comments:

Post a Comment