网络语言使用频率的分析研究 “顶”位居第一
来源:新华网 | 作者:郑拓巍
对语言使用频率的分析和研究并不是一个新题目,每当语言形式或语言载体发生变化时,都要引发人们对此的思索。众所周知,在英文中使用频率最高的词是——“the”,而使用频率最好的字母是——“E”,柯南道尔在《福尔摩斯探案集》中就曾经对此有过描写,福尔摩斯在纷繁的舞蹈小人密码中准确找出了单词“the”,并由此破译了整个密文。这应该也是对语言频率分析结论的一种实践,虽然以今天的观念看这种实践并不典型。实际上,在大众传播这一概念被提出之前,语言频率分析始终是瞄准密文破译这一目标进行的,二战中任何有经验的参谋长都会要求表述作战命令的电文尽量简短,从而降低关键词汇的使用频率和被破译的风险。美国人在珍珠港被偷袭后开始重视监听日本无线电通信,并准确的判断出一个高使用频率词汇的实际含义是“中途岛”,他们在中途岛布下的口袋改变了战争的进程,乃至世界历史的走向,可谓成绩斐然。所以,语言分析的应用,尤其是词汇的应用频率,对于判断人类行为乃至思潮的指示作用是不言而喻的——特定语言展示的就是特定的人。 虽然语言的实质是特定的逻辑含义,在一定程度上语言的实质具备脱离语言形式和载体的独立性,但语言的功能是交流,这也就注定了这种独立性是相当有限的。语言形式对语言本身的反作用是有目共睹的,例如:印刷术在英国的出现改变了英语词汇的拼写习惯 ,报纸在中国的出现推进了“白话文”运动,同样互联网的全球化普及也正在改变着我们的语言。网络首先发挥了西方后工业化环境中孩子们的语言想象力,他们用“U”表示“you”;用“R”表示“are”;用“thx”表示“thanks”;用“pls”表示“please”;用“ICQ”表示“I seek you”;当然,这些拼写简化仅仅是网络语言特征极小的一部分。汉语的特点是表意,这和西方表音的语言系统有着很大的差别,所以东西方语言在网络上呈现的新特点也不尽相同。 2006年5月22日,第一个《中国语言生活状况报告》由教育部和国家语委公布,该报告是有国家语言资源检测与研究中心对7所高校2005年的网站BBS用字统计后得出的,使用结果排名如下: 1. 顶(支持) 2. 555(呜呜呜) 3. ding(顶) 4. mm/MM(妹妹) 5. LZ(楼主) 6. DD/dd(弟弟) 7. 88(拜拜) 8. 偶(我) 9. 马甲(ID) 10. ID (身份) 11. 斑竹(版主) 12. 恩(嗯) 13. 汗或寒(敬畏) 14. 晕(非常惊异) 15. ps/PS(photoshop的简称) 16. 灌水(发帖子) 17. ddd(顶顶顶) 18. bs/BS(鄙视) 19. 楼猪(楼主) 20. 滴(的、地)
根据排名前20位使用频率最高的词汇,我们可以进行一些简单分类:首先是单纯简化的词语,例如:“555”表示“呜呜呜”,即——哭泣,虽然哭泣是相当形象化的表情,但用“555”表示实际上是应用同音符号对这样的情绪进行了简化,用“88”表示“拜拜(再见)”也属于这种情况,这和西方语言的简化很类似;其次是夸张表现的词语,例如:用“顶”表示对对方的认可,用“晕”表示非常惊异或不可思议,用“汗(流下冷汗)”或“寒(全身发抖)”表示敬畏的情绪,可见网络用语对使用语言的情绪特征有放大作用,很多时候需要相当夸张的表现自己的情绪;再次是个性化词语,例如:用“马甲”表示ID(登录特定系统的用户标识),用“偶”表示“我”,用“滴”表示“的”或“地”,用“灌水”表示发帖子(所谓发帖子是只给出一个话题主题,或者对别人的话题给予评论);此外就是讽刺和回避,例如:用“楼猪”表示“楼主”(给出特定话题的人,或者用个人观点引出一个话题的人),用“bs/BS”表示鄙视 ;最后是技术型障碍或错误,例如:用“斑竹”表示“版主”,这完全是因为大多数上网的人群使用的是拼音输入法,而“斑竹”是微软拼音输入法中的一个特定词汇,所以当连续输入时人们就用“斑竹”替代了“版主”,因为当时微软拼音输入法中没有“版主”这个词汇,如果非严格的输入“版主”两个字是非常不便的,所以这种情况是典型的技术障碍,而用“恩”替代“嗯”则不仅仅是因为输入效率的问题,也反映了很多人无法区分这两个词汇的区别;
|