中国高等教育学会语文教育专业委小学语文教学法研究中心副秘书长管季超创办的公益服务教育专业网站 TEl:13971958105

教师之友网

 找回密码
 注册
搜索
查看: 93|回复: 2
打印 上一主题 下一主题

网络语言使用频率的分析研究 “顶”位居第一

[复制链接]
跳转到指定楼层
1#
发表于 2013-12-12 20:36:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
网络语言使用频率的分析研究 “顶”位居第一

来源:新华网 | 作者:郑拓巍

  对语言使用频率的分析和研究并不是一个新题目,每当语言形式或语言载体发生变化时,都要引发人们对此的思索。众所周知,在英文中使用频率最高的词是——“the”,而使用频率最好的字母是——“E”,柯南道尔在《福尔摩斯探案集》中就曾经对此有过描写,福尔摩斯在纷繁的舞蹈小人密码中准确找出了单词“the”,并由此破译了整个密文。这应该也是对语言频率分析结论的一种实践,虽然以今天的观念看这种实践并不典型。实际上,在大众传播这一概念被提出之前,语言频率分析始终是瞄准密文破译这一目标进行的,二战中任何有经验的参谋长都会要求表述作战命令的电文尽量简短,从而降低关键词汇的使用频率和被破译的风险。美国人在珍珠港被偷袭后开始重视监听日本无线电通信,并准确的判断出一个高使用频率词汇的实际含义是“中途岛”,他们在中途岛布下的口袋改变了战争的进程,乃至世界历史的走向,可谓成绩斐然。所以,语言分析的应用,尤其是词汇的应用频率,对于判断人类行为乃至思潮的指示作用是不言而喻的——特定语言展示的就是特定的人。
    虽然语言的实质是特定的逻辑含义,在一定程度上语言的实质具备脱离语言形式和载体的独立性,但语言的功能是交流,这也就注定了这种独立性是相当有限的。语言形式对语言本身的反作用是有目共睹的,例如:印刷术在英国的出现改变了英语词汇的拼写习惯 ,报纸在中国的出现推进了“白话文”运动,同样互联网的全球化普及也正在改变着我们的语言。网络首先发挥了西方后工业化环境中孩子们的语言想象力,他们用“U”表示“you”;用“R”表示“are”;用“thx”表示“thanks”;用“pls”表示“please”;用“ICQ”表示“I seek you”;当然,这些拼写简化仅仅是网络语言特征极小的一部分。汉语的特点是表意,这和西方表音的语言系统有着很大的差别,所以东西方语言在网络上呈现的新特点也不尽相同。     2006年5月22日,第一个《中国语言生活状况报告》由教育部和国家语委公布,该报告是有国家语言资源检测与研究中心对7所高校2005年的网站BBS用字统计后得出的,使用结果排名如下:     1. 顶(支持)     2. 555(呜呜呜)     3. ding(顶)     4. mm/MM(妹妹)     5. LZ(楼主)     6. DD/dd(弟弟)     7. 88(拜拜)     8. 偶(我)     9. 马甲(ID)     10. ID (身份)     11. 斑竹(版主)     12. 恩(嗯)     13. 汗或寒(敬畏)     14. 晕(非常惊异)     15. ps/PS(photoshop的简称)     16. 灌水(发帖子)     17. ddd(顶顶顶)     18. bs/BS(鄙视)     19. 楼猪(楼主)     20. 滴(的、地)
  根据排名前20位使用频率最高的词汇,我们可以进行一些简单分类:首先是单纯简化的词语,例如:“555”表示“呜呜呜”,即——哭泣,虽然哭泣是相当形象化的表情,但用“555”表示实际上是应用同音符号对这样的情绪进行了简化,用“88”表示“拜拜(再见)”也属于这种情况,这和西方语言的简化很类似;其次是夸张表现的词语,例如:用“顶”表示对对方的认可,用“晕”表示非常惊异或不可思议,用“汗(流下冷汗)”或“寒(全身发抖)”表示敬畏的情绪,可见网络用语对使用语言的情绪特征有放大作用,很多时候需要相当夸张的表现自己的情绪;再次是个性化词语,例如:用“马甲”表示ID(登录特定系统的用户标识),用“偶”表示“我”,用“滴”表示“的”或“地”,用“灌水”表示发帖子(所谓发帖子是只给出一个话题主题,或者对别人的话题给予评论);此外就是讽刺和回避,例如:用“楼猪”表示“楼主”(给出特定话题的人,或者用个人观点引出一个话题的人),用“bs/BS”表示鄙视 ;最后是技术型障碍或错误,例如:用“斑竹”表示“版主”,这完全是因为大多数上网的人群使用的是拼音输入法,而“斑竹”是微软拼音输入法中的一个特定词汇,所以当连续输入时人们就用“斑竹”替代了“版主”,因为当时微软拼音输入法中没有“版主”这个词汇,如果非严格的输入“版主”两个字是非常不便的,所以这种情况是典型的技术障碍,而用“恩”替代“嗯”则不仅仅是因为输入效率的问题,也反映了很多人无法区分这两个词汇的区别;

2#
 楼主| 发表于 2013-12-12 20:36:54 | 只看该作者
下表对使用频率最高的网络词汇进行了完整的分类:     形成原因         词汇排位序号       词汇     输入简化 2 用“555”表示哭泣的声音,拟音简化              4 用“mm”或“MM”表示“妹妹”,拼音缩写              5 用“LZ”表示“楼主”,拼音缩写              6 用“DD”或“dd”表示“弟弟”,拼音缩写              7 用“88”表示“拜拜”,拟音简化              10 用“ID”表示自己身份,西方词汇引用简化              15 用“ps”或“PS”表示“photoshop”,西方词汇缩写简化              17 用“ddd”表示“顶顶顶”,拼音简化     夸张表现 1 用“顶”表示支持和赞同的情绪              13 用“汗”或“寒”表示敬畏的情绪              14 用“晕”表示非常惊异的情绪     个性化词语 9 用“马甲”表示ID,通过具体化展现个性                8 用“偶”表示“我”,通过地域口音表现自我特点                16 用“灌水”表示发帖子,通过具体化行为展示个性                20 用“滴”表示“的”、“地”,通过模仿官僚语气展现个性     讽刺和回避 18 用“bs”或“BS”表示和回避敏感的漫骂词汇                19 用“楼猪”表示“楼主”,讽刺对方的愚蠢     技术型障碍和错误 3 Ding表示“顶”是由于中文/英文输入需要频繁切换                11 “斑竹”表示“版主”是因为操作系统汉字输入法不完善                12 “恩”表示“嗯”是因为错别字     实际上,技术障碍和错误与输入简化的实质是相同的,只不过技术障碍多数是因为汉字的输入方式和西方文字输入方式的差异导致的一些特色现象。这种情况说明了目前计算机设备的输入法方式仍然存在不适合东方文化的一些弊端。同时也可以看到,东西方的网络用户都希望更加快捷的表述自己,所以从目前的网络语言频率分析中我们可以看到:提高输入效率是网络用户的第一需求,20个使用频率最高的网络词汇中,有8个是为了简化输入,提高输入效率而出现的,这还没有包含特定技术型障碍中的三个词汇。所以说:目前困扰网络用户的核心问题仍然是交流效率问题,当然我们也可以从另外一个角度表述这个现象,即:网络环境使人们迫切希望交流的需求大大增加,就其实质而言,这是人群部落化的体现,即:网络本身并未增加特定人群相互交流的需求,仅仅是拉近了潜在相同部落化人群的距离,所以说是语言形式的变化重构了语言本身 ,这与印刷术传入英国后导致英语词汇拼写习惯变化是没有本质区别的。

3#
 楼主| 发表于 2013-12-12 20:37:17 | 只看该作者
 此外,也可以看到个性化词汇也占有重要地位。在20个使用频率最高的网络词汇中,个性化词汇占了4个。如果具体分析这4个词汇体现个性的方式,我们可以看到:“马甲”是对抽象词汇“ID”的具体化;同样“灌水”也是对一种抽象行为的具体化;这说明网络用户希望可以通过在具体生存环境中的经验去表述虚拟世界中的现象,并以个性化的形式展现出来。而用“偶”替代“我” ,用“滴”表示“的”或“地” ,则不是用具体替代虚拟,仅仅是单纯的展现自己的个性理念。个性化词汇的高频率使用说明:网络用户具有将自己和其他网络用户差异化的需求。     与此同时,夸张表现情绪的词汇也有3个。用“寒”或“汗”表示敬畏的情绪就是典型的夸张,在现实世界中我们遇到“流下冷汗”或“全身发抖”等情绪表现是不多见的,而在网络中人的安全感要比现实还多一些,所以“汗”和“寒”的实质是通过相当夸张的词汇使得人们了解特定网络用户的情绪表现。同样,“晕”这个词汇也是这种情况。“顶”和前两种情况稍有些区别,虽然“顶”也是个夸张的词汇,但“顶”的实际网络功能是表示对对方观点的支持或者是对其他人提供的网络资源的感谢。     在20个使用频率最高的网络词汇中,讽刺和回避的情况占了2个,分别是“楼猪”和“BS(鄙视)”。“楼猪”多少有些诙谐的色彩,而“BS”则完全是对漫骂词汇的刻意回避。     通过上面的分类和简要分析,我们可以将20个使用频率最高的网络词汇,根据所属种类,进行简单的定量分析。考虑到这20网络词汇的使用频率具有顺序性,我们还对之进行加权平均分析 ,权重为:Σ(21-N),N为待计算词汇使用频率排位。结果如下表:     指标    输入简化 夸张表现 个性化词语 讽刺和回避 技术障碍、错误     简单平均数 40%    15%      20%          10%             15%     权重       102     35        31             5                37     加权平均数 70%    9%       10.6%         0.9%           9.5%     通过计算加权平均数,我们可以看到:简化输入是流行网络语言高使用频率的主要原因,其比重高达70%,如果将技术性障碍和错误的情况也归结到其中,其比例可以达到79.5%;而夸张表现、个性化词汇的比重都有所下降;讽刺和回避基本可以忽略不计。这说明网络语言出现的最根本动力是希望高效率交流,个性化表现和夸张表现是相对次要的动力。     究其原因,是因为网络作为媒体具有其自身的特点:首先是突破了地域限制,这使得网络用户可以获取自己生活环境以外的直观信息,并可以与和自身有类似背景的其他网络用户进行交流。在这个过程中,人的基本原始需求——“好奇心” 可以得到很大满足,并在一定程度上可以获得归属感。这两个方面势必要导致一定的语言表象,首先就是语言的个性化。当网络用户根据其背景或生活经历自发部落化的过程中,势必要形成具有自身群体特色的语言 ,同时,这些新的个性语言还会被其他新的群体成员模仿。这就是网络语言个性化表现的原因,因为从某种程度上说,所有网络用户群体也是一个规模巨大的部落化群体。其次,网络媒体还具有身份模糊化的特点。就传统媒体而言,一般可以很容易的将信息加工者与信息接受者区分开,但在网络媒体中这种界限正越来越模糊,任何一个人都可能成为信息加工者,这种身份的模糊化和地位的趋同倾向使得网络语言变得单纯,因为网络媒体在一定程度上隔离了用户的身份特征、年龄特征、文化特征、甚至性格特征等很多语言限定因素,而网络中的虚拟身份又是不清晰的,无法形成网络中特定的虚拟身份语言风格。可以说身份的模糊是促成网络语言能够流行的一个重要原因,也是网络媒体一个最具吸引力的特色,因为寻求平等或打破平等是人天性的一部分。再次,网络媒体还具有信息流向多样化的特点。很多媒体的信息流向都是单向的,比如:报纸、电视、广播,然而网络媒体的信息流向却不同,网络可以轻易实现双向甚至多向的信息流动,这种状况客观上要求每个网络用户具有一定的信息加工能力,例如:输入文字的能力、使用软件的能力等等。这就是目前我国网络语言被大量简化的原因,网络用户总是试图加快自己的信息加工能力,以便更好实现信息的双向或多向流动。实际上,网络语言的简化并不会是没有尽头的,过去好多流行的网络词汇正在逐步消失,比如:大虾(大侠)、菜鸟(新手)、94(就是)、酱紫(这样子)等词汇的使用频率已经很少了 ,这得益于目前丰富的网络表情符号和飞速发展的音频视频技术,换句话说,人们已经没必要通过文字的简化或变化来提高输入效率或者表现个性,以往必须通过夸张的词汇表现的情绪现在可以用一个简单的网络表情符号轻松传达,尽管现在的网络语言仍然习惯“夸张”。简言之,特定网络语言的形成是人们交流欲望、归属需求、自我意识的文字表象,而网络媒体不过是使之成为现实的一个平台。     中国第一份报纸出版时上面印满了“之、乎、者、也”,那时恐怕谁也不会想到今天的网民是这样使用汉语词汇的。最近也总有学者出来批评现在的年轻人糟蹋汉字,不过反过来想想,中国年轻的一代能如此娴熟的使用“A、B、C”键盘把具有五千年历史的方块字“敲进”电脑也该觉得欣慰了。
  其实,不是语言在变,是人在变。
您需要登录后才可以回帖 登录 | 注册

本版积分规则


QQ|联系我们|手机版|Archiver|教师之友网 ( [沪ICP备13022119号]

GMT+8, 2024-11-24 08:52 , Processed in 0.062818 second(s), 24 queries .

Powered by Discuz! X3.1 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表