中国高等教育学会语文教育专业委小学语文教学法研究中心副秘书长管季超创办的公益服务教育专业网站 TEl:13971958105

教师之友网

 找回密码
 注册
搜索
查看: 101|回复: 0
打印 上一主题 下一主题

语言的现代化

[复制链接]
跳转到指定楼层
1#
发表于 2016-3-4 08:48:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
语言的现代化1
桑哲2
关键词:语言  现代化  信息处理
内容提要:语言现代化是一项复杂的系统工程,涉及广泛,内涵丰富,本文从中文信息处理和词汇的现代化两个方面讨论了我国语言的现代化问题。
    语言是时代的一面镜子,社会政治、经济、文化的发展都可以通过语言进行表征。语言反映现实,同时语言又为现实服务,要适合现代社会发展的需要。当前举国到处充满现代化的气息,一切都处在现代化的进程之中,因此语言的现代化也必然是自然之趋势。语言现代化是一项复杂的系统工程,涉及广泛,内涵丰富,本文只从中文信息处理和词汇的现代化两个方面来讨论。
    (1)中文信息处理
中文信息处理是语言信息处理的分支,是用计算机对汉语的形、音、义等信息进行转换、传输、存贮、分析等加工的科学,包括汉字信息处理和汉语信息处理两个部分。语言信息处理是随着计算机的发展而发生的,最早起源于美国,经过半个世纪的努力,逐渐成为一门具有独立存在价值、一整套操作分析方法的交叉性学科。语言信息处理在我国起步于七八十年代,在当前已取得了重要进展,广大从事语言信息处理的学者和计算机专家付出了辛勤的工作,在很多项目上取得了历史性的突破。
    ① 汉字信息处理:
    汉字信息处理是中文信息处理的关键和基础,其难点是汉字编码问题。目前,我国已研制出了数百种汉字编码方案,其中部分方案已通过了上机试验,或已被采用。除此之外,还研制出了各种汉字输入键盘、汉字字库、仿真汉字终端、汉字打印机。汉字内码有效地解决了中西文兼容的问题;计算机激光汉字照排系统也已研制成功;同时,手写体和印刷体汉字识别的研究工作已取得了一定成绩。汉字编码方案的标准化和相关的规范标准的制定,是语言现代化急需解决的问题。在这方面,1997年12月1号《信息处理用GB13000.1字符集汉字部件规范》颁布,2001年12月19日教育部、国家语委发布了GB13000.1 字符集汉字拆笔规范》,由国家语委主持制定的《信息处理用GB13000.1字符集汉字部件名称规范》,目前也已形成征求意见稿。2001年6月23日教育部、国家语委发布了《 GF 3006-2001 汉语拼音方案的通用键盘表示规范》。汉字处理尽管取得了令人高兴的成就,但在很多方面还存在问题,比如在汉字编码方面,许嘉璐先生就认为还存在以下缺陷[1]:(1)音码输入受到汉语同音词多的语言现实的限制,并受到使用者普通话水平和文化素质的限制等问题,从而使拼音输入方法在当前实现大规模普及遇到障碍。(2)许多字根式形码方案存在着违背汉字结构原则、与人们在学校所学得的文字和语言知识不合的弊病,并且笔画式形码方案也存在着任意拆分和笔顺不够规范的问题。(3)音形码或形音码的局限,常常是上述两方面不足的兼有。许先生进一步认为:“编码方案的缺乏优化和规范,现在越来越成了阻碍计算机进一步普及和中文信息处理技术发展的重要因素之一。而在相当长的一段时间内,汉字键盘输入还将一直是我国信息处理的主要输入手段,因此编码的优化和规范就成了刻不容缓的事。”[2]
    ② 汉语信息处理
    汉语信息处理是汉字信息处理的进一步发展,它要在汉字输入的基础上,研究汉语的词汇、句法、语义、语境的自动处理问题,是中文信息处理的中、高级阶段。目前,汉语信息处理在机器翻译、汉语的人机对话和中文情报检索等方面,已经取得了一定的成果。机器翻译目前已研制出英汉、俄汉、法汉、日汉和汉外等系统,其中有的系统已经迈向了实用化和商品化的道路。现在,我国已出现了不少研究情报检索系统的单位,并取得了一定成果。情报检索的关键是情报检索语言的建立,词的切分问题也将直接影响情报检索系统的工作;目前全文情报检查系统已经实用化。至于汉语的人机对话,目前还只限于书面语部分,有关汉语语音的人机对话系统的研究还处于实验阶段,有的学者正设计中文听写机,以实现汉语口语的自动听写。此外, 汉语信息处理,还包括言语统计、计算机辅助语言教学、语音识别和言语合成、编辑照排系统、方言研究、修辞学研究、索引、词表和词典的编制工作等。
    中文信息处理技术,是自然语言信息处理的一个分支。它需要以大量的语言知识、背景知识为依据,对中文信息的人脑处理过程进行模拟。目前,中文信息处理已进入语句处理的攻关阶段,要在该领域取得更大成绩,消除中文信息处理的瓶颈,首要的关键是要汉语言学界和计算机学界两支队伍紧密地联合起来,开展面向中文信息处理基础研究和应用研究。
    ③ 当前中文信息处理的三种思路
在中文信息处理方面,传统的研究基本上都是在语料统计概率的基础上进行的,这种研究方法目前已被很多专家所置疑,普遍感觉到统计概率的路已经走到尽头。目前,以词义为基础,与句法规则结合,以句为突破单位的新型研究思路已陆续展开,逐渐形成了以下三种研究思路[3]
    一是以传统计算语言学为基本理论,从词素分析入手,进而研究词-短语(词组)-语段-句子。
    针对传统研究方法的局限,我国学术界从西方计算语言学的众多理论和方法中吸收营养,比如短语结构语法、扩充转移网络、从属关系语法和配价语法等都诸家理论都在进行面向计算机的理论研究,提出了一些具体的操作方案。许嘉璐先生主持的国家“九五”重大项目“信息处理用现代汉语词汇研究”是这方面的典型范例,其课题开题于1997年,包括九个子课题,如现代汉语的分词研究、歧义切分、词汇内部语义网络描述、短语结构的人工标注等,都是以语言信息处理为背景,取得了比较理想的成果。
    二是黄曾阳先生提出的HNC理论。
HNC理论是一个关于语言概念空间的理论。该理论认为,自然语言的语句呈现出无限和不确定的表现特征,计算语言学界所采用的句法分析和句法语义分析所提出的标准各有偏低和偏高的不足,不是描述人的语言感知过程的适当模式。因此,应该从语言的深层入手,以语义表达为基础,把自然语言所表述的知识划分为概念、语言和常识三个独立的层面,建立语义完备性的概念表述数学表示式和语句的语义表述模式。HNC认为,汉语以“字义基元化,词义组合化”的方式构造新词,因此可以构建概念表述体系,亦即概念层次网络,并据此设计局部联想网络解决词汇层面问题,设计全局联想网络解决句类和语义块问题[4]
    三是陆汝占基于内涵模型论的语义分析
    该理论认为,中文信息处理的研究不能单纯走语法的路子,要深入到语义层面。如果朝着意义精细方向考虑,就会产生兼类过多和概括力不够以及歧义、模糊、不确定等困难。换言之,汉语表达式的意义仅指称外延对象,没有涉及内涵性质,因此存在一个语句中的同一词语表达式的多个出现,都指称相同的外延对象。因此,该课题组将汉语表达式抽象成数学表达式,恰当地表示内涵和外延义,然后把这些语义表示在计算机内进行处理,亦即把汉语表达式与计算机数据结构之间直线联结,改变为汉语表达式-抽象数学表示-数据结构三者的间接联结。
    (2)词汇的现代化
    语言词汇现代化是语言规划的一个重要的目标。有两层含义:第一层含义是说改革了的、复兴了的或规范化了的语言的词汇应该符合一定的规范并加以推广;第二层含义是说这些改革了的、复兴了的或规范化了的语言的词汇应该具有现代社会生活的气息,尤其是要能准确表达现代科学技术的新思维、新概念[5]。词汇现代化主要通过借用、创造新词和旧词新用三种方式来进行。如“酷”、“克隆”、“黑客”等,都是以音译或直译的形式“挤”进汉语,成为交流中的时尚语言。根据现实需要新造的词如:“打黑”、“反恐”、“手机”等,旧词新用的词如“律师”、“博士”,词义已与原义明显不同。
    词汇现代化的关键是术语的现代化,也有两层含义,一是术语的国际化。随着我国开放和世界一体化程度的提高,在世界经济、文化、科学、外交等领域需要具有边界清晰、含义明确的术语,以利于国际化的交流。术语的国际化要求在制定和引用术语时,要有超地区观念和全球观念,避免同样的意思在不同的地区和语言中的不同表述。二是术语的规范化。首先要做到术语的科学性,其次是术语的通俗性,力求把二者结合起来。术语规范最重要的是内容的规范,定义要准确,在形式上要符合汉语表达习惯,宜于使用。词汇现代化的一个重要指标是对人类思维的共同成果和新成果的吸收程度,要不断对语言的形式和功能进行调整,以使汉语词汇系统得以不断适应现代化和国际化的要求。但是,在词汇现代化的操作中,要坚决反对汉语的西化倾向,词汇的现代化是汉语本身系统的现代化,要消除这样一种误解:“(在汉语词汇系统中)使用外来词越多,词汇现代化的程度就越高,语言文字的现代化气息就越浓厚。”[6]要坚决反对语言沙文主义以及以语言沙文主义为先导的文化沙文主义,维护国家语言文字的主权。
    词汇现代化要加强国家权威学术机构的规范以及行政机关的引导和干预。前者指权威学术机构研究制定词汇现代化的规范和有关标准,后者指以行政权力对有关规范、标准的确认和推行。如建立术语数据库问题,国家语委语言文字应用研究所于1992年、1994年分别研究制定了《建立术语数据库的一般原则和方法》、《数据库开发指南》,同年由国家技术监督局发布。2000年,国家发布“GB/T 15237.1—2000”中华人民共和国标准,规定了术语工作理论与应用方面的基础词汇。此外,词汇现代化的成果要通过词典来固化,当然这种固化是相对的,没有一本词典能永远不变地反映词汇的现代化进程和规范化的成果。词典的编撰要有现代化的视野,要适时合理地收录新词新语,因为新词新语都带着浓厚的时代色彩,是经过人们普遍使用、经过时代发展和社会变迁而成长起来的新的语言元素。《现代汉语词典》在注重实用性的同时讲究现代性,是当前词汇现代化的权威与典范。2005年7月,第5版《现代汉语词典》在全国范围内发行,增加的新词有2000条左右,都是近几年产生的,可以看出,《现代汉语词典》的修订跟上了时代发展,符合语言发展的规律并且富有鲜明的现代特征。



1、本文为国家语委“十五”国家语言规划项目《中国语言规划的历史研究(1949年后)》(编号:YB105-02A)研究文章。
2 桑哲,1976年生,山东宁阳人,中国语文现代化学会会刊《现代语文》常务副主编。

[1] 参见许嘉璐《未成集——论新时期语言文字工作》,语文出版社,2000年。

[2] 同上

[3] 许嘉璐《现状和设想——试论中文信息处理与现代汉语研究》,《中国语文》,2000年第6期。

[4] 黄曾阳《HNC理论概要》《中文信息学报》,1997年第4期。

[5] 苏金智《语言规划理论研究的若干问题》,江汉大学学术报告会,2004年4月。

[6] 同上

(原载《许昌学院学报》2007年第六期)


您需要登录后才可以回帖 登录 | 注册

本版积分规则


QQ|联系我们|手机版|Archiver|教师之友网 ( [沪ICP备13022119号]

GMT+8, 2024-4-29 17:12 , Processed in 0.102152 second(s), 21 queries .

Powered by Discuz! X3.1 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表