汉字(拼音:hàn zì,
注音符号
:ㄏㄢˋ ㄗˋ),又称中文、中国字,别称方块字,是
汉语
的记录符号,属于
表意文字
的词素音节文字。世界上最古老的文字之一,已有六千多年的历史。在形体上逐渐由图形变为笔画,象形变为象征,复杂变为简单;在造字原则上从表形、表意到形声。除极个别汉字外(如瓩、兛、兣、呎、嗧等),都是一个汉字一个音节
。
现代汉字是指楷化后的汉字正楷字形,包括
繁体字
和
简化字
。现代汉字即从
甲骨文
、
金文
、
大篆
(
籀文
)、
小篆
,至
隶书
、
草书
、
楷书
、
行书
等演变而来。汉字为汉民族先民发明创制并作改进,是维系汉族各方言区不可或缺的纽带。现存最早的汉字是约公元前1300年殷商的甲骨文和稍后的金文
,西周时演变成籀文
,再到秦朝的小篆
和隶书,至汉魏
隶书
盛行,到了汉末隶书楷化为正楷。楷书盛行于
魏晋南北朝
,通行
。
汉字是迄今为止持续使用时间最长的文字,也是
上古时期
各大文字体系中唯一传承者,中国历代皆以汉字为主要的官方文字。在古代,汉字还充当
东亚
地区唯一的国际交流文字,20世纪前仍是
日本
、
朝鲜半岛
、
越南
、琉球等的官方书面规范文字,东亚诸国都在一定程度上自行创制汉字。需要注意的是,日本、朝鲜半岛、越南等国在历史上都深受汉文化的影响,甚至其他语言都存在借用汉语言文字的现象。在非
汉语
体系中,日本制定了《常用汉字表》,韩国也制定了《教育用基础汉字》,而历史上曾使用过汉字的
越南
、
朝鲜
、
蒙古国
等,现今已废弃汉字。
从仓颉造字的古老传说到公元前1000多年前
甲骨文
的出现,历代中国学者一直致力于揭开汉字起源之谜。关于汉字起源的说法,历来各家有不同主张,其中比较有影响力的说法有:结绳说、
八卦说
、
刻契
说、
仓颉造字
说、刻划说和图画说。
结绳说
:在文字产生之前,古人们靠结绳记事、认事,此举起到了帮助人们记忆的作用。《
周易
·系辞下》:“上古结绳而治,后世圣人易之以书契,百官以治,万民以察。”
汉代
郑玄
注:“结绳为约,事大,大结其绳;事小,小结其绳。”《
庄子
·胠箧》篇云:“昔者容成氏、大庭氏、伯皇氏、中央氏、栗陆氏、骊畜氏、轩辕氏、
赫胥氏
、尊卢氏、祝融氏、伏羲氏、神农氏,当是时也,民结绳而用之。”又如《
周易正义
》引《虞郑九家义》: “古者无文字,其有约誓之事,事大大结其绳,事小小结其绳。结之多少,随物众寡;各执以相考,亦足以相治也。”
东汉
以后,不少人把汉字起源附会于结绳
。
八卦
说
:关于
八卦
的起源说法并不统一,有摹象说、星象说、数说和
杨雄
的“亥”为物之源说等等。《周易·系辞》云:“古者庖牺氏之王天下也,仰则观象于天,俯则观法于地,观鸟兽之文与地之宜,近取诸身,远取诸物,于是始作八卦,以通
神明
之德,以类万物之情。”这段话提到八卦源自庖牺氏对自然
客观世界
的摹象,这与“依类象形”而作的汉字的起源是相似的。孔安国《
尚书
》序(属伪作,但年代甚古)里说:“古者庖牺氏之王天下也,始画八卦,造
书契
,以代结绳之政,由是文籍生焉。”把八卦和书契(文字)的作用相提并论,把汉字的起源与八卦联系起来
。
仓颉
造字说
:相传
仓颉
是
黄帝
时期的
史官
,汉字的创造者
。黄帝是古代中原部落联盟的领袖,由于社会进入较大规模的部落联盟阶段,联盟之间外交事务日益频繁,故迫切需要建立一套各盟联共享的交际符号,于是搜集及整理共享文字的工作便交在史官仓颉的手上了。
“仓颉造字说”在
战国
时即已流行。《
吕氏春秋
·君守》说:“
仓颉作书
,
后稷
作稼。”到了秦汉时代,这种传说更加盛行。
汉
许慎
《说文解字序》:“
黄帝
之史仓颉,见鸟兽
蹄迒
之迹,知分理之可相别异也,初造书契。”和“仓颉之初作书,盖依类象形,故谓之文。其后形声相益,即谓之字。文者,物象之本;字者,言孳乳而寖多也。”
现代学者认为,成系统的文字工具不可能完全由一个人创造出来,仓颉如果确有其人,应该是文字整理者或颁布者。
刻契
说
:刻契是古人在结绳记事后又一种帮助记忆的实物记事法,多作契约用,比结绳记事进步多了。所谓“刻契”就是在木条上或竹条上刻上刻痕。《
释名
·释
书契
》:“契,刻也,刻识其数也。”《周易·系辞》郑玄注:“书之于木,刻其侧为契,各持其一,后以相符合。”郑玄又在《
周礼
·质人》注里说:“书契,取予
市物
之券也。其券之象书两札,刻其侧。”《
列子
·说符篇》:“宋人有游于道,得人遗契者,归而藏之,密数其齿。”所说的“齿”即是
质契
上所刻的齿痕。这种刻契具有记事记数的作用,可以作为
契约
的凭证,也可以用来传递信息。刻契的一些符号与某些汉字形体相似。如“一、二、三、
亖
、𠄡”与汉字数字“一、二、三、四、五”的古文字别无二致
。宋末元初
戴侗
提出“书始于契,契以记数”而“各如其数”,认为“刻识其数”的契刻是原始文字的一个源头
。
郑州大学
博士生导师
王蕴智
认为:中国最早的刻划符号出土在河南舞阳
贾湖遗址
,距今已有8000多年的历史。 对这些原始材料做一番全面的整理,从而爬梳排比出商代文字之前汉字发生、发展的一些头绪。 然而情况并不那么简单,除了已有
郑州商城遗址
、
小双桥遗址
(该遗址先后发现10余例商代早期
朱书
陶文
)的小宗材料可以直接和殷墟文字相比序之外,其它商以前的符号则零星分散,彼此缺环较多,大多数符号且与商代文字构形不合。还有一些符号地域色彩较重、背景复杂。
沈兼士
先生在1927年提出了汉字起源于记事的图画这一观点,认为在古汉字之前还有一个“文字画”的起源阶段。
沈兼士
《从古器款识上推导六书以前之文字画》:“盖于
六书
文字时期以前,应尚有一阶段,为六书文字之导源,今姑定名为‘文字画时期’”。文字画是向文字进化的记事性图画,具有亦画亦字的特点,初步具备了文字记录信息的可识性功能。关于记事
图画
与记词文字的联系与区别,沈兼士先生讲得尤为精辟:“文字画为摹写事物之图象,而非代表言语之符号,虽为
象形字
之母型,而不得径目为六书象形指事之文。”
[12-13]
在距今约四五千年的大汶口文化遗址晚期和良渚文化遗址的陶器上,发现有更整齐规则的图形刻划,是早期的
图形文字
。
卜骨 商王武丁时期
发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力。中国商代和西周早期(约公元前16~前10世纪)以龟甲、兽骨为载体的文献。
金文
金文是指铸刻青铜器上的文字,也叫
钟鼎文
,始于殷商时期。商周是青铜器的时代,青铜器的礼器以鼎为代表,乐器以钟为代表,“钟鼎”是青铜器的代名词。所以,钟鼎文或金文就是指铸在或刻在青铜器上的铭文。
所谓青铜,就是铜和锡的合金。中国在夏代就已进入
青铜时代
,铜的冶炼和铜器的制造十分发达。因为周以前把铜也叫金,所以铜器上的铭文就叫作“金文”或“吉金文字”;又因为这类铜器以钟鼎上的字数最多,所以过去又叫作“钟鼎文”。
金文应用的年代,上自商代的早期,下至秦灭六国,约1200多年。金文的字数,据
容庚
《金文编》记载,共计3722个,其中可以识别的字有2420个。
铜器上的铭文,字数多少不等。所记内容也很不相同。其主要内容大多是颂扬祖先及王侯们的功绩,同时也记录重大历史事件。如著名的
毛公鼎
有497个字,记事涉及面很宽,反映了当时的社会生活 。
大篆
小篆也叫“秦篆”。秦朝
李斯
受命统一文字,这种文字就是小篆。通行于秦代。形体偏长,匀圆齐整,由大篆衍变而成。东汉许慎《说文解字·叙》称:“
秦始皇帝
初兼天下……罢其不与
秦文
合者。”李斯作《
仓颉篇
》,中车府令
赵高
作《爰历篇》,太史令胡毋敬作《博学篇》,“皆取史籀大篆,或颇省改,所谓小篆者也。”今存《
琅琊台刻石
》、 《
泰山刻石
》残石,即小篆代表作。
秦权
上刻制的小篆,据说是李斯在秦始皇统一中国后,推行“书同文,
车同轨
”,
统一度量衡
的政策,由宰相李斯负责,在秦国原来使用的大篆
籀文
的基础上,进行简化,取消其他六国的异体字,创制的统一文字汉字书写形式。一直在中国流行到西汉末年,才逐渐被隶书所取代。但由于其字体优美,始终被书法家所赞美。又因为其笔画复杂,形式奇古,而且可以随意添加曲折,印章刻制上,尤其是需要防伪的官方印章,一直采用篆书,直到封建王朝覆灭,近代新防伪技术出现。康熙字典上对所有的字还注有小篆写法。
隶书
欧阳询楷作品
楷书又称
正书
,或
真书
,始于东汉。其特点是:形体方正,笔画平直,可作楷模,故名。
初期楷书仍残留极少的隶笔,结体略宽,横画长而直画短。在传世的魏晋帖中,如
锺繇
的《
宣示表
》、《
荐季直表
》、
王羲之
的《
乐毅论
》《
黄庭经
》等,可为代表作。观其特点,正如
翁方纲
所说:“变隶书之波画,加以点啄挑,仍存古隶之横直”。
楷书到了宋代,出现了“宋体”,现代印刷的宋体、黑体、仿宋等字体都属于“楷书”。
草书
草书是为书写便捷而产生的一种字体。始于汉初,当时通行的是草隶,即草率的隶书,后逐渐发展,形成一种具有艺术价值的章草。至汉末,相传张芝脱去了章草中保留的隶书笔画形迹,上下字之间的笔势,往往牵连相通,偏旁相互假借,成为今草,即一般所称草书,字的体势一笔而成。到唐代的
张旭
、
怀素
,宋代的
米芾
将今草写得更加放纵,笔势连绵回绕,字形变化繁多,成为狂草。草书为书法家所常用。
章草笔划省变有章法可循。代表作如三国时期吴国皇象《急就章》的松江本。
今草不拘章法,笔势流畅。代表作如晋代王羲之《初月》、《得示》等帖。
狂草出现于唐代,以张旭、怀素为代表,笔势狂放不羁,成为完全脱离实用的艺术创作,从此草书只是书法家临摹的书法作品。代表作如张旭《肚痛帖》、怀素《自叙帖》。
行书
中国考古界先后发布了一系列较
殷墟甲骨文
更早、与文字起源有关的出土资料。
贾湖刻符
经碳14物理测定,距今约7762年(±128年)历史;七千年前的
双墩刻符
、六千年前的
半坡陶符
、五千多年前
青墩遗址
刻符、连字成句的
庄桥坟遗址
文字、
大汶口
陶尊符号、尧舜时代的
陶寺遗址
朱文。早期的刻划符号与
骨刻文
就是丰富的文字系统,后期的属于初步成熟阶段。这些考古发现可能是汉字起源的重要线索,也可能是各种文字发展的不同源流。
大约在距今六千年的半坡遗址等
仰韶文化遗址
的陶器外壁,已经出现刻划符号,共达五十多种。它们整齐规划,并有一定规律性,具备简单文字的特征,可能是汉字的萌芽。
20世纪80年代初,在河南
登封
夏文化遗址发掘出的陶器上,发现了更完备的文字。当时被学者们确认的迄今为止我国有确切时代的最早的文字。
汉字
数量
汉字的数量并没有准确数字,大约将近十万个,日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字则已到99%,简体与繁体的统计结果相差不大。
关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。
秦代的《
仓颉
》、《
博学
》、《爰历》三篇共有3300字;汉代
扬雄
作《训纂篇》有5340字,到
许慎
作《
说文解字
》就有9353字了;据唐代
封演
《闻见记·文字篇》所记,晋吕忱作《
字林
》有12824字,
后魏
杨承庆作《字统》有13734字,南朝时
顾野王
所撰的《
玉篇
》据记载共收16917字,在此基础上修订的《
大广益会玉篇
》则据说有22726字;唐代孙强增字本《玉篇》有22561字。宋代
司马光
修《
类篇
》多至31319字,宋朝官修的《
集韵
》中收字53525个,曾经是收字最多的一部书;1915年欧阳博存等编著的《
中华大字典
》有48000多字;1959年日本诸桥辙次主编的《
大汉和辞典
》有49964字;1971年
张其昀
主编的《
中文大辞典
》有49888字;1990年徐仲舒主编的《
汉语大字典
》有54678字;1994年冷玉龙等编著的《
中华字海
》有85000字。台湾地区教育主管机关编撰的《
异体字字典
》第五版,内容含正字与异体字,共106230字,是收录较多汉字的字典。蓝德康和
松冈荣志
主编的《汉字海》是至2020年世界上收录汉字最多的
工具书
,正文收列字头单字102434个,附录收列字头单字11112个
简体字←汉字→繁体字
历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为
异体字
和
罕用字
。绝大多数异体字和罕用字已被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“
二简字
”,已被废除,但仍有少数字在社会上流行。
如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。但是《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而书面语里已经废置不用的字。据统计,
十三经
(《
易经
》、《
尚书
》、《
公羊传
》、《
论语
》、《
孟子
》等13部典籍)全部字数为589283个字,其中不相同的单字字数为6544个字。因此,实际上人们日常使用的汉字不过六千多而已。
在汉字
计算机编码
标准中,最大的
汉字编码
是台湾地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。台港民间通用的
大五码
收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。Unicode的中日韩统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。
初期的汉字系统字数不足,很多事物以
通假字
表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。汉语书写的发展多朝向造新词而非造新字。
殷墟
的甲骨文及更早、与汉字起源有关的出土资料,这些资料主要是指原始社会晚期及有史社会早期在陶器上面的刻画或彩绘符号,另外还包括少量的刻写在甲骨、玉器、石器等上面的符号,可以说,它们共同为解释汉字的起源提供了新的依据。
象形
:象形:描画事物的形象的造字法,如“日、月、山、水、人、木、火、口、目、田”等就是描绘其图案来造字,后来逐渐演化变成如今的造型。象形造字法是人类最本能的造字方法。
指事
:在象形字的基础上加象征符号来造字,比如“刃(刀锋的那边加一点)、本(树根加一点)、甘(舌头加一点)、亦(由“大”张开手臂的人,胳肢窝下加两点,指胳肢窝)”。
用纯象征的符号造字也属于指事造字法,比如“一、二、三、五、七、十、上、下”,用纯象征符号造字就属于记号字。
形声
:由表示意义的形旁和表示读音的声旁两部分组成的造字法。形旁是汉字对事物进行归类的表义部件,声旁表示该字的读音,比如:
左形右声:证、抖、城、构、伟;右形左声:战、励、刚、彰、瓴;上形下声:芳、岗、晨、笼、雾;
下形上声:想、熬、袋、劈、汞;外形内声:圆、厘、匪、闺、匈。
例如“鸠”字的形旁“鸟”;声旁“九”则只取其音,不取其义。
会意
:是用两个或两个以上符号组成新字的造字法(不同于形旁和声旁组成的形声字),比如:
“日”和“月”组成“明”字;
“人”和“言”组成“信”字,表替人带话而不加改变为值得信赖;
“人”和“木”组成“休”,表示人在树下休息……
有些会意字是两个或几个同样的字重叠组成的。比如:
两个“人”组成“从”,三个“人”组成“众”;
两个“木”组成“林”,三个“木”组成“森”;
两个“口”组成“吕”,三个“口”组成“品”等。
假借
:借用读音不同的字和形旁来组字的造字法,假借字和形声字关系密切,只是声旁的表音功能丧失了。比如:
兑dui---shuo说 tuo脱 yue悦阅
告gào---gù梏牿 hú鹄 jiào窖 kù酷
且qie---cu粗殂 ju跙沮狙疽龃雎 qu蛆 zu祖 阻组诅俎 zhu租助 zui咀
者zhe---du都赌堵睹 chu褚储 shu暑署 zhu猪诸煮箸渚著 tu屠 xv绪
占zhan---dian玷 nian拈鲇黏 zhen砧 tie贴帖
……
转注
:字的意义发生变化而转作它用,其本义用另一个字来注解和代替。转注不是一种造字法,是与造字密切相关的用字法,转注字都是两字一对,比如:
其--箕:“其”本义是“簸箕”的象形,后来转做虚词,“其”的原始义用“箕”字代替;
斤--斧:“斤”原始义为“斧”,后来转做量词“斤”,原始义用“斧”字代替;
莫--暮:“莫”原始义是“暮-太阳落在草下”之会意,后来转做虚词,原始义用“暮”字代替;
要--腰:“要”原始义是“人体腰部”之象形,后来转做动词,原始义用“腰”字代替;
益--溢:“益”原始义是“水从皿中溢出”的会意,后转做益处之义,本义用“溢”字代替;
自--鼻:“自”原始义是“鼻子”之象形,后来转做代词或介词,原始义用“鼻”字代替。
……
汉字
字形
汉字因形状方正,有“
方块字
”的别称,从结构上来看,汉字有以下特色:
规整的字体(如
楷书
、
宋体
、隶书、篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括
独体字
和
合体字
,独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如“笑”、“尖”;左右结构,如“词”、“科”;
半包围结构
,如“同”、“趋”;全包围结构,如“团”、“回”;上中下结构,如“赢”;左中右结构,如“斑”;“品”字形结构,如“品”。汉字的基础部件包括独体字、
偏旁部首
和其他不成字部件。
汉字的最小构成单位是笔画,笔画也具有一定的含义,如横画(一),可表示地平线(如旦字中的一横)等。
书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,先横后竖,先撇后捺,从上到下,从左到右,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。
从字体上分,可将各类汉字的字体分为三大类型。第一类是从宋代活字印刷发展起来的宋体、
黑体
(包括粗、细
等线体
)等;第二类是由书法演变而来的字体,如楷体、
仿宋体
、行楷、
隶体
、魏体、
舒体
、颜体、瘦金体以及钢笔书写的字体等;第三类是属于美术字体,如综艺、美黑、琥珀、水柱等。其他字体多是属于以上三类字体的变异,例如:由宋体演变的大标宋、小标宋、报宋、长宋、中宋、
姚体
等;由黑体演变而成的大黑、平黑、粗黑、等线体(包括粗、中、细等线体,后又演变出粗、准、细圆体)等;由楷体、仿宋体等演变而来的中楷和细仿宋等;由黑体和宋体演变而来的美黑;由隶体演变而来的隶变体等。
笔画最少的汉字只有一划。有的字在书面上没有,只在民间流传“biang”是笔画较多的汉字,有56笔,异体字共有45笔,繁体字共有59笔。“biangbiang面”是源于陕西的一种面,也是一家面馆的品牌,还在使用这个字,流传不广,2006方才流行,声称只能在康熙字典中查到“biang”字写法。事实上,在康熙字典中查不到“biang”字的写法。
关于biang,有一个字谜:
一点飞上天,黄河两道弯,八字大张口,言字往里走 。
东一扭,西一扭。左一长,右一长,中间坐了个马大王。
心字底,月字旁,打个勾勾挂麻糖,
推个车车逛咸阳。
汉字是汉语的书写文字,每个字代表一个音节。中国大陆现今以普通话作为标准读音,普通话的音节由一个声母、一个
韵母
及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的
同音字
现象;同时还有同一字多音的情形,称为多音字。这一情况在汉语各种方言中是普遍存在的。
有学者经研究认为:汉朝之前,一个汉字发音为两个音节,次要音节和主要音节。由于汉字本身不表音,自汉朝到20世纪汉字在数量上、写法上虽有变迁,但无法看出发音的变化。必须进行专门的研究才能推测它们在
上古汉语
和
中古汉语
的发音。汉字在日语中的读音有“音读”和“训读”之分,往往一个字有很多读法,原因来自中国不同时期传入日本的发音。
在近现代,为了表示一些外国制单位曾广泛创造并使用
多音节汉字
,如“
浬
”(海里)、“
嗧
”(加仑)、“
瓩
”(千瓦)等。但是在大陆地区由于官方废除已基本不使用,台湾仍在使用,一般人也明了其意思。
最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的《说文解字》就采用这种注音方法,如“埻,射臬也,读若准”。直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。
以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以起到注音的作用,例如“袜音韈”等。
魏晋时期发展出了
反切法
,据传是受使用拼音文字的
梵文
影响。汉字的发音可以通过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。
近代以来,又发展出了汉字形式的
注音符号
以及很多拉丁字母注音方法。注音符号仍是台湾地区教学的一部分,中国大陆最为广泛使用的是
汉语拼音
。
由于汉字以本身表意为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度。例如“庞”从“龙”而得声,但
北京话
前者读“páng”,后者为“lóng”。如何解释这样的差异,就是
音韵学
所探讨的课题。需要注意的还有声调:阴平,阳平,上声,去声,轻声(元音āáǎàa ōóǒòo ēéěèe īíǐìi ūúǔùu ǖǘǚǜü)
《中华大字典》
中国古代称“
字书
”,直到《
康熙字典
》问世才称“字典”。最早的汉语字 典是东汉许慎编的《
说文解字
》。近代大致可分为两类,一类是综合性的,如《
新华字典
》;一类是专门性的,如《
异体字字典
》。1915年,
中华书局
出版了《
中华大字典
》。
世界三大汉语词典分别是中国大陆的《
汉语大词典
》(共13册,5.6万词条,37万单词)、中国台湾的《
中文大辞典
》(共10册,5万词条,40万单词)以及日本的《
大汉和辞典
》(共13册,4.9万词条,40万单词)。汉字是记录汉语的文字,它已有六千年左右的历史,是世界上最古老的文字之一。
“最中国”汉字“和”
:
2008年北京奥运会开幕式
上,几百名演员扮演的活字印刷字模通过不断变幻,用大篆、小篆、楷书三种不同字体展现了同一个汉字――“和”。这一幕让人津津乐道,而这个包含“和谐”“和平”“和睦”等意义的汉字,再度被评选为“最中国”的汉字。最新一期的《中华遗产》杂志发布了该社组织的“100个最具中华文化意义的汉字”评选结果。“和”字赢得了网上投票的最高票数,也获得了台湾“中央研究院”历史语言研究所研究员
李贞德
等专家的大力推荐
王羲之书法
汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由
象形文字
(表形文字)演变成兼表音义的
意音文字
,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义三者于一体的特性。这一特性在世界文字中是独一无二的,因此它具有独特的魅力。汉字是汉民族几千年文化的瑰宝,也是我们终生的良师益友,每个人的精神家园。汉字往往可以引起我们美妙而大胆的联想,给人美的享受。
汉字更是民族灵魂的纽带,在异国他乡谋生,汉字便是一种寄托,哪怕是一块牌匾、一纸小条,上面的方块字会像磁铁般地吸引着你,让你感受到来自祖国的亲切。因为那中国人的情思已经浓缩为那最简单的横竖撇捺。每一笔,都是饱蘸着华夏碧血写就的。在海外,无论你功成名就还是漂泊沦丧,只要有方块字的伴随,你就会有几多慰藉几多寄托,因为无论是象形还是指事,无论是会意还是形声,每一个字都有深远的来历,每一个中国人就是那一撇一捺,已经成为方块字的魂魄。
相较拼音文字的优点
世界各国使用的文字分为两大类,即非拼音文字(汉字和水书)及拼音文字(其他文字)。当今世界上使用的文字中,汉字和
水书
属于非拼音文字。
现今文字中,汉字是从商朝开始使用并演变。传说梵文字母是创造宇宙之神大梵天所创造并授予人类(《
大唐西域记
》)其他文字很多都是借用四大字母系统的文字。婆罗米系列字母、
拉丁字母
、
斯拉夫字母
、
阿拉伯字母
被称为世界四大字母体系。
印度
、
尼泊尔
、
孟加拉国
、
缅甸
、
老挝
、
泰国
、
柬埔寨
、
中国西藏
地区用婆罗米系列字母。英文、法文、意大利文等使用拉丁字母;俄文、保加利亚文、塞尔维亚文等使用基里尔字母(或斯拉夫字母),是
希腊字母
改造而成的;拉丁字母也是希腊字母改造而形成的。阿拉伯字母的祖先——阿拉马字母(Aramaic)及希腊字母的祖先——
迦南
(Canaanite)字母也不是他们祖先直接创造的,而是借用了小方闪米特人(Semites)的文字(小方闪米特字母)改造而成的。这种字母借用了
苏美尔人
(Sume)的
楔形文字
,并经过改造而成的。楔形文字是苏美尔人创造的,圣书文字是埃及人创造的,汉字是汉族先民创造的,
中国水族
创造的水书,它们都不是拼音文字。四者之中只剩下汉字和水书,其他两者都已经消亡了。
汉语的另一个奇特之处是它的超方言特性及超语言特性。语言学家把中国各地的方言分为八大
方言区
。有人说,如果没有汉字,中国早就分裂成几十个国家了。欧洲的意大利语、法语、西班牙语、葡萄牙语和罗马尼亚语之间的差别比中国方言的差距小得多,但是他们绝不愿意承认各自的语言是“
罗曼语
”的不同方言,因为它们都是独立的国家。
汉字在世界历史上,作为其它后发明的文字的母字,如越南、朝鲜和日本都曾经用汉字来记录着它们的语言。日本人还使用汉字和
假名
的混合文字,使用汉字,还有另一项重大发明,就是写中国字,读日本词。只要其他国家愿意,他们也可以这样做。如果真是这样做了,汉字就成为国际通用的语言符号了,就像
数学符号
一样,只表意,不表音。
汉字是世界上使用人数最多的文字。据统计,使用汉字和汉语的人数达到16亿以上。
20世纪初叶,随着
西方文化
的传入,有人认为,中国之所以落后,汉字是罪魁祸首,主张将汉字废掉。到了20世纪后半叶,计算机科学急剧发展,又有些人认为汉字阻碍了科学的发展,方块字无法输入电脑,又有一阵要废除汉字的鼓躁。后来,这方面的问题解决了,质疑声也随之消散。
汉字是2020年仍在使用的历史最悠久的文字。能看到而又能认读的最早的汉字是3000多年前的甲骨文。这已是相当成熟、相当系统的汉字了。世界上没有一种文字像汉字那样历尽沧桑,青春永驻。古埃及5000年前的圣书字是人类最早的文字之一。但它后来消亡了,有记载的古埃及文化也被深深地埋藏起来了。苏美尔人的
楔形文字
也有5000年的历史。但在公元330年后,它也消亡了。历史上衰亡的著名文字还有
玛雅文
、
婆罗米文
等等。而汉字不但久盛不衰,独矗世界文字之林,还不断地得以发展,影响也越来越大。
1.优美
它已成为一种艺术——书法艺术。汉字的书法艺术是任何其它文字所无法相比的。 下列的古代书法作品已经成为无价之宝。著名的有
兰亭序
、神策军纪圣功德碑、
玄秘塔碑
、
祭侄稿
等无数作品。
2.辨识度高
人类的眼睛视野总是一个面,而不是一条线,所以线性排列不易辨认;排成方块一目了然。拼音文字=
线形文字
;汉字=方块文字。汉字比拼音文字有更高的
阅读效率
。
3.易懂,具有关联性
例如,“被”是一个形声字兼会意字。如果从形声字的角度来看,“被”字左边的“衣”字旁表示意义,说明被子是属于衣物一类,右边的“皮”字在造字的时代和“被”的读音相似,表示这个字的读音,但是随着时间的推移,“皮”和“被”的读音变得不一样了,逐渐失去了它表读音的
功能
。如果从会意字的角度来看,用皮做的衣物就是“被”。被的最初意义指的是一种小被子,到了后代,在被的本义基础上又引申出“蒙受”等意义。
请比较下面一组中英文的词:
|
汉字词
|
英文词
|
|
牛
|
cattle
|
|
犊
|
calf
|
|
公牛
|
bull
|
|
母牛
|
cow
|
|
牛奶
|
milk
|
|
牛肉
|
beef
|
|
牛角
|
horn
|
⒋形象,直观达意
汉字是
象形文字
,其显著的特点是字形和
字义
的联系非常密切,具有明显的直观性和表意性。汉字的表意性使汉字成为世界上单位字符信息量最大的文字,因此容易辨识, 利于联想,这也为加快阅读速度带来极大的便利。
汉字有着区别于世界其他各种语言的根本特点,这就是汉语语法自身的特殊性即意合。无论是
词组
合成
句子
,还是
单句
组合成
复句
,首先考虑的因素往往是语意的配合,而不是
语法
形式的使用,只要几个负载着重要信息的关键词语在意义上大致搭配得拢,就能言简意赅地达到交际目的,这几个词就可以组合在一起,这就是所谓的“意合”。汉语语法的这一特点,使它结构独特,灵活多变,颇多隐含,着重意念,其意合性、灵活性和简约性是其它语言所不能比拟的。汉语语法的上述特点,有利于我们在阅读中运用意会的方式来进行感知和理解,这对于加快阅读速度就有极大的便利。
5.信息量大
研究表明:汉字作为一个复杂的文字符号系统,其
信息熵
很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65
比特
。通过数理语言学中著名的
齐普夫定律
(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。
汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用
二进制数字系统
呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数人不累?反过来,人类为什么不用十六进制,或更高的进制呢?一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。这就是汉字字符集信息熵高的优势。
汉字的以上五个方面的特点,无疑会使其在阅读心理方面较拼音文字具有相当大的优势,使汉字的书面语在感知、理解的各个方面都有较高的速度和效率,能够实现阅读速度、理解速度、记忆速度的协调发展,快速阅读,也是中国为何能崛起的天然因素,汉语不失,华夏永存。
计算机输入
中文信息处理
由于
打字机
键盘在设计时本身没有考虑
汉字输入
的问题,输入汉字往往比输入拼音文字困难。由于英文是由26个字母
排列组合
而成的文字,因此可以简化输入步骤;相比较之下汉字则不能如此,从字形上虽然可以拆解成不同的部分,但是被分成的部首或偏旁数量多,这样不但不能达到简化输入的目的,反而显得更为繁琐,于是从汉字字音上去考虑汉字输入被分成少量的语音元素组合排列,这样可以达到简化输入的步骤。由于是语音输入对汉字的读音必须清楚,某些
生僻字
或不知道汉字发音的则会很困难,这在一定程度上限制了汉字的输入。汉字没有经过
中文打字机
的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持
汉字拉丁化
的学者甚至以此为理据。
随着各种
中文输入法
的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。中文输入法有上千种之多,主要包括表音输入和表形输入两类(即拼音和五笔),也有两者兼之的。汉字的
语音输入
、
手写识别
和
光学字符识别
(OCR)技术也已得到广泛应用。
如收录数千字的
GB 2312
(中国大陆),
Big5
及CNS 11643(台湾),HKSCS(香港),JIS(日本),以及收录两万多字的
GBK
(中国大陆), 国外标准
Unicode
,
ISO 10646
等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。
中国政府为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收汉字27484个。并强制所有在中国大陆地区售卖的计算机产品必须使用这个新官方标准。
国标码
(“国标”是
中华人民共和国国家标准
的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。
BIG5码
。收录13053个汉字。在台湾和香港使用的一
字节
或两字节编码。
Unicode并不被大陆很好地接受。政府要求在大陆出售的软件必须支持GB18030编码。
在国际通信化和软件设计领域,CJK编码除了收集了中文,还有日本汉字、韩国汉字的汉字集。
汉字
汉字简化
汉字自其诞生以来便经历了
甲骨文
、
金文
、
篆文
,到
隶书
、
草书
、
楷书
、
行书
的演变过程。汉字
书体
发展的总体形势是通过减省
笔画
由繁入简,逐渐简化的,但有时为了使文字更好更明确地表意,也有文字繁化的现象
。特别是
造纸术
、
印刷术
的出现,极大地促进了文化的发展与传播,文字越来越多地被民间人士使用。民间不断出现一些
简笔字
,这些字笔画的减省是
约定俗成
的,具有一定的群众基础,但由于与当时官方的规范汉字形体不同而被视为
俗体
、破体,是不能登大雅之堂的。李海霞的《六朝唐五代石刻俗字研究》,
潘重规
编著的《敦煌俗字谱》、《敦煌变文论辑》,
黄征
的《
敦煌俗字典
》,
张涌泉
的《敦煌俗字研究》《
汉语俗字研究
》和刘复、 李家瑞编的《
宋元以来俗字谱
》列举了大量历史上曾被使用的简笔字,或称
俗字
[17-18]
。
太平天国运动
给唐宋以来民间通行的简笔字(俗字)以正统地位,在太平天国
玉玺
、官方文件和印发的书籍中采用简体字。据不完全统计,太平天国总共使用一百多个简体字,其中80%为后来新中国所采用
新中国
成立后继续
新文化运动
和
民国
时期未能完成的汉字简化工作,于1956年1月31日通过《
人民日报
》全文发表了国务院的《关于公布汉字简化方案的决议》和《
汉字简化方案
》,并最终制定出了一个《
简化字总表
》,给简体字以法定地位。一九七七年曾推出过《
第二次汉字简化方案
(草案)》,由于在试用过程中产生了文字混乱现象以及人们的反对,于是到了1986年,
国务院
又宣布“
二简字
”停止使用
异体字
是相对于
正体字
而言的,是指与规范的汉字形体不同但音义相同的字,即汉字的
俗体
、
古体
、
或体
之类
[20-21]
。异体字的出现主要是由于汉字
书体
的演变以及民间书写过程中产生的
字形
形体变异,它们有别于官方规范的汉字形体。大部分汉字都有异体字形,有的甚至有多种异体写法,这些异体字占了汉字总数相当部分数量。例如:“
㷖
”与“照”、“
秊
、䄭、年”、“
峯
”与“峰”、“
氷
”
与“冰”分别以“照”、“年”、“峰”、“冰”为正体字。
武则天
在她临朝称制和登基为皇时曾命人创制过汉字,后世遂称“
则天文字
”。一般认为则天文字共有十八字,包括最初由
宗秦客
献给
武则天
的十二字和后来陆续颁行的六字,这十八个字的创造过程共经过五个不同的阶段,并且各有其政治目的及
文化系统
的内在意涵。随着
人亡政息
后,这批文字亦因失去时代意义的支撑而随之
见弃
,后人遂用回
本字
[26-27]
。
汉字
科技造字
近现代以来,为了表示一些科技
专有名词
造了一批字,这些字大都是依据
形声
法和
会意法
而造。如:
①为了表示一些西洋制
单位
曾广泛创造并使用的
多音节汉字
:
浬
(海里)、
嗧
(加仑)、
瓩
(千瓦)、
兛
(千克)、
兣
(厘克)、
粁
(千米)等;
②
化学元素
:1.
氖
、
氢
(旧译“𣱮”)、
氕
、
氘
、
氚
、
氧
(旧译“
氱
”)、
氦
、
氪
、
氙
、
氨
、
氮
(旧译“㲷”)、
氟
、
氩
、
氡
、鿫(
⿹
气奥);2.矽(“硅”的旧译)、
碳
、
碘
、
碲
、
硒
、
砹
、鿬(
⿰
石田);3.
锂
、
镁
、
钙
、
锰
、
镍
、
镓
、
钇
、
錷
(“
钆
”的旧译)、
锆
、
钼
、
锝
、
铟
、
铯
、
铼
、
铱
等。