程 宁 | 唐诗语体的历时演变——以虚字使用密度为中心
程 宁 2026-02-01 00:01 江苏
以虚字使用密度为中心,探讨唐诗语体历时演变及与诗文散化、宋调关联。
转载自“山东社会科学”
![]()
点击蓝字 关注我们
2025年第11期
2025.11
作者简介
![]()
程宁,清华大学文学博士,中国社会科学院文学研究所助理研究员、数字人文与计算批评实验室成员,兼任中国民族语言学会语言资源与计算人文专委会理事,主要研究方向为计算语言学、计算诗学、古典知识库、数字人文,申请国家专利1项,计算机软件著作登记1项,在《清华大学学报(哲学社会科学版)》、《中文信息学报》、国际数字人文大会(ADHO)等发表论文数篇,被《中国社会科学文摘》、人大复印报刊资料转载。
![]()
本文原载《山东社会科学》2025年第11期,参考文献及注释参见本刊原文。欢迎转发与授权转载。如需转载请联系0531—82866416,联系人:陈老师。转载请注明来源!配图均来自网络。
![]()
[摘 要]虚字涌现是诗歌散文化书写的重要标志。从词频偏移检测的角度出发,可以清晰地发现,韩愈“以文为诗”的创作实践与唐诗总体相比,其最显著的用词差异是虚字的凸显。采用自动分词、词性标注、统计检验等技术手段,对《全唐诗》中的虚字进行标引,并在此基础上开展群体性的量化比较和回归分析后发现:一方面,研究结果有力佐证了钱锺书先生关于陈子昂、张九龄、李白、杜甫、韩愈等人在“诗用语助”上的精妙论断;另一方面,从整体趋势来看,唐诗近三百年间不同时段的虚字使用密度并不相同,且恰好呈现出初唐、盛唐、中唐、晚唐依次线性增长的动态过程。进一步将研究视野拓展至更大语料范围和更长历史时段,观测虚字使用的消长变化后发现:诗歌虚字密度从先秦到魏晋再到唐初呈不断降低趋势,而自初唐开始逐渐攀升,历经盛唐、中晚唐,后由宋接续并大幅增长,这正体现了中国诗歌语体形式由松到紧再由紧到松的往复变化。
[关键词]唐诗;虚字;“以文为诗”;语体演变;数字人文
2025.11
阅读导引
一、虚字使用与诗体观念
二、虚字涌现与“以文为诗”
三、虚字入诗的实相
四、余论
虚字在构成古典诗歌的语言材料中地位低微,以虚字入诗多遭讥评,而实际创作情况却大相径庭。虚字虽然无法彰显主题内容,但是能有力反映语体特点。诚如“凡多用虚字便是讲,讲则宋调之根”所言,虚字的增减变化实为揭示诗体演进规律的重要线索。回顾既有研究,学界关于虚字的探讨多局限于对个别诗人、单篇作品中虚字修辞功能的分析,侧重于定性解读,而缺乏在全时段、全样本视野下的量化比较研究。有鉴于此,有必要引入自然语言处理技术,对全量诗歌数据进行系统性的虚字标引,并结合回归分析等统计方法,展开历时性、群体性的实证考察,以期破除传统诗学研究中依赖主观印象判断的局限,从量化分析的视角揭示在诗歌发展历史脉络中虚字使用所呈现的总体趋势、阶段性差异与个体化特征,进而深入探讨其与诗歌散文化倾向之间的互动关系。
一、虚字使用与诗体观念
“虚字”在古代也称为“辞”“语助”,这里的“字”多指语词而非单用字,与今天的虚词概念接近。虚字无实义,却对文意贯通至关重要。刘勰《文心雕龙》曾论及虚字对诗文创作的作用:“又《诗》人以‘兮’字入于句限,《楚辞》用之,字出句外。寻‘兮’字承句,乃语助余声。舜咏《南风》,用之久矣;而魏武弗好,岂不以无益文义耶!至于‘夫’、‘惟’、‘盖’、‘故’者,发端之首唱;‘之’、‘而’、‘于’、‘以’者,乃劄句之旧体;‘乎’、‘哉’、‘矣’、‘也’,亦送末之常科。据事似闲,在用实切;巧者回运,弥缝文体:将令数句之外,得一字之助矣。外字难谬,况章句欤!”刘勰指出了不同句位虚字的表现,并点明虚字可作“语助余声”、增强韵律,还可以“弥缝文体”、组织结构,这在一定程度上肯定了虚字的价值;然而,他仍将虚字视为一种“剩语”。
随着历代学者对虚字用法的认识持续深化,其功能和地位也随之得到进一步提升。清人刘大櫆便提及,虚字能够传递作者神态:“上古文字初开,实字多,虚字少。典谟训诰,何等简奥,然文法要是未备。至孔子之时,虚字详备,作者神态毕出。”虚字虽不直接承载实义,却能巧妙地渲染作者情感、营造文章氛围。从这方面讲,文章用虚字有其独立于实字之外的重要意义。清代刘淇《助字辨略》有云:“构文之道,不过实字虚字两端,实字其体骨,而虚字其性情也。”马建忠在《马氏文通》中亦有“实字其体骨,虚字其神情也”的类似论述,从语法角度将虚、实两字并提,使得虚字彻底摆脱了实字的附庸地位,获得了应有的重视。
虚字的使用对于古代散文来说,无疑是正当且必要的。然而,以虚字入诗,尤其入律绝,却往往会招致诗论家的各种意见。关于诗歌能否使用虚字以及应当如何使用等问题,在唐及以前讨论不多。南朝梁钟嵘曾就当时诗歌创作中存在的“用事”流俗而殆同书抄的现象提出反对意见,其中便涉及虚字的使用问题:“故大明、泰始中,文章殆同书抄。近任昉、王元长等,词不贵奇,竞须新事,尔来作者,浸以成俗。遂乃句无虚语,语无虚字,拘挛补衲,蠹文已甚。”不过,钟嵘提出的“句无虚语,语无虚字”是从用事的对立面来说的,并没有正面探讨虚字使用的问题。
真正开始正面讨论虚字入诗并进行评鉴的情况,到了宋代才逐渐增多,至明清之际则蔚为大观。宋魏庆之《诗人玉屑》论及唐人句法,专门列有“虚字妆句”和“首用虚字”条,胪列张籍“长贫惟要健,渐老不禁愁”、杜甫“飘飖搏击便,容易往来游”、钱起“乍见翻疑梦,相悲各问年”、贾岛“渐老更思深处隐,多闲惟借上方眠”等数例,这在一定程度上体现了其对虚字入诗现象的关注。元陶宗仪《南村辍耕录》引赵孟頫语“作诗用虚字殊不佳”,则体现了对虚字入诗的否定态度。持此类观点的人不在少数,以至于后来诗坛逐渐形成了“实字多则健,虚字多则弱”的主流看法。当然,也有一些论者从诗歌鉴赏角度给出了较为中肯的意见,如方回在《瀛奎律髓》中说道:“诗中不可无虚字,然用虚字而不切,则泛也。”
杜甫善使虚字,很多诗论家尽管否定虚字入诗,却唯独给杜甫开了特例,其“江山有巴蜀,栋宇自齐梁”(《上兜率寺》,第2462页),“有”与“自”二字用得极妙,两字烘托出远近数千里、上下数百年的慨叹,因而常被后人称道。明代胡震亨便是典型代表,他一方面否定虚字入诗的合理性,认为“诗用助语字,非法也”,另一方面却对杜甫“馀力浮于海,端忧问彼苍”中的虚字运用表示赞赏,认为其用而不觉,而对王孟诗作中如“畅以沙际鹤,兼之云外山”及“依止此山门,谁能效丘也”之类的虚字使用,则直言“恶矣”。清代亦有诗论家指出“炼实字易”而“炼虚字难”,这也是在说虚字在诗中很难用得恰当,需要花大功夫。
明代诗论家不仅关注诗歌能否使用虚字以及如何使用的问题,还从诗史层面注意到唐代不同时期诗歌虚字使用的演变情况。如李东阳提到盛唐诗善用虚字:“诗用实字易,用虚字难。盛唐人善用虚字,其开合呼唤,悠扬委曲,皆在于此。用之不善,则柔弱缓散,不复可振,亦当深戒。”又谢榛《四溟诗话》谈论唐代七律时提到中唐诗虚字渐多:“七言近体,起自唐初应制,句法严整。或实字叠用,虚字单使,自无敷演之病。如沈云卿《兴庆池侍宴》:‘汉家城阙疑天上,秦地山川似镜中。’……观此三联,底蕴自见。暨少陵《怀古》:‘一去紫台连朔漠,独留青冢向黄昏。’此上二字虽虚,而措辞稳帖。……中唐诗虚字愈多,则异乎少陵气象。刘文房七言律,《品汇》所取二十一首,中有虚字者半之。如‘暮雨不知涢口处,春风只到穆陵西’之类。……凡多用虚字便是讲,讲则宋调之根,岂独始于元、白?”谢榛认为,初唐七律虚字皆得其力,中唐虚字入律现象愈发泛滥而敷衍薄弱,并举了钱起、刘长卿的具体诗例,以此说明虚字多用的情况并非始于元、白,而是中唐诗人群体所共有的特点。另外,“多用虚字便是讲,讲则宋调之根”点明了虚字不仅能够体现唐人的炼字技巧,而且其数量多寡反映了唐诗语体类型的演变。
钱锺书从历时角度梳理了诗用语助的情况。他首先指出,周秦之诗骚及汉魏以来之杂体歌行多“使语助以添迤逦之概”,极观于陈子昂《登幽州台歌》、李白《蜀道难》等,宋人不能望其项背;而后结合五言用虚字的情况,提到“唐则李杜以前,陈子昂、张九龄使助词较夥。然亦人不数篇,篇不数句,多摇曳以添姿致,非顿勒以增气力”;接着又从引古文元素入诗的角度论及唐前陶渊明通文于诗,到唐人元结“语助无不可用,尤善使‘焉’字、‘而’字”,最后落到“昌黎荟萃诸家句法之长,元白五古亦能用虚字,而无昌黎之神通大力,充类至尽,穷态极妍”。
谢榛讨论的是七言律诗,钱锺书主要讨论的是五言古体诗,二者从不同体裁角度分析了唐代虚字入诗的各种表现,并且涉及具体诗人的创作特点。总体来看,初唐诗和中唐诗用虚字的目的存在差异:前者主要为了“摇曳添姿”而“得其力”,后者主要是为了“讲”而“以文为诗”。虚字入诗,一方面是为了炼字以增添艺术效果,另一方面则是为了方便叙事与议论。多用虚字使得诗歌的意象由繁到疏、逻辑由弱到强,不同位置的虚字使用还会导致句式、句法跳脱出常见的对仗模式,而不自觉地带上散文化的特征,进而让诗歌能够更自由、更丰富地抒发情感和表达思想。
二、虚字涌现与“以文为诗”
虚字的凸显是诗歌散文化书写的重要标识。韩愈作为“以文为诗”的典型代表,几乎将散文中常见的各类语助词悉数移植入诗。因此,有学者认为韩诗“非诗”,而是“带韵的散文”,这种评价从其语汇选用的角度来看有一定道理,韩诗确实不符合传统诗歌在语汇运用上的典型特征。近年来,随着自然语言处理技术不断介入古典文学研究,研究者得以借助自动词法分析手段,对韩愈与其他诗人的词频差异进行比较验证。这一研究路径具有双重意义:一方面,它能够从量化视角重新审视并深化我们对韩愈诗体特征的认识;另一方面,它也可以进一步证实虚字的频繁使用与诗歌散文化书写之间具有强关联性。
与西方语言不同,汉语书面语无词语界限,因此,若要进行词频统计,首先面临的便是分词问题。汉语的自动分词是自然语言处理领域的一项基础任务,现代汉语领域的分词效果已经达到较高水准,而在古代汉语领域,由于不同时代、不同文体的语言特性有异,且古汉语的词汇标准在汉语理论中也未见统一,这些因素共同导致古汉语自动分词模型的整体效果不及现代汉语,在古典诗歌领域尤为明显。
有不少学者曾对古典诗歌分词技术做过探讨。俞士汶与胡俊峰提出了基于互信息的概率统计模型;罗凤珠则利用诗歌典型格律节奏来划定字串;年轻一辈如张家瑞等基于BPE(Byte-Pair-Encoding)算法,依据字词共现频率进行分词;潘长在(Changzai Pan)等提出TopWORDS-Poetry方法,结合格律信息并采用贝叶斯推理模型来分词。
需要指出的是,古典诗歌的自动分词处理不可避免地会面对语义优先还是节奏优先的关键问题。以唐诗为例,仅依靠经典格律“两字组合+三字脚”显然难以应对所有情况,谢思炜曾就白居易的七言诗总结出若干特殊句法模式,这表明固定格律并非万能的。况且,《全唐诗》中古体诗占比超40%,近体诗的固定格律规则覆盖范围相对有限。另外,若仅依照传统古文的语义进行分词也不尽合理,因为这忽略了诗歌本身独特的语词组成方式以及复合式的意象特性。国内鲜有关于古典诗歌分词的标准评测体系,各家制定或依照的规范也不尽相同,因此所得到的分词结果缺乏可比性,在人文研究领域的实际应用也十分有限。
由于本研究主要关注唐诗的语汇情况,2017年出版的《全唐诗词语通释》(以下简称《通释》)为唐诗文本的自动分词提供了关键参照依据。该工具书以《全唐诗》(中华书局1960年版)与《全唐诗外编》(中华书局1982年版)所录唐诗为限,收录“词目以语词为主(包括结构较固定、用例较多的词组)”。经统计,该书语词总量超10万条,以其收词立目为基准,能够有效避免自动分词规范问题上的诸多争议。此外,《通释》的词目字形与《全唐诗》《全唐诗外编》保持高度一致,这一特性使其非常适合作为自动分词的基础词表。除《通释》外,本研究另搜集整理了包括《中国古典诗词地名辞典》等在内的其他诗词类常用词典数据,制成混合词表,去重后总计21万条。研究使用Python调用HanLP工具包,融入混合词典底表进行辅助切分,进而得到最终分词结果。模型具体配置参数如表1所示。
![]()
通过自动提取韩诗词频,并以《全唐诗》总体词频为参照,计算相对词频量差,然后将差值降序排列,可以得到韩诗和唐诗整体对比中的用词偏好。公式描述为:
![]()
其中,pi(1)指韩诗中词i出现的相对频率(即单位占比),pi(2)则是筛除韩愈作品后唐诗总集中词i出现的相对频率,δpi为两者差值,若差值为正(δpi>0),代表该词在韩愈诗中更常见;若差值为负(δpi<0),则代表该词在《全唐诗》(不含韩愈诗)中更为常见。这种基于相对词频差的计量方式简单有效,容易被传统人文学者理解和应用。为便于比较分析,根据所得差值大小对结果进行降序排列。限于篇幅,抽取出差异最大的前50词绘制成图1,进行可视化展示。
在图1中,横轴代表二者的用词倾向,纵轴则按二者用词差异程度进行排序,差异越大,排名越靠前。以“我”为例,韩愈用“我”的概率远超《全唐诗》的总体水平,因此图柱向韩愈一侧倾斜,又因其概率差值最大,故排序位列第一。通过对该图的整体观察可以发现,前人基于阅读经验对韩诗语言特点的总结,在客观的数据计量分析中得到了充分验证和量化支持。图1左侧区域能够清晰地揭示出韩诗在遣词方面偏离唐诗总体的重要特征,遍布散文字法,特别是典型的虚字如“其、之、以、所、或、于”等名列前茅,后面还有“与、而、若、何、且、当、岂、者”等虚字使用频率均超出唐诗的总体水平。反观右侧,可以发现唐诗总体中包含了大量表达情感与描绘景物的意象,如“秋、花、风、春、月、愁”等,反映了唐诗注重抒情写景、意境营造的基本特点。
![]()
图1 韩愈诗与唐诗总体词移表现
此外,左侧还可以发现大量人称代词,如“我、子、汝、吾”等,此类在古代诗文评中亦可作虚字讲。“空堂黄昏暮,我坐默不言。童子自外至,吹灯当我前。问我我不应,馈我我不餐。……其言有感触,使我复凄酸。”(韩愈《秋怀诗十一首·其八》,第3767页),多用第一人称意味着诗人的自我确认意识较强。据罗时进等人统计,“初唐诗中‘我’字使用率很低,随着向盛唐发展而渐高,李白则居于顶峰。中唐走向偏底,至白居易形成又一高峰。晚唐则又稍低,但仍超出初唐”。这在一定程度上体现了诗人的个性和时代风气变化。多用第二人称则意味着文本的对话性与叙述性较强,如“黄鹄得汝去,婆娑弄毛衣。前汝下视鸟,各议汝瑕疵。汝岂无朋匹,有口莫肯开。汝落蒿艾间,几时复能飞。”(韩愈《南山有高树行赠李宗闵》,第3829页),采用借代手法和逻辑语序生动呈现场景,体现了寓文于诗的“讲”的特质。
上述以韩愈诗为例,从其创作的诗歌总体上揭示出其虚字入诗的显著特点。吴振华指出,虚字的使用是形成韩愈“以文为诗”诗法的关键因素,对后代(尤以宋代为甚)诗歌创作规范的重建及诗歌语言的革新产生了很大影响。以散文字法、句法、章法入诗并非韩愈一人独有,尽管其诗在当时诗坛并未引起足够重视,但其承前启后的作用不容忽视。如晚唐杜牧受其影响,亦有诗多用虚字者,如“人才自朽下,弃去亦其宜。……臣实有长策,彼可徐鞭笞。如蒙一召议,食肉寝其皮。斯乃庙堂事,尔微非尔知。向来躐等语,长作陷身机”(《雪中书怀》,5944页)。
诗论家注意到虚字入诗在唐诗各阶段的表现不尽相同,但这种认识多停留在有限的阅读体验层面,未能揭示出客观整体情况。葛兆光也提到,“说唐诗多用实字宋诗多用虚字的评论家其实并没有任何统计的依据”,虚字在唐诗中的发端及其发展态势究竟如何,以议论见长的宋诗在虚字使用上是承接了唐诗语体的发展趋势,还是异军突起或另起炉灶,这些问题都需要借助远读和量化的分析手段来回答。
三、虚字入诗的实相
闻一多认为,诗的语言讲究“弹性”,“而弹性的获得,端在虚字的节省”,并提到诗从《三百篇》《楚辞》到建安(《十九首》包括在内),“五言句法之完成,不是一件了不得的大事,而句中虚字数量的减少,或完全退出,才是意义重大”。所谓诗歌排斥虚字,是相对于散文的语言特性而言。事实上,虚字作为语言的有机组成部分,在任何文体中都不可能完全退出,其使用更多地呈现为一种阶段性衰减或增多的辩证发展过程。诗歌的语言并非全然无序的堆砌,像“鸡声茅店月,人迹板桥霜”(温庭筠《商山早行》,6741页)这种名词意象并列铺排的写法并不多见。一旦进入叙事,有关时空、因果、状态的描述便不可避免地介入进来,这时虚字所能发挥的功用也就不言而喻了。韩晓光指出,尽管虚词在近体诗中的出现频率不是很高,但门类很齐全,并例证了各词类(副词、介词、连词、语气词等)皆有体现。这为本文后续对虚字的统计分析提供了可行性验证依据。
使用统计的方法考察唐诗虚字,在20世纪80年代就已出现,程湘清等人以《唐诗绝句精华》中788首绝句为对象,对近体诗中虚词的使用情况展开了调查。统计结果显示,虚字的使用数量相当惊人,平均不到五个字就有一个是虚字,其中完全不用虚字的绝句,如“日暮苍山远,天寒白屋贫。柴门闻犬吠,风雪夜归人”(刘长卿《逢雪宿芙蓉山》)这类情况仅有71首,在总数中并不占优势。近体诗尚且如此,形式更为自由的古体诗应当更为普遍。由此可见,诗歌创作使用虚字斡旋是常态。不过前人只是粗略地观察了虚字在绝句中的总体数量,既未明确交代虚字如何界分,也未能从历时角度把握唐诗整体虚字使用情况的变化,而统计虚字在不同时期的使用频率和分布模式,可以进一步窥探唐诗整体语言体式风格的转向。
古人对虚字的认知与今人有异,诗歌内容上的“写虚”和语言体式上的“用虚字”有时会混为一谈。不过,虚字本身的核心内涵古今差异不大,谢榛所论虚字和今天的虚词概念颇为接近。不同于活跃的实词系统,虚词流传至今变化较小、表现稳定,是一个相对封闭的集合。从现代语法角度来看,汉语中的虚词通常包括介词、连词、助词、语气词,主要用于体现递进、转折、并列、顺承等逻辑关系。此外,还有两类虚实界限相对模糊的词:副词和代词。副词介于实词和虚词之间,用来表示状态,其系统同样具有相对封闭性,国内语言学家吕叔湘、朱德熙、陆俭明等人均将其归为虚词类,杨伯峻《文言虚词》亦将代词划定为虚词类。代词用来指称事物,古代诗文评所论虚字亦涉及代词,如谢榛《四溟诗话》有“夏正夫谓涯翁善用虚字,若‘万古乾坤此江水,百年风日几重阳’是也”,其中“此”“几”分别对应指示代词与疑问代词。
综合古人论评情况,本研究选定介词、连词、助词、语气词、代词、副词作为虚字考察范围。采用HanLP对诗歌文本进行词性标注,参考表1所示任务组合参数配置,使用分词与词性多任务联合标注方法,词性标记选用北京大学PKU标记集。自动词性标注主要致力于解决以下三个方面的问题:其一,尽可能区分出唐诗中存在的字形相同而语义全然不同的词,如“乱花渐欲迷人眼,浅草才能没马蹄”(白居易《钱唐湖春行》,第4957页)中的“才能”是表示“方才能够”的副词,而不是表示“才智和能力”的名词;其二,结合特定上下文语境确定某一多义词的具体义项和词性,如“所思如梦里,相望在庭中”(张九龄《秋夕望月》,第591页)中的“在”是介词,表示动作、行为进行的处所、时间、范围或事物存在的位置,“李杜文章在,光焰万丈长”(韩愈《调张籍》,第3814页)中的“在”则是动词,表示“存在,在世”;其三,依句辨品,结合上下文语境确定词类活用现象,如“东风已绿瀛洲草,紫殿红楼觉春好”(李白《侍从宜春苑奉诏赋龙池柳色初青听新莺百啭歌》,第1716页),其中“绿”是形容词使动用法,包含了“绿”的动作和结果,依据词性标注原则此处应按动词处理。
表2展示了机器自动分词和词性标注的实例。需要说明的是,面对庞大数据集,人工处理能力毕竟有限,采用机器自动分词与词性标注虽难以完全避免偏误,但借助《通释》进行辅助切分,这些偏误能够被控制在较小范围内。使用同一套标准对唐诗进行处理,对其内部各阶段虚字使用差异的比较影响较小,即便数据集的精度尚未达到最优水平,仍然可以有效地呈现唐诗虚字使用的整体水平和趋势,进而得出可靠结论。这种方法论恰恰体现了基于大数据研究的核心原则——庞大的数据量能够弥补个别数据点的不精确性,从而保证整体研究结果的准确性和可信度。
![]()
为了进一步验证机器标注的有效性,我们随机抽取了200条唐诗数据,并引入人工标校对照组,开展基于多评定者的Fleiss’ Kappa一致性检验,检验结果如图2所示,Kappa值达80%,表明标注一致性较为显著。
![]()
如表2所示,词性标注方法为每个词赋予了词性标签(如副词使用“/d”标记)。根据各类虚词标签,可统计每位诗人各自作品集的虚字使用密度。为了避免不同诗人作品量差异对虚字统计造成偏差,计算平均每万词的虚字数量,公式如(2)所示。
![]()
N(i)d代表某一特定诗人或特定分期i所有作品中常用副词的总数量。这里的“常用”指标记为副词且出现频次大于5的词,目的是进一步降低生僻词的标注偏误。以此类推,N(i)p代表常用介词的总数量,N(i)c代表常用连词的总数量,N(i)r代表常用代词的总数量,N(i)u代表常用助词的总数量,N(i)y代表常用语气词的总数量,N(i)all则代表所有类型的词的总数量,Fi即为某一分期或某位诗人平均每万词的虚字使用总量。当i表示特定诗人时,通过计算Fi并将结果进行可视化呈现,可以观察不同诗人的虚字使用差异。部分唐代诗人虚字入诗密度分布情况如图3所示。
![]()
将作者大致依《全唐诗》编排顺序从左到右展开,通过观察散点分布和趋势走向可以发现,唐诗的虚字使用在整体上呈现出线性增长的动态过程。为从统计学上验证这一线性趋势,以十个数据点为单位窗口进行分段线性回归分析,拟合优度指标R2=0.818(p<0.01),表明模型拟合结果较好。具体指标值如图4所示。
![]()
如果说韩愈“以文为诗”的写作体现了一种文学自觉,那么这种群体性的动态增长趋势则更多反映了语言的自发,它并不是关键人物或外部刺激决定论所导致的,而更像是诗歌语言内部的自然演化过程。
初唐诗避用虚字,用的相对多的是张九龄,其次是陈子昂,这一现象有力佐证了钱锺书“唐则李杜以前,陈子昂、张九龄使助词较夥”的说法。盛唐诗人分布较为离散,数值方差较大,各诗人虚字使用情况并不均衡,这与诗歌主题风格的多元化和个性化发展密切相关。不同的诗歌主题和风格需要不同的语言处理方式,虚字在其中的参与程度也各有不同。这一时期韦应物、李白、高适、杜甫的虚字使用处于较高水平,而常建的虚字使用相对较少。
“诗到元和体变新”(白居易《余思未尽加为六韵重寄微之》,第5000页),标志着中唐虚字使用已经明显高于初唐时期,从图3可以看出,韩孟、元白两大诗人群体皆频繁使用虚字。尤其是韩愈远超总体水平,处于全唐最高位,显著揭示了其诗用语助“神通大力,充类至尽”的特点。其次是白居易,而后是元稹、张籍、王建,诸位写实、尚俗的风格特点正需要借助大量虚字连接意脉,以实现通俗化抒情或叙事。韩诗奇诡,白诗平易,二者诗歌创作风格迥异,而虚字使用密度却不相上下,均处于较高水平。可见诗风比语体更复杂,仅用虚字密度来表征诗风显然是不够全面和存在欠缺的。余恕诚说:“如果说韩愈用虚字增加了诗歌语言的参差错落,白居易用虚字则增加了语言的流畅便利。”不过,“多用虚字便是讲”这一点在诗歌语境中是毋庸置疑的,不管是不平则鸣的韩愈,还是娓娓道来的白居易,其诗多反映人事变迁,更加贴近世俗生活,而表示“状态”“指示”“转折”“因果”等属性的虚字是人事描写不可或缺的语言要素。中唐之后,晚唐诗人群体的虚字使用水平分布非常集中,司空图、皮日休、陆龟蒙相对高,李商隐、杜牧处于中间水平,温庭筠、李群玉则相对低,不过晚唐在总体上要高于初唐和盛唐。
上述讨论并未区分古体和近体诗,实际上,古体诗的虚字使用频率在整体上历来变化不大,而近体诗变化则更为明显。图5呈现了仅考虑律绝的情况,可以发现这种线性增长的趋势并未发生变化。
![]()
从图5密度分布来看,初盛唐近体诗整体排斥虚字。林庚曾指出:“语言的诗化,具体地表现在诗歌从一般语言的基础上,形成了它自己的特殊语言;这突出地表现在散文中必不可缺的虚字上。如‘之’‘乎’‘者’‘也’‘矣’‘焉’‘哉’等,在齐梁以来的五言诗中已经可以一律省略。”其实从魏晋六朝一直到盛唐之初,诗歌语言总体上都是虚字渐少的,不过细化到具体诗人也有例外。如陶渊明通文于诗,其作品多使虚字而与众不同。在杜甫之前,张九龄近体诗虚字使用较为突出,如其作品“海上生明月,天涯共此时。……不堪盈手赠,还寝梦佳期”(《望月怀远》,第591页)就用“共”字来烘托诗人的无尽情思。
有学者提出杜甫近体诗的虚字使用数量位居唐代诗人之首。然而,从图5可以看出,阅读经验和统计结果存在些许偏差。若仅可考察杜甫之前的唐代诗人,此说法完全成立;但在老杜之后,情况发生了变化,白居易凭借其意脉流畅、通俗浅近的笔法成为虚字使用密度最大的诗人。相较之下,韩愈的近体诗虚字使用并不算突出,处于中唐平均水平,可见其“以文为诗”的实践重点是以古文作“古诗”而非近体诗。此外值得留意的是,晚唐司空图的近体诗虚字使用亦较为凸显,位列第二。其诗熟稔散文化叙事手法,一个突出表现便是虚字连用,如“林鸟频窥静,家人亦笑慵。……华宇知难保,烧来又却修。只应巢燕惜,未必主人留”(《即事九首·其七》,第7254页),再如“醉日昔闻都下酒,何如今喜折新茶。不堪病渴仍多虑,好向湖便出家”(《丑年冬》,第7275页),“频”“亦”“又”“只应”“未必”等虚字关联词迭出,起接转衬贯通意脉,增强了诗歌的叙事性。大量虚字的穿插运用,在促使诗歌语言走向散文化与通俗化的同时,也不可避免地削弱了诗歌的空间想象和意境营造。
四、余论
上述研究仅考察了有唐一代的虚字使用情况,若进一步纳入先唐及宋代诗歌数据,从更长的历史跨度来看,则会发现虚字入诗从来不是禁忌,其在先秦至宋的使用频率呈现出动态消长的变化过程。在公式(2)中,若将i设置为不同的历史分期,便可据此计算出历代古典诗歌中虚字的使用密度,结果如图6所示。
![]()
葛兆光曾指出,“从语言上看,在中国诗史上,从古体诗到近体诗、从近体诗到白话诗这两次变化是真正的大变局,前一次变局使诗歌与散文彻底划清了界限……后一次变局使诗歌与散文又重新彼此靠拢,诗歌与散文的重新靠近其实就是所谓的‘以文为诗’”。此评可谓鞭辟入里,图中所示虚字的消长过程,可视为诗文交侵的历史过程,其趋势走向勾勒出诗歌语体由松到紧再由紧到松的往复变化。
中国早期诗歌处于诗文分离的初始阶段,其语言与日常语言差异不大,虚字的使用密度接近于散文。从先秦两汉到魏晋南北朝再到初唐时期,语言的诗化进程持续推进,这期间的突出特点便是通过语言要素的减省,使得虚字的使用频率大幅降低。这种诗化策略促使诗歌逐渐趋向意象繁密,初盛唐之际语言的诗化过程基本完成,避用虚字似乎成为潜在规则。另外,近体诗确立,严谨的声律格式与对偶模式在构建诗歌创作标准的同时,其所形成的新传统和新规范也较大程度束缚了诗歌语言的活力。近体诗标准的确立为诗歌语言的运用提供了基本框架,而规则的制定往往也孕育着“破体”的基因,它既是进行创造性表达的基础,也是驱动诗人创新的内在动力。唐皎然《诗式》有云:“作者须知复、变之道,反古曰复,不滞曰变。若惟复不变,则陷于相似之格,其状如驽骥同厩,非造父不能辨。能知复、变之手,亦诗人之造父也。”
唐代诸多诗人在虚字运用方面展现出鲜明特色,这实际上是对当时诗歌句式和词汇组合规范的一种突破。他们通过重新引入并创造性地运用虚字,达到了冲击桎梏、破体为新的目的。这不仅丰富了诗歌的内涵和表现力,也促进了诗歌语体的进一步变革。正如林庚所言:“唐诗本身当然更是丰富了深入了诗歌语言的领域……事实上还存在着从日常语言中来又回到日常语言中去,一种否定的否定的辩证发展。”虚字在唐代重新回归,在中唐时期形成一个小高峰,晚唐后又呈陡增态势,并一直延续到宋代。宋诗的虚字使用密度远在唐诗之上,超越魏晋,仅次于先秦。这一数据表现为唐诗多用实字而宋诗多用虚字的阅读感受提供了客观的统计依据。
虚字的增减只是表象,实际上,它意味着诗歌在语体建构方式上的深层转变,而这种转变恰恰反映了创作主体对“何以为诗”与“因何为诗”的进一步探寻与思考。唐诗主情,宋诗主理,如今已成定论。由于“理”的表达需要主客体间清晰的信息传递,要求逻辑严谨、意脉流畅,故而带有极强的散文化倾向。这或许正是宋诗虚字显著高于唐诗的原因所在。在讨论唐宋诗风演变时,杜甫、韩愈、白居易多被前人拿来作为宋诗风格之肇始,其中尤以韩愈受评点最多。若从虚字使用密度来看,其诗与宋诗高度相似,且均超出各自时代总体使用密度的10%,这似乎也印证了韩诗与宋诗在语言体式上确有承继关系。
主理和议论固然会较多地使用虚字,但宋诗并非全然“以议论为诗”,其虚字密度要显著高于唐诗,这一现象并非仅由不同的诗歌主张所造成。从唐代各阶段直至宋代虚字密度呈现出的连续性攀升态势中,我们便可窥见端倪。这一过程有主“理”的外力推动,亦不能忽视语言因时而变的自发性,尤其是那些反映诗人群体的共同性特征,往往并非诗人个体刻意为之,而是汉语的整体使用习惯悄然发生了变化。此外,尽管宋诗的语言体式已显露出某种“现代性”,如白话与通俗意味加重,但从虚字使用密度发展的整体趋势来看,这种白话转向似乎并非始于宋,而是自唐代近体诗形成后不久便已悄然萌芽了。
2025年第11期
![]()
2025年第11期
![]()
![]()
山东社会科学
比特人文
投稿邮箱:dhbase@126.com
扫码关注 获取更多资讯
![]()