中文版 | English
首页 本所概况 新闻动态 本所学人 学术前沿 本所成果 人才培养 学术刊物 基地管理 清史纂修 清史文献馆 清风学社 内部登录
 您现在的位置:首页 >> 本所成果 >> 详细内容
《新史学》第十二卷《量化史学专辑》出版
来源:清史所 作者:清史所 点击数:3413 更新时间:2021/3/17

陈志武、林展、马德斌、龙登高主编,社科文献出版社,2020年12月


目录


如何更好地量化?——量化方法与新史学 陈志武 林展


量化历史研究新趋势 

量化方法在历史研究中的应用趋势——多人合作研究是否越来越多? 陈志武 麦晓婷


国家形成与国家能力


国家形成与官僚化:来自先秦中国的证据 Joy Chen(陈雨新)


近代国家能力衰退与灾害赈济体系转型——基于1876~1879年光绪大旱灾的考察 李楠 张铎


清代命盗重案的统计特征初探——基于10.6万件案件的分析 陈志武 林展 彭凯翔


人口、寿命与家庭


清人年寿再探——基于传记数据库的若干考察 彭凯翔


实证与建模:1910年四川城镇人口研究 曹树基


首届中央研究院自然科学类与人文社会科学类院士(1948)家庭和教育背景对比分析 左右


网络分析与距离分析

“朱子授礼”新论——以社会网络分析为方法 杨逸


理性距离还是感性距离更影响双边贸易?——来自日本与主要贸易伙伴的证据 王贤彬 王明灿 郑莉萍



导论:如何更好地量化?——量化方法与新史学

陈志武 林展


量化历史是历史学、社会科学和量化方法的交叉学科,也是新史学的重要组成部分。其在国内的快速发展,始于2013年在清华大学举办的第一届量化历史讲习班和国际年会。截至2020年,量化历史讲习班和国际年会已经举办了7届。每一届讲习班的学员有120位左右,一半来自历史学等人文学科,另一半来自经济学等社会科学。在最开始的几届讲习班上,上述不同学科的学员围绕历史是否能够量化产生过激烈争论。随着讲习班的连续举办、不同学者对量化历史的介绍、量化历史相关成果在海内外广泛出版,争议的焦点不再是历史是否能够量化或者是否需要量化,而是如何更好地量化。


收入这本《新史学》第十二卷“量化史学专辑”的9篇文章,主题多样,分为量化历史研究新趋势,国家形成与国家能力,人口、寿命与家庭,网络分析与距离分析4个专题。这些文章,既有宏阔的问题意识,也有丰富的历史细节,其具体内容自然留待读者评阅。这里我们仅从如何更好地量化这一角度,对这些文章涉及的量化方法稍做说明,并以它们为例,说明量化方法对新史学的潜在价值。基于这一目的,对这些文章的介绍详略不等,但这并不反映它们研究价值和重要性的差别。

另外,需要提前稍做解释的是,这些文章中的量化分析部分,对于非专业研究者或习惯历史故事的读者来说,可能略显枯燥,但这些严格的论证,正是学术进步的重要体现。看起来较为复杂的研究方法,是随着研究者的知识探索和知识生产过程逐步演进形成的,这恰恰说明了一项研究和一个学科的专业化程度,这正是学术研究与一般报刊文章的差别:一个领域的学术论文越是需要多年的训练才能看懂,就说明那个领域的专业程度越高,其进展越大。但即使读者跳过文章中较为复杂的论证过程,也不影响对文章主要内容的理解,这些文章的前言、历史背景介绍和结论部分,已经将关心的问题、使用的史料和主要的发现做了说明。这几部分内容并没有技术上的难度,即使是没有受过量化训练的读者,也可以方便地了解文章的主要贡献。


第一篇陈志武和麦晓婷的文章,基于1980~2017年9份国际主要经济学、政治学和历史学期刊上发表的近13000篇研究论文,发现三个学科近几年使用量化方法的论文数量呈上升趋势。而随着量化分析方法使用的增多,平均每篇论文的作者数量也在上升,其中,历史研究的这些特征虽然弱于经济学和政治学,但趋势一致。这说明,在历史学研究中,使用量化方法的研究越来越多,另外也表明,在如何更好地做量化研究方面,合作是一种重要的方式。


除了这篇文章,其他8篇论文都是针对某个具体历史问题的专题研究。这些研究,按照使用的量化方法,大致可分为三类:一是对某个历史现象的度量,二是寻找两个或多个历史现象的相关性,三是探索历史现象之间的因果关系。这也是量化历史研究中常见的三种量化分析方法。传统定性研究中也常常试图做到这些,只是没有通过数据来进行严谨检验。量化方法的好处是可以将这个过程清晰地展示出来,增加结论的可靠性。下面对这三类方法分别做一简要介绍。


第一类是对某个历史现象的度量,即给历史现象赋予数值。一般包含三个要素,分别是度量的对象、数值和单位。比如曹树基对1910年四川城镇人口的研究,就使用了度量的量化方法。度量的对象是1910年四川所有县的城镇人口,度量的数值是几千或几万,度量的单位是人。陈志武、林展、彭凯翔的研究则是对清代10.6万件命盗重案特征和时空分布特征的度量,既包括案件中凶手、被害人的特征,也包括案件在时间和空间上的变化。杨逸的文章,使用了目前量化历史和数字人文中发展迅速的社会网络分析,对朱熹授礼活动中的社会网络进行了度量,以此分析以朱熹为中心的礼学学者社群。


度量是大部分科学研究的起点,清晰的度量对于量化历史研究非常重要。很多概念和历史问题的争议,往往是由于没有清晰的度量造成的,比如什么是资本主义萌芽、什么是内卷化等。精确的度量对于后续相关性分析和因果分析的作用很大。对历史现象进行度量之后,可以很快计算其统计特征,比如平均值、方差、时间趋势、空间差异、网络特征等。就对历史的理解而言,度量本身就是一个重要的学术成果。


度量可以分为直接度量和代理度量。直接度量是指度量的指标与要度量的历史对象之间是一致的,比如曹树基对城镇人口的度量,这样的度量就是直接的,这要求被度量的对象,其含义是清晰的,能够找到一个单一的数值来衡量。直接度量能够让我们快速获得历史对象的基本特征,但对于历史研究而言,直接度量的数值有时候是不精确的,这时最好将其理解为一个区间,即以研究者估计出来的数值为中心,设定一个上限和下限。这样做的好处是,可以容忍一定的误差。同时,在利用这些数据做进一步分析时,通过调整数据的区间,可以检验结论的可靠性。比如,曹树基在文章中提到山东商会数量与人口的关系,就是一个区间而不是一个特定的数值。彭凯翔对清人年寿的估计,也给出了估计值的分布区间。


代理度量则是指在没有直接度量的指标或者直接度量难以获得的情况下,对关心的变量进行测量。这时候往往用来度量的值与实际关心的历史对象之间不完全等同。彭凯翔讨论清人年寿的特征,实际上是希望用清人的寿命作为清代生活水平的代理度量。其背后的逻辑是,一般而言,生活水平越高,预期寿命也就越高。在长时段的真实生活水平难以获得的情况下,人均预期寿命是一个较好的替代性指标。


代理度量与直接度量之间可能存在差别,所以需要通过一些办法来验证代理度量的可靠性。验证的办法之一是多使用一些其他指标来作为代理度量。因此,除了人均预期寿命,研究者还使用过年龄堆积、身高等指标。如果这些不同的代理度量指标都指向同一个类似的结果,我们就更有信心接受发现的结论。在直接度量不可得的情况下,通过多个代理度量来衡量同一个历史现象,并对其时间趋势和地区差异进行比较,是提高量化分析说服力的常用办法。


第二类量化方法是相关关系分析。相关关系是指两个变量的数值之间的变动关系。相关关系分为三种,分别是正相关、负相关和不相关。正相关是指两个历史现象朝相同的方向变动;负相关是指两个历史现象往相反的方向变动;不相关是指两个历史现象的变动没有关联。


由于史料的缺乏,曹树基在估算四川城镇人口时,考虑了三组相关性,来获得城镇人口数据。第一个相关性是民国初年一个城镇的商号数量与城镇人口之间的正相关性,即商号数量越多,城镇人口数量就越多。基于对山东城镇人口的研究,作者发现民国初年一个商号对应94~104个城镇人口,因此,他用一个商号对应90个城镇人口来估计四川的城镇人口。另外,作者还利用四川68个县总人口与城镇人口之间的正相关性,来估计其他59个县的城镇人口数量。这59个县只有总人口数量,没有城镇人口数量。最后,作者发现,1910年与1953年四川分县人口之间存在高度正相关关系。上述相关性,既有助于作者在史料缺乏的情况下对不同地区人口进行估计,也有助于对已有估计数据进行检验。


陈志武、林展、彭凯翔对清代命案的研究,提到了“行商”与“盗风”的正相关性,即“行商”活动越多的地区,强盗案数量越多,但没有进行直接的检验。左右的文章则讨论了家庭背景、教育背景与首届中央研究院自然科学类和人文社会科学类院士成就的相关性。相关性分析能够帮助我们快速地判断两个历史现象之间的关联,是对定性研究进行检验的重要方法,如果一个定性的判断通过了相关性的检验,则可以考虑进一步的因果关系分析。这是第三类量化分析方法。


所谓因果关系,基本含义是改变一个历史对象的值,就可以使另一个历史对象的值改变。因果关系实际上就是历史现象背后的规律。由于与相关关系类似,人们常常将相关关系误读为因果关系。但相关关系不等于因果关系,相关关系中有可能隐含因果关系,也可能没有,一般需要进一步证明。因果关系分析可以分为两类,即寻找历史现象的原因,或者探究历史现象的结果。从分析方法而言,两者是一致的,基本都需要依靠回归分析的方法。


陈雨新的文章,讨论了造成中央集权官僚制国家形成的原因。李楠和张铎两位学者的研究,则希望解释国家能力衰退给社会带来的影响。他们基于1876~1879年的光绪大旱灾,利用府级数据考察了帝制社会晚期传统赈济措施转变对缓解灾害造成人口损失的影响。王贤彬、王明灿和郑莉萍的研究,关注理性距离和感性距离对双边贸易的影响。他们的研究发现,殖民扩张给被殖民地区在感性距离上带来熟知度与仇恨度的共同上升,这两种特征对对日双边贸易分别起着促进效应与遏制效应。


总结来说,上述文章为如何更好地开展量化历史研究提供了很好的启发,也展示了量化方法对新史学的潜在价值,这主要体现在以下几个方面。


一是有效利用历史大数据。大数据革命体现在各个学科,陈志武、麦晓婷的文章发现,经济学论文从1980年的平均不到700个样本点大幅增加到2017年的123000个样本点,政治学论文从平均860个样本点增加到14000个样本点,而历史学论文则从平均550个样本点增加到22300个样本点,足见技术革命对各学术领域的影响。陈志武、林展、彭凯翔的论文,利用了清代106万份命案记录,使用到的数据量在百万以上,但通过建立一个结构化的数据库和初步的量化分析,就可以将这些命案记录的基本特征展示出来。


二是将碎片和细节的研究串联成整体。关于历史研究碎片化的讨论很多,学者之间存在较大的分歧。但不管是碎片化或是细节化,我们都希望这些研究最后能增进对历史整体的认识。在连接碎片、细节与整体方面,量化方法可以起到一定作用。曹树基关于四川城镇人口的研究,可以说是局部的研究,或者说是整个城镇人口研究的一个碎片。但因为采用量化方法,所以可以比较便捷地推广到清代其他省份,从而帮助我们建立清代城镇人口的宏观图景。左右关于首届中央研究院院士的研究,也可以说是碎片的,但同样的分析方法,也可以扩展到对所有“中央研究院”院士以及其他精英人群的分析。


三是有助于打通断代,形成贯通性的研究。历史研究强调历史的时间性,希望形成贯通性研究。很多综合性通史或某个专题的通史是在这一目标下做的探索。这些通史著作为我们理解长时段的历史规律提供了基础,如果能够加上一些长时段的数据序列,其规律将能够更加清晰地展示出来。量化方法是实现贯通性研究的一种可行办法,即通过建立结构化的统一数据库,将不同朝代不同历史时期的同一类信息放到一起进行分析,从而比较不同朝代之间,哪些是共同性的规律,哪些是规律之外的例外,探讨为什么会有这样的规律,产生例外的原因在哪里。比如,人口数据的长时段序列就能够清晰展示王朝周期、治乱循环、经济周期等。彭凯翔的论文提供了很好的示范,即基于年寿来建立长时段生活水平变化的序列,随着年寿数据的增多,可以从清代扩展到整个历史中国。当这样的序列越来越多之后,我们对历史长时段的规律将有更清晰的认识。


四是有助于识别历史的长期影响。历史的长期影响,是人们关心历史的重要原因。今天很多重要的社会结构性特征都跟历史有关。王贤彬、王明灿和郑莉萍的研究说明,历史上被日本殖民过的国家和地区,其历史影响到今天还持续存在,尽管随着时间的推移,这些影响也在发生变化,但这些论证都展现了历史的重要性。


五是帮助纠正史料选择性偏差带来的问题。研究者接触到的史料只是历史全部材料的一部分,是“存活”下来的材料,这些材料反映的信息,并不必然反映历史事实,甚至可能与历史事实相悖。彭凯翔的论文,说明了量化方法如何帮助纠正史料的偏差。他指出,清代人均寿命并不像原始数据展示的那样,呈现下降的趋势,经过对数据偏差的修正,反而呈现上升的趋势。这正是量化分析方法相对传统方法的优势之一。


六是促进历史学与人文社会科学的对话,激发新史学的活力。陈雨新的研究,直接与社会科学中著名的“战争导致国家形成”理论进行对话,通过利用先秦中国的史料和数据,从多个角度论证了这一理论不能够解释中国的历史。李楠和张铎对清代国家能力与赈济体系转型的研究,将地方士绅等社会力量与国家能力同时进行讨论,说明他们在国家能力衰退时期的作用。王贤彬、王明灿和郑莉萍的研究则论证了历史上的殖民经历对双边贸易带来的长期而复杂的影响。这些发现有助于更好地推动相关理论的修改和完善,也增进了我们对历史规律的认识。


上述对本书收录论文的介绍,无疑只展示了少量的内容,更多详情,还请读者参阅原文。




发表评论 共条 0评论
署名: 验证码:
  热门信息
中国人民大学清史研究所
胡恒
《清史研究》投稿须知
第十二届国际清史学术研讨会在…
清史目录
张永江
黄兴涛、王国荣编《明清之际西…
国家清史编纂委员会网上工程
  最新信息
中国人民大学清史研究所域名更…
杨剑利著《闺门的退隐:近代中…
博士生史学前沿系列讲座第十六…
2021年“史学前沿”第九讲:出…
清代政治史研究工作坊·文献寻…
国家社科基金重大项目“中国佛…
清代政治史研究工作坊:中国第…
博士生史学前沿系列讲座第十五…
  专题研究
中国灾荒史论坛
清代社会史研究
清代政治史研究
清代经济史研究
中国历史地理研究
清代边疆民族研究
清代中外关系研究
近世思想文化史研究
近世秘密会社与民间教派研究
中国历史文献学研究
  研究中心
满文文献研究中心
清代皇家园林研究中心
中国人民大学生态史研究中心
版权所有 Copyright@2003-2007 中国人民大学清史研究所 Powered by The Institute of Qing History
设为首页 | 加入收藏 | 关于本站 | 联系站长 | 版权申明
您是本站第 位访客,京ICP备05020700号
账户:
密码: