3 生命表与生命概率
内容简介
生命表(Life Table / Mortality Table)是研究人口生命规律的有力工具,它用表格的形式简单清楚地描述了特定时期内特定人群随年龄不断身故的全部过程。本章先从人口统计的角度简要介绍生命表的编制。借助生命表,我们可以方便地计算各种生存率、死亡率,从而为寿险产品定价奠定严谨的数学基础。同时我们还可以把寿命看作一个随机变量,继而从概率角度深入界定其分布函数、生存函数、余命与取整余命等重要概念。
学习目标
- 了解人口统计(人口普查)的基本原理
- 了解生命表的编制方法
- 掌握生命表基本函数及其相互关系
- 掌握剩余寿命的随机分布
- 了解三种常用的非整数年龄存活函数的估计方法
人最宝贵的是生命。生命每个人只有一次。人的一生应当这样度过:当回忆往事的时候,他不会因为虚度年华而悔恨,也不会因为碌碌无为而羞愧;在临死的时候,他能够说:我的整个生命和全部精力,都已经献给了世界上最壮丽的事业——为人类的解放而斗争。
—奥斯特洛夫斯基(Николай Островский)《钢铁是怎样炼成的》节选
3.1 人口统计学简介
3.1.1 发展历史
人口(Population)是指某一国家或地区内的全部居民,人口是社会存在和发展的前提。人口不仅作为生产力的决定性要素参与生产过程,而且作为消费主体成为生产过程的终点和归宿。人口统计学(Demography)是研究人口数量、构成、分布、变动及其规律的科学。
由于人口具有多变性和社会性等特征,从古至今在国家治理体系中需要通过人口统计来了解人口增长、劳动力供给、流动人口数量增减等人口规律性变化。只有掌握了人口变动规律,才能为就业、教育、养老、医疗和消费等政策制定和完善提供科学依据。
根据(田 2022)的研究,人口统计学作为一门独立学科,其发展历程可划分为四个主要阶段:
古代萌芽时期(17世纪前):早期文明已出现人口记录的雏形。中国西周时期的”司民”制度建立了最早的人口登记体系,秦汉时期的”上计”制度形成系统的人口统计方法。古希腊城邦开始统计公民人数,古罗马每五年开展一次人口财产普查。这一时期以简单计数为主,尚未形成系统的分析方法。
学科形成时期(17-18世纪):1662年约翰·格兰特《关于死亡表的自然与政治观察》开创了现代人口分析先河,首次运用数学方法研究死亡率规律。威廉·配第将统计学引入人口研究,提出”政治算术”概念。魁奈构建了最早的人口经济模型。中国清初《赋役全书》建立起完整的人口统计制度,洪亮吉1793年提出的人口增长与资源矛盾理论早于马尔萨斯。
学科确立时期(19世纪):人口统计学正式成为独立学科。马尔萨斯《人口原理》引发全球性讨论,凯特莱将概率论引入人口研究,法尔建立现代生命表体系。1853年首届国际统计大会确立了标准化人口统计指标。清政府1908年开展首次现代人口普查,标志着中国进入科学化人口统计阶段。
现代发展阶段(20世纪至今):数理统计方法革新推动学科飞跃。洛特卡提出稳定人口模型,汤普森建立人口转变理论。二战后联合国主导全球人口统计标准化,计算机技术使大规模数据处理成为可能。中国在1982年第三次人口普查中首次采用电子计算机处理数据,2010年第六次普查实现全流程数字化。当代人口统计学已形成包括数理人口学、经济人口学、社会人口学等在内的完整学科体系。
3.1.2 人口调查
人口调查是人口统计的基础,其核心在于构建多维度、多层次的人口数据采集体系,并通过科学化流程确保数据质量。人口调查中的数据收集主要依托常规行政登记与专项调查相结合的模式:
常规登记包括户籍管理、出生死亡记录等持续性行政档案,形成基础人口数据库;专项调查则以抽样调查(如1%人口抽样)、典型群体追踪和大数据辅助采集(如手机信令、社保记录)为补充,弥补常规数据的静态局限。在此基础上,数据整理通过严格审核(如逻辑矛盾排查)、标准化分类编码(执行国家职业、教育等分类标准)、时空口径统一(如常住人口界定)及多源数据融合,最终构建关系型数据库与地理信息系统联动的动态人口数据平台。
人口普查(census)作为最全面、精密的人口调查方式,以周期性(改革开放后我国每10年一次)、全时域(标准时点冻结人口状态)和普遍性(覆盖所有自然人)为特征,其发展深刻体现技术进步:从手工纸质报表(1982年)到电子终端PDA采集(2010年),再到2020年第七次普查实现身份证实名登记、云计算72小时处理14亿级数据的突破,质量控制通过三阶段校验(登记差错率<1%、编码差错率<0.2%、逻辑审核)达到国际领先水平。中国实践以《全国人口普查条例》为法律保障,形成国务院至村级的六级联动机制,2020年创新应用的居住地空间定位技术使数据匹配度达99.98%。
3.1.3 人口统计分析
人口统计分析可以大体分为两大类:静态分析和动态分析。人口静态统计是根据人口静态指标对某一时点人口状态的统计分析。人口静态指标主要包括人口总量、性别、年龄、民族、受教育程度、职业等。
人口动态统计是根据人口动态指标对人口变动过程的统计分析。人口动态指标主要包括:出生、死亡、迁移、婚姻等。
例3.1 全国第七次人口普查基本结果(节选)14
(一)人口总量。全国人口15共141178万人,与2010年(第六次全国人口普查数据,下同)的133972万人相比,增加7206万人,增长5.38%,年平均增长率为0.53%,比2000年到2010年的年平均增长率0.57%下降0.04个百分点。数据表明,我国人口10年来继续保持低速增长态势。
(二)户别人口。全国共有家庭户49416万户,家庭户人口为129281万人;集体户2853万户,集体户人口为11897万人。平均每个家庭户的人口为2.62人,比2010年的3.10人减少0.48人。家庭户规模继续缩小,主要是受我国人口流动日趋频繁和住房条件改善年轻人婚后独立居住等因素的影响。
(三)人口地区分布。东部地区人口占39.93%,中部地区占25.83%,西部地区占27.12%,东北地区占6.98%。与2010年相比,东部地区人口所占比重上升2.15个百分点,中部地区下降0.79个百分点,西部地区上升0.22个百分点,东北地区下降1.20个百分点。人口向经济发达区域、城市群进一步集聚。
(四)性别构成。男性人口为72334万人,占51.24%;女性人口为68844万人,占48.76%。总人口性别比(以女性为100,男性对女性的比例)为105.07,与2010年基本持平,略有降低。出生人口性别比为111.3,较2010年下降6.8。我国人口的性别结构持续改善。
(五)年龄构成。0—14岁人口为25338万人,占17.95%;15—59岁人口为89438万人,占63.35%;60岁及以上人口为26402万人,占18.70%(其中,65岁及以上人口为19064万人,占13.50%)。与2010年相比,0—14岁、15—59岁、60岁及以上人口的比重分别上升1.35个百分点、下降6.79个百分点、上升5.44个百分点。我国少儿人口比重回升,生育政策调整取得了积极成效。同时,人口老龄化程度进一步加深,未来一段时期将持续面临人口长期均衡发展的压力。
(六)受教育程度人口。具有大学文化程度的人口为21836万人。与2010年相比,每10万人中具有大学文化程度的由8930人上升为15467人,15岁及以上人口的平均受教育年限由9.08年提高至9.91年,文盲率由4.08%下降为2.67%。受教育状况的持续改善反映了10年来我国大力发展高等教育以及扫除青壮年文盲等措施取得了积极成效,人口素质不断提高。
(七)城乡人口。居住在城镇的人口为90199万人,占63.89%;居住在乡村的人口为50979万人,占36.11%。与2010年相比,城镇人口增加23642万人,乡村人口减少16436万人,城镇人口比重上升14.21个百分点。随着我国新型工业化、信息化和农业现代化的深入发展和农业转移人口市民化政策落实落地,10年来我国新型城镇化进程稳步推进,城镇化建设取得了历史性成就。
(八)流动人口。人户分离人口为49276万人,其中,市辖区内人户分离人口为11694万人,流动人口为37582万人,其中,跨省流动人口为12484万人。与2010年相比,人户分离人口增长88.52%,市辖区内人户分离人口增长192.66%,流动人口增长69.73%。我国经济社会持续发展,为人口的迁移流动创造了条件,人口流动趋势更加明显,流动人口规模进一步扩大。
(九)民族人口。汉族人口为128631万人,占91.11%;各少数民族人口为12547万人,占8.89%。与2010年相比,汉族人口增长4.93%,各少数民族人口增长10.26%,少数民族人口比重上升0.40个百分点。民族人口稳步增长,充分体现了在中国共产党领导下,我国各民族全面发展进步的面貌。
3.2 生命表
3.2.1 概念与样式
通常在人口普查后,人口统计学家会对人口数据进行分析,编制出应用于不同场景的生命表(Life Table)。生命表是描述特定人群在特定时期内随年龄不断身故的全部过程的表格。它通过对人口死亡率、生存率等指标的统计分析,为社会保险和商业保险的健康发展决策提供了重要依据。
生命表的编制通常包括以下三个基本步骤:
- 数据收集:通过人口普查、出生死亡登记等方式收集相关数据。
- 数据整理:对收集到的数据进行清洗、分类和编码,确保数据的准确性和一致性。
- 计算死亡率:根据年龄段和性别等因素计算各年龄段的死亡率。
生命表通常分为两类:一是国民生命表(National Life Table),由国家统计局或相关机构编制,反映全国人口的平均寿命和死亡率等指标;二是经验生命表(Experience Life Table),由保险公司或其他机构根据特定人群的实际死亡数据编制,反映该人群的实际生存和死亡情况。
例3.2 全国分年龄、性别的死亡人口状况(2019.11.1-2020.10.31)节选
资料来源:第七次人口普查年鉴中16中的“全国分年龄、性别的死亡人口状况(2019.11.1-2020.10.31)”
图3.1: 全国分年龄、性别的死亡人口状况(2019.11.1-2020.10.31)
例3.3 《中国人身保险业经验生命表(2010-2013)》节选17:
| 年龄 | CL1 | CL2 | CL3 | CL4 | CL5 | CL6 |
|---|---|---|---|---|---|---|
| 0 | 0.000867 | 0.000620 | 0.000620 | 0.000455 | 0.000566 | 0.000453 |
| 1 | 0.000615 | 0.000456 | 0.000465 | 0.000324 | 0.000386 | 0.000289 |
| 2 | 0.000445 | 0.000337 | 0.000353 | 0.000236 | 0.000268 | 0.000184 |
| 3 | 0.000339 | 0.000256 | 0.000278 | 0.000180 | 0.000196 | 0.000124 |
| 4 | 0.000280 | 0.000203 | 0.000229 | 0.000149 | 0.000158 | 0.000095 |
| 5 | 0.000251 | 0.000170 | 0.000200 | 0.000131 | 0.000141 | 0.000084 |
| 6 | 0.000237 | 0.000149 | 0.000182 | 0.000119 | 0.000132 | 0.000078 |
| 7 | 0.000233 | 0.000137 | 0.000172 | 0.000110 | 0.000129 | 0.000074 |
| 8 | 0.000238 | 0.000133 | 0.000171 | 0.000105 | 0.000131 | 0.000072 |
| 9 | 0.000250 | 0.000136 | 0.000177 | 0.000103 | 0.000137 | 0.000072 |
| 10 | 0.000269 | 0.000145 | 0.000187 | 0.000103 | 0.000146 | 0.000074 |
| 11 | 0.000293 | 0.000157 | 0.000202 | 0.000105 | 0.000157 | 0.000077 |
| 12 | 0.000319 | 0.000172 | 0.000220 | 0.000109 | 0.000170 | 0.000080 |
| 13 | 0.000347 | 0.000189 | 0.000240 | 0.000115 | 0.000184 | 0.000085 |
| 14 | 0.000375 | 0.000206 | 0.000261 | 0.000121 | 0.000197 | 0.000090 |
| 15 | 0.000402 | 0.000221 | 0.000280 | 0.000128 | 0.000208 | 0.000095 |
| 16 | 0.000427 | 0.000234 | 0.000298 | 0.000135 | 0.000219 | 0.000100 |
| 17 | 0.000449 | 0.000245 | 0.000315 | 0.000141 | 0.000227 | 0.000105 |
| 18 | 0.000469 | 0.000255 | 0.000331 | 0.000149 | 0.000235 | 0.000110 |
| 19 | 0.000489 | 0.000262 | 0.000346 | 0.000156 | 0.000241 | 0.000115 |
| 20 | 0.000508 | 0.000269 | 0.000361 | 0.000163 | 0.000248 | 0.000120 |
| 21 | 0.000527 | 0.000274 | 0.000376 | 0.000170 | 0.000256 | 0.000125 |
| 22 | 0.000547 | 0.000279 | 0.000392 | 0.000178 | 0.000264 | 0.000129 |
| 23 | 0.000568 | 0.000284 | 0.000409 | 0.000185 | 0.000273 | 0.000134 |
| 24 | 0.000591 | 0.000289 | 0.000428 | 0.000192 | 0.000284 | 0.000139 |
| 25 | 0.000615 | 0.000294 | 0.000448 | 0.000200 | 0.000297 | 0.000144 |
其中:
- 表中年龄对应的数字为死亡率;
- CL1-CL6为不同性别和不同业务对应的各年龄死亡率
- CL1、CL2为非养老类业务一表
- CL3、CL4为非养老类业务二表
- CL5、CL6为养老类业务表
- CL1、CL3、CL5为男表,CL2、CL4、CL6为女表
3.2.2 基本函数
我们可以把生命表看作是关于\(x\)的特殊函数,通过这个生命表函数可以定量计算两个层面的具体数值:
- 生死人数:每个年龄对应的生存人数和死亡人数
- 生死概率:每个年龄对应的生存概率和死亡概率
因此,生命表常用的基本函数包括:
生命表的基本函数包括:
- 年龄
- \(x\):年龄(非负整数,向下取整的周岁)
- \(\omega\):最大年龄(在我国保险行业经验生命表中取105岁)
- \((x)\):年满\(x\)的人
- 生存人数
- \(l_0\):出生队列基数(通常假设为100、1000、10,000或1,000,000等)
- \(l_x\):年满 \(x\) 岁时的存活人数,满足递推关系 \(l_{x+1} = l_x - d_x\)
- 死亡人数
- \(d_x\):\(x\) 岁至 \(x+1\) 岁间死亡人数,\(d_x = l_x - l_{x+1}\)
- \({}_n d_x\):\(x\) 岁至 \(x+n\) 岁间死亡人数,\({}_n d_x = l_x - l_{x+n}\)
- 生存率
- \(p_x\):\(x\) 岁存活至 \(x+1\) 岁的概率,\(p_x = \frac{l_{x+1}}{l_x}\)
- \({}_n p_x\):\(x\) 岁存活至 \(x+n\) 岁的概率,\({}_n p_x = \frac{l_{x+n}}{l_x}\)
- 死亡率
- \(q_x\):\(x\) 岁至 \(x+1\) 岁间死亡概率,\(q_x = \frac{d_x}{l_x} = 1 - p_x\)
- \({}_n q_x\):\(x\) 岁至 \(x+n\) 岁间死亡概率,\({}_n q_x = 1 - {}_n p_x\)
- \({}_{m|n} q_x\):\(x\) 岁存活 \(m\) 年后,在接下来的 \(n\) 年内死亡的概率,\({}_{m|n} q_x = {}_m p_x \cdot {}_n q_{x+m}\)
- 衍生函数
- \(L_x\):\(x\) 岁至 \(x+1\) 岁间生存人年数(常近似为 \(L_x \approx \frac{l_x + l_{x+1}}{2}\))
- \(T_x\):\(x\) 岁及以上总生存人年数,\(T_x = \sum_{t=x}^{\omega} L_t\)
- \(e_x\):\(x\) 岁时的平均余命,\(e_x = \frac{T_x}{l_x}\)
- \(e_0\):\(0\) 岁时的平均余命,即预期寿命
综上,生命表中较为重要的数量关系如下:
- \(l_x\)与\(d_x\)
\[ \begin{aligned} d_x&=l_x-l_{x+1}\\ {}_n d_x&=l_x-l_{x+n}\\ l_0&=\sum_{t=0}^{\omega-1} d_t\\ l_x &= \sum_{t=x}^{\omega-1} d_t \end{aligned} \]
- \(l_x\)与\(p_x\)
\[ \begin{aligned} p_x&=\frac{l_{x+1}}{l_x}\\ {}_n p_x&=\frac{l_{x+n}}{l_x}=p_x \times p_{x+1} \times \cdots \times p_{x+n-1}\\ \end{aligned} \]
- \(l_x\)、\(d_x\)与\(q_x\)
\[ \begin{aligned} q_x&=\frac{l_x-l_{x+1}}{l_x}=\frac{d_x}{l_x}\\ {}_n q_x&=\frac{l_x-l_{x+n}}{l_x}=\frac{{}_n d_x}{l_x} \end{aligned} \]
那么\({}_{m|n}q_x\)得:
\[ \begin{aligned} {}_{m|n}q_x&=\frac{l_{x+m}-l_{x+m+n}}{l_{x}}\\ &=\frac{l_{x+m}-l_{x+m+n}}{l_{x+m}} \times \frac{l_{x+m}}{l_x} \\ &= {}_m p_x \times {}_n q_{x+m} \end{aligned} \]
特别地,当n=1时
\[{}_{m|}q_x={}_m p_x \times q_{x+m}\]
- \(L_x\)、\(T_x\)与\(e_x\)
\[ \begin{aligned} L_x&\approx \frac{l_x+l_{x+1}}{2}\\ &=l_{x+1}+\frac{d_x}{2}\\ &=l_{x}-\frac{d_x}{2}\\ T_x&=\sum_{t=x}^{\omega-1} L_t\\ &\approx\sum_{t=x}^{\omega-1} \left(l_{t}-\frac{d_t}{2}\right)\\ &=\sum_{t=x}^{\omega-1} l_t - \frac{l_x}{2}\\ \end{aligned} \]
特别地,当x=0时
\[ \begin{aligned} \because T_0&=\sum_{t=0}^{\omega-1} L_t\approx\sum_{t=0}^{\omega-1} l_t - \frac{l_0}{2}\\ \\ \therefore e_0&=\frac{T_0}{l_0}\approx\sum_{t=0}^{\omega-1} \frac{l_t}{l_0} - 0.5 \end{aligned} \]
3.2.3 基于生命表的生命概率计算
由于生命表较长,假设一个较为简单的生命表。
例3.4 生命表样例
某野生哺乳动物生命表如下:
| 年龄\(x\) | 生存数\(l_x\) |
|---|---|
| 0 | 100 |
| 1 | 90 |
| 2 | 75 |
| 3 | 40 |
| 4 | 20 |
| 5 | 0 |
计算:
- 每个年龄对应的死亡数\(d_x\)、死亡率\(q_x\)、生存率\(p_x\)、生存动物年数\(L_x\)以及总生存动物年数\(T_x\)。
- 每个年龄对应的平均余命\(e_x\)。
- \({}_2d_1\)、\({}_2p_1\)、\({}_{1|2}q_0\)。
解:
根据题意,使用R语言构建一个较为完整的生命表,具体如下:
x<-0:5#导入年龄
lx<-c(100, 90, 75, 40, 20, 0)#导入生存数
dx<-c(-diff(lx)) # 计算死亡数
qx<-dx/lx[1:5] # 计算死亡率
px<-1-qx # 计算生存率
Lx<-c((lx[1:5]+lx[2:6])/2) # 计算生存动物年数
Tx<-c()
for(i in 1:5) Tx[i]<-sum(Lx[i:5]) # 计算总生存动物年数
ex<-Tx/lx[1:5] # 计算平均余命
lt<-data.frame(x=x[1:5],lx=lx[1:5],dx,qx,px,Lx,Tx,ex)
knitr::kable(lt, caption="生命表样例计算结果")| x | lx | dx | qx | px | Lx | Tx | ex |
|---|---|---|---|---|---|---|---|
| 0 | 100 | 10 | 0.1000000 | 0.9000000 | 95.0 | 275.0 | 2.75 |
| 1 | 90 | 15 | 0.1666667 | 0.8333333 | 82.5 | 180.0 | 2.00 |
| 2 | 75 | 35 | 0.4666667 | 0.5333333 | 57.5 | 97.5 | 1.30 |
| 3 | 40 | 20 | 0.5000000 | 0.5000000 | 30.0 | 40.0 | 1.00 |
| 4 | 20 | 20 | 1.0000000 | 0.0000000 | 10.0 | 10.0 | 0.50 |
接下来计算 \({}_2d_1\)、\({}_2p_1\)、\({}_{1|2}q_0\):
\[{}_2d_1=l_1-l_3=90-40=50\]
\[{}_2p_1=\frac{l_3}{l_1}=\frac{40}{90}\approx 44.44\%\]
\[{}_{1|2}q_0=\frac{l_1-l_3}{l_0}=\frac{90-40}{100}=50\%\]
3.3 生命函数
3.3.1 新生儿生存函数
基于生命表的计算可以发现,当年龄\(x\)不取整数时,生存数\(l_x\)、死亡数\(d_x\)、死亡率\(q_x\)、生存率\(p_x\)等都难以直接计算。换言之,当生存年龄为连续随机变量时,需要引入生存函数(Survival Function)。
本节以新生儿为切入点,假设新生儿的寿命为随机变量\(X\),,且具有分布函数和密度函数,那么:
\(X\):新生儿的寿命(连续随机变量)
\(F_X (x)\):\(X\)的分布函数,\(F_X (x)=Pr(X\leq x)\)
\(f_X (x)\):\(X\)的密度函数,\(f_X (x)=F'_X (x)\)
同时引入生存函数,定义为:
\(s (x)\):\(X\)的生存函数
\[ s(x)=1-F_X (x)=Pr(X > x) \tag{3.1} \]
图3.2: 新生儿生存函数示意图
可以发现生存年龄的分布函数、密度函数以及生存函数之间具有如下性质:
\[ \begin{aligned} f_X (x)&=F'_X (x)\geq 0\\ s'(x)&=-f_X (x)\leq 0\\ \end{aligned} \]
结合生命表的定义,又可以发现
\[ \begin{aligned} \because s(x)&=Pr(X>x)={}_x p_0=\frac{l_x}{l_0}\\ \therefore l_x&=l_0 \times s(x) \end{aligned} \tag{3.2} \]
根据(3.2),可以推导出以下公式:
\[ \begin{aligned} l_x&= l_0\times s(x)\\ d_x&=l_x -l_{x+1}=l_0 \times \left[s(x)-s(x+1)\right]\\ {}_nd_x&=l_x -l_{x+n}=l_0 \times \left[s(x)-s(x+n)\right] \end{aligned} \]
显然,\(s(x)\)与\(q_x\)、\(p_x\)之间的关系为:
\[ \begin{aligned} p_x&=\frac{l_{x+1}}{l_x}\\ &=\frac{s(x+1)}{s(x)}\\ \\ q_x&=\frac{d_x}{l_x}\\ &=\frac{l_0 \times \left[s(x)-s(x+1)\right]}{l_0\times s(x)}\\ &=1- \frac{s(x+1)}{s(x)}\\ \end{aligned} \]
同理:
\[ \begin{aligned} {}_np_x&=\frac{l_{x+n}}{l_x}=\frac{s(x+n)}{s(x)}\\ {}_nq_x&=1-{}_np_x=1-\frac{s(x+n)}{s(x)} \end{aligned} \]
3.3.2 (x)余命函数
在保险业务中,被保险人在购买保险时往往已经活到了x岁,因此保险公司更关注被保险人在x岁后还可以生存多少年,这时就需要引入剩余寿命或余命函数。为了简便起见,定义如下变量:
\((x)\):年满\(x\)岁的人,通常\(x\geq 0\)
\(T_{(x)}\):剩余寿命(简称“余寿”或“余命”),即(x)存活的年数,显然\(T_{(x)}\)是一个非负的连续随机变量。
\(G_T (t)\):剩余寿命的分布函数
\[ \begin{aligned} G_T (t)&=Pr(T_{(x)}\leq t)\\ &=Pr(X\leq x+t|X>x)\\ &=\frac{s(x)-s(x+t)}{s(x)}\\ &={}_t q_{x}\\ &=1-{}_t p_{x} \end{aligned} \tag{3.3} \]
当\(x=0\)时,\(G_T (t)\)即为新生儿的生存函数。
在考虑(x)剩余寿命时,隐含着这个人已经年满x岁的条件。此时,\({}_t q_x\)实际上是一个条件概率:
\[ \begin{aligned} {}_t q_x&=Pr(T_{(x)}\leq t|X>x)\\ &=Pr(X\leq x+t|X>x)\\ &=\frac{F_X(x+t)-F_X(x)}{F_X(X>x)}\\ &=\frac{s(x)-s(x+t)}{s(x)} \end{aligned} \]
(x)在\(x+m \sim x+m+n\)的死亡概率\({}_{m|n}q_x\),则可以表示为
\[ \begin{aligned} {}_{m|n}q_x&=Pr(n\leq T_{(x)}\leq m+n)\\ &=Pr(x+n \leq X\leq x+m+n|X>x)\\ &=\frac{s(x+m)-s(x+m+n)}{s(x)}\\ &={}_m p_x \times {}_n q_{x+m}\\ &={}_m p_x -{}_{m+n} p_x\\ &={}_{m+n} q_x - {}_{m} q_x \end{aligned} \]
3.3.3 死亡力
死亡力(force of mortality,简称“死力”)是描述瞬间死亡水平的指标,其定义为
\[ \begin{aligned} \mu_x&=\lim_{\Delta x \to 0} \frac{s(x+\Delta x)-s(x)}{\Delta x \times s(x)}\\ &=-\frac{s'(x)}{s(x)}\\ &=-\left[\ln{s(x)}\right]' \end{aligned} \tag{3.4} \]
式(3.4)的经济含义可以理解为,年满\(x\)岁的人在未来极短时间内身故所对应的年化死亡率。
随着年龄变化,死亡力示意如下:
图3.3: 死亡力示意图(以中国寿险经验生命表CL1为例)
接下来我们讨论死力的数学性质:
假设\(\mu_x\)已知,对(3.4)两边同时积分可得:
\[ s(x)=e^{-\int_0^x \mu_t dt} \]
对(3.4)两边从x到x+n积分可得:
\[ \begin{aligned} \int_x^{x+n} \mu_t dt &=-\int_x^{x+n}\frac{s'(t)}{s(t)}dt\\ &=-\ln{s(t)}|_x^{x+n}\\ &=-\ln{\frac{s(x+n)}{s(x)}}\\ &=-\ln{{}_n p_x} \end{aligned} \]
继续整理上式可得:
\[ \begin{aligned} {}_n p_x&= e^{-\int_x^{x+n}\mu_t dt}\\ &= e^{-\int_0^n \mu_{x+s} ds} \end{aligned} \]
更为重要的是,在已知死力\(\mu_x\)的条件下,我们可以对(3.3)求导,得到\(g_T (t)\),即剩余寿命\(T_{(x)}\)的密度函数。
\[ \begin{aligned} g_T (t)&=G'_T (t)\\ &=\frac{d}{dt} {}_t q_x\\ &=\frac{d}{dt} \left[ 1-\frac{s(x+t)}{s(x)} \right]\\ &=-\frac{s(x+t)}{s(x)}\times \frac{s'(x+t)}{s(x+t)}\\ &={}_t p_x\times \mu_{x+t} \end{aligned} \tag{3.5} \]
我们对(3.5)简单整理可得:
\[ d({}_t q_x)={}_t p_x\times \mu_{x+t} dt \tag{3.6} \]
对式(3.6)两边从0到n积分可得:
\[ {}_n q_x=\int_0^n {}_t p_x \times \mu_{x+t} dt \]
同理
\[ \begin{aligned} {}_{m|n}q_x&={}_{m+n} q_x - {}_{m} q_x\\ &=\int_0^{m+n} {}_t p_x \times \mu_{x+t} dt - \int_0^m {}_t p_x \times \mu_{x+t} dt\\ &=\int_m^{m+n} {}_t p_x \times \mu_{x+t} dt\\ \end{aligned} \]
例3.5 已知新生儿寿命的分布函数为\(F_X(t)=1-e^{-\lambda t}\),其中\(\lambda>0\)。计算死力函数\(\mu_x\)。
解:
根据分布函数\(F_X(t)\),可以得到
- 生存函数\(s(x)=1-F_X(t)=e^{-\lambda t}\)
- 密度函数\(f_X(t)=F'_X(t)=-s'(x)=\lambda e^{-\lambda t}\)
因此
\[ \mu_x=-\frac{s'(x)}{s(x)}=\frac{\lambda e^{-\lambda x}}{e^{-\lambda x}}=\lambda \]
3.3.4 取整余命及其分布函数
在寿险精算中,通常需要将连续的余命函数取整为整数年数,这时可以定义取整余命:
- \(K_{(x)}\): \(T_{(x)}\)的整数部分,即对\(T_{(x)}\)向下取整
- \(S_{(x)}\): \(T_{(x)}\)的小数部分,\(0\leq S_{(x)} < 1\)
- 显然\(T_{(x)} =K_{(x)} + S_{(x)}\)
根据(3.3),可以得到取整余命的分布函数:
\[ \begin{aligned} Pr(K_{(x)}= k)&=Pr(k\leq T_{(x)} \leq k+1)\\ &={}_k p_x\times q_{x+k}\\ &=\frac{s(x+k)-s(x+k+1)}{s(x)} \end{aligned} \tag{3.7} \]
3.4 非整数年龄生存函数
生命表是以整数年龄分组编制的,但在实践中常常需要非整数年龄的生存函数。例如,(40)继续存活半年的概率\({}_{0.5}p_{40}\),(65)在未来三个月身故的概率\({}_{0.25}q_{65}\)等。这时就需要在一定假设的基础上,利用生命表进行合理估计。对于非整数年龄的生存函数,通常有以下三种假设:
- 死亡均匀分布(Uniform Distribution of Deaths, UDD)
- 死力恒定(Constant Force of Mortality)
- 巴尔杜奇(Balducci)
3.4.1 死亡均匀分布(UDD)
死亡均匀分布(Uniform Distribution of Deaths, UDD)假设在每个年龄段内,死亡人数是均匀分布的。例如,在x年龄段内,死亡人数为\(d_x\),那么每季度死亡人数就是\(\frac{d_x}{4}\),每个月的死亡人数是\(\frac{d_x}{12}\),其他时间以此类推。
在\(x\sim x+1\)之间任取一个时间点\(t\)(\(0\leq t <1\)),那么
\[l_{x+t}=l_x- t\times d_x\]
将上式两边同时除以\(l_0\),并带入\(d_x=l_x-l_{x+1}\)可得
\[ s(x+t)=(1-t)\times s(x)+t\times s(x+1) \tag{3.8} \]
根据(3.8),可以得到如下推论:
\[{}_t q_x=\frac{s(x)-s(x+t)}{s(x)}=t\times q_x\]
\[{}_t q_{x+y}=\frac{s(x+y)-s(x+y+t)}{s(x+y)}=\frac{t\times q_x}{1-y\times q_x}\]
其中:
\[ \begin{aligned} 0\leq &t< 1\\ 0\leq &y< 1\\ 0\leq &t+y< 1 \end{aligned} \]
\[ \begin{aligned} \mu_{x+t}&=\frac{s'(x+t)}{s(x+t)}\\ &=\frac{s(x)-s(x+1)}{s(x)-t\left[s(x)-s(x+t)\right]}\\ &=\frac{q_x}{1-t\times q_x} \end{aligned} \]
3.4.2 死力恒定
假设死力在\(x\sim x+1\)之间是恒定的,即\(\mu_{x+t}=\mu\),其中x为整数,\(0\leq t \leq 1\)。
根据(3.5),可以得到:
\[ \begin{aligned} \because g(t)&=\frac{d}{dt} {}_t q_x\\ &=-\frac{d}{dt} {}_t p_x\\ &= {}_t p_x \times \mu_{x+t}\\ \therefore \mu_{x+t}&=-\frac{\left({}_t p_x\right)'}{{}_t p_x}\\ &=-\frac{d}{dt} \left(\ln{{}_t p_x}\right) \end{aligned} \tag{3.9} \]
对(3.9)两边从0到t积分可得:
\[ \begin{aligned} &{}_t p_x=e^{-\int_0^t \mu_{x+s} ds}\\ &\because \mu_{x+s}=\mu\\ &\therefore {}_t p_x=e^{-\mu t} \end{aligned} \]
显然,
\[ \begin{aligned} p_x&= e^{-\mu}\\ q_x&=1-e^{-\mu}\\ {}_t p_x&=e^{-\mu t}=(p_x)^t \end{aligned} \]
同样地,计算\({}_t p_{x+y}\)
\[ \begin{aligned} {}_t p_{x+y}&=\frac{s(x+y+t)}{s(x+y)}\\ &=\frac{s(x+y+t)/s(x)}{s(x+y)/s(x)}\\ &=\frac{{}_{y+t}p_x}{{}_y p_x}\\ &=\frac{(p_x)^{y+t}}{(p_x)^y}\\ &=(p_x)^t\\ &=e^{-\mu t} \end{aligned} \]
3.4.3 巴尔杜奇(Balducci)
该假设以意大利精算师巴尔杜奇(Balducci)命名,这一假设是当x为整数、\(0\leq t \leq 1\)时,生存函数的倒数是t的线性函数,即
\[ \frac{1}{s(x+t)}=\frac{1-t}{s(x)}+\frac{t}{s(x+1)} \]
例3.6 巴尔杜奇假设的生存函数示例
令s(0)=1、s(1)=0.5,则巴尔杜奇假设下的生存函数为:
\[ \begin{aligned} \because \frac{1}{s(t)}&=\frac{1-t}{1}+\frac{t}{0.5}\\ \therefore \frac{1}{s(t)}&=1+t\\ s(t)&=\frac{1}{1+t} \end{aligned} \]
小数年龄上的生存函数如下图所示:
图3.4: 巴尔杜奇假设生存函数示意图
根据巴尔杜奇假设,不加证明地给出下列生命概率:
\[ \begin{aligned} {}_t q_x&=\frac{t\times q_x}{1-(1-t)q_x}\\ {}_t p_x&=\frac{p_x}{1-(1-t)q_x}\\ {}_t q_{x+y}&=\frac{t\times q_x}{1-(1-y-t)q_x}\\ \mu_{x+t}&=\frac{q_x}{1-(1-t)q_x} \end{aligned} \]
3.4.4 非整数年龄生命函数
在上述三种假设下,分别计算非整数年龄的死亡率\({}_t q_x\)、生存率\({}_t p_x\)、死亡力\(\mu_{x+t}\)以及非整数年龄内的死亡率\({}_t q_{x+y}\),以及\({}_t p_x \times \mu_{x+t}\)分别为:
| 假设类型 | \(s(x+t)\) | \({}_t q_x\) | \({}_t p_x\) | \(\mu_{x+t}\) | \({}_t q_{x+y}\) | \({}_t p_x \times \mu_{x+t}\) |
|---|---|---|---|---|---|---|
| UDD | \((1-t)s(x)+\\t\times s(x+1)\) | \(t \times q_x\) | \(1-t \times q_x\) | \(\frac{q_x}{1-t\times q_x}\) | \(\frac{t \times q_x}{1-(1-y)q_x}\) | \(q_x\) |
| 恒定死力 | \(s(x)\times e^{-\mu t}\) | \(1- e^{-\mu t}\) | \(e^{-\mu t}\) | \(\mu\) | \(1-e^{-\mu t}\) | \(\mu \times e^{-\mu t}\) |
| 巴尔杜奇 | \(\frac{1}{\frac{1-t}{s(x)}+\frac{t}{s(x+1)}}\) | \(\frac{t \times q_x}{1-(1-t)q_x}\) | \(\frac{p_x}{1-(1-t)q_x}\) | \(\frac{q_x}{1-(1-t)q_x}\) | \(\frac{t \times q_x}{1-(1-y-t)q_x}\) | \(\frac{p_x \times q_x}{\left[1-(1-t)q_x\right]^2}\) |
例3.7 三种假设下非整数年龄\(s(x+t)\)和\({}_t q_x\)的计算
令\(s(0)=1\)、\(s(1)=0.5\),则三种假设下非整数年龄的生存函数、死亡率和死亡力分别为:
| 假设类型 | \(s(x+t)\) | \({}_t q_x\) | \(\mu_{x+t}\) |
|---|---|---|---|
| UDD | \(1- 0.5 \times t\) | \(0.5\times t\) | \(\frac{1}{2-t}\) |
| 恒定死力18 | \(e^{-0.693 t}\) | \(1-e^{-0.693 t}\) | \(0.693\) |
| 巴尔杜奇 | \(\frac{1}{1-0.5t}\) | \(\frac{t}{1+t}\) | \(\frac{1}{1+t}\) |
将上表作图可得:
图3.5: 三种假设下生存函数s(x+t)示意
图3.6: 三种假设下死亡率qxt示意
图3.7: 三种假设下死亡力示意
本章小结
生命表是以离散形式表示一批人存活和死亡规律的一种表格函数,基本函数如下:
- 年龄:年龄\(x\)、终极年龄\(\omega\)、年满x岁的人\((x)\)
- 生存人数:\(l_0\)、\(l_x\)
- 死亡人数:\(d_x\)、\({}_n d_x\)
- 生存率:\(p_x\)、\({}_n p_x\)
- 死亡率:\(q_x\)、\({}_n q_x\)
- 衍生函数:\(L_x\)、\(T_x\)、\(e_x\)
生命函数则是在生命表的基础上,引入了生存函数\(s(x)\)、剩余寿命\(T_{(x)}\)、取整余命\(K_{(x)}\),特别是死亡力\(\mu_{x+t}\),形成的连续性函数,主要函数如下:
- 新生儿生存函数\(s(x)=\frac{l_x}{l_0}\)
- 剩余寿命分布函数\(G_T (t)={}_t q_x\)
- 取整余命分布函数\(K_{(x)}={}_{k|} q_x\)
- 死亡力\(\mu_{x+t}=\frac{s'(x+t)}{s(x+t)}\)
非整数年龄的生命函数可以通过三种假设进行估计:
- 死亡均匀分布(UDD)
- 死力恒定
- 巴尔杜奇(Balducci)
课后习题
- 已知:\(q_{80}=0.07\),\(d_{80}=3129\)。求\(l_{81}\)。
- 设某同龄人群的初始人数为3000人,10年内的死亡人数为240人,第11、12年的死亡人数分别为15人和18人。求该同龄人群在第11、12年的死亡率和生存率。
- 试证明:
- \({}_{m|n} q_x = {}_m p_x - {}_{m+n}p_x\)
- \({}_{n|}q_x = {}_n p_x \times q_{x+n}\)
- \({}_{m+n}p_x = {}_n p_x \times {}_m p_{x+n}\)
- 已知\(l_x=1000\times \left(1-\frac{x}{120}\right)\),计算下列各值:
- \(l_0\)、\(d_{60}\)、\(q_{60}\)、\(p_{60}\)
- 预期寿命\(e_0\)
- (25)至少活20年、最多活25年的概率
- 三个(30)没有一个人能活到80岁的概率
- 设某人群的生存函数为\(s(x)=e^{-\lambda x}\),其中\(\lambda=0.01\),计算:
- (30)死亡率\(q_{30}\)、生存率\(p_{30}\)、死亡力\(\mu_{30}\)
- 验证:期望寿命\(e_0=\int_0^{\infty}s(x)dx\)
- 设\(l_{60}=100\)、\(l_{61}=80\),分别在UDD、恒定死力和巴尔杜奇假设下计算\(l_{60.3}\)。