期刊大全 杂志订阅 SCI期刊 SCI发表 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 人口统计学变量分析

人口统计学变量分析精品(七篇)

时间:2023-07-05 16:12:19

人口统计学变量分析

人口统计学变量分析篇(1)

关键词 国有石油企业 员工敬业度 人口统计学变量 差异分析

一、员工敬业度的概念

目前对敬业度(Engagement)的概念都没有一个统计的界定,主要有两个领域对其进行研究:管理公司和学术界。管理公司主要以实际出发对其进行实证研究,学术界则是从学术角度提出相关的理论。

第一,在管理公司领域,盖洛普公司的盖洛普博士将敬业度定义为:企业首先要为员工创造良好的环境使其优势能得到有效发挥,在此基础上,企业还应让员工在组织中有一种归属感,让其感受到自己就是组织的一员,具有主人翁的责任感。盖洛普公司将员工主要分为敬业、守业和怠工员工三类,这主要是根据员工在情感上认同工作和组织的程度,以及由此而带来的员工对工作和组织的投入度;翰威特公司认为敬业度是用来衡量员工期望留在公司的程度,以及对工作尽心的程度,据此翰威特公司提出了积极评价、渴望留任和竭尽所能三维度的敬业度。韬睿公司将敬业度定义为员工意愿和努力帮助组织取得成功的程度,据此公司将员工敬业度分为理性敬业度和感性敬业度两个维度,即建立在工作给自己带来利益前提下的敬业行为和建立在对工作认同和情感归属上的敬业行为。

第二,在学术研究中,国内外学者中, Kahn将敬业度定义为:企业员工自发地控制自己,以将自己与工作角色结合在一起,也就是将自己置于一种“角色内状态”,并且他还将敬业度分为三个维度:行为敬业度、认知敬业度和情感敬业度;Maslach等学者则从工作倦怠的对立角度出发将敬业度定义为对工作积极的一面,他认为敬业度和工作倦怠分别为一个三维连续体的两极,敬业度的精力、投入和职业效能感三个维度分别对应着工作倦怠的情绪枯竭、犬儒主义和效能感低落三个维度。相对于工作倦怠程度高的员工所具有的无能感和耗竭感,敬业度高的员工通常精力充沛,不同于在工作和组织中处于疏离状态的员工,他们在工作中具有较高的自我效能感,能在组织中建立良好的人际关系,并能有效进入工作状态; Schaufeli等人与Maslach有相同的观点,认为敬业度是工作倦怠的对立面,而他们认为敬业度包含活力敬业度、奉献敬业度和投入敬业度三个维度。

综上,本文所使用的敬业度概念为:企业中员工在工作角色中自我表达和自我投入的程度,以及员工在行为、认知和情感三个维度上对工作、组织的认同程度。

二、国有石油企业员工敬业度在人口统计学变量上的差异分析

(一)不同性别的国有石油企业员工敬业度的差异分析

对不同性别的国有石油企业员工的工作敬业度和组织敬业度两个维度以及整体员工敬业度的得分平均数进行F检验和t检验,所得结果如表1所示。

(二)不同婚姻状况的国有石油企业员工敬I度的差异分析

对不同婚姻状况的国有石油企业员工的工作敬业度和组织敬业度两个维度以及整体员工敬业度的得分平均数进行F检验和t检验,所得结果如表2所示。

(三)不同年龄的国有石油企业员工敬业度的差异分析

本文将国有石油企业的员工划分为四个年龄段,采用单因素方差分析方法分析不同年龄段的国有石油企业员工在敬业度各子纬度上的得分。如表3所示。

(四)不同学历的国有石油企业员工敬业度的差异分析

采用单因素方差分析方法分析不同年龄段的国有石油企业员工在敬业度各子纬度上的得分,如表4所示。

(五)不同工龄的国有石油企业员工敬业度的差异分析

不同工龄的国有石油企业员工敬业度的差异分析(如表5)。

三、国有石油企业员工敬业度在人口统计学变量上的差异

在以上人口统计学变量中,只有员工婚姻状况对国有石油企业员工的敬业度有较大影响,而石油企业员工敬业度在不同性别、不同年龄段、不同学历、不同工龄上均无显著差异。这与已有的研究结论有相同之处,但并不完全一致,其原因是受研究对象,国有石油企业这个群体的特殊性的影响。

不同婚姻状况的国有石油企业员工的工作敬业度无明显差异,但在组织敬业度这一维度上以及整体员工敬业度上的差异却很显著;石油企业的已婚员工不论是工作敬业度、组织敬业度还是整体敬业度都高于未婚员工,究其原因,已婚员工其家庭生活相对稳定,亲戚朋友等人际圈子范围也相对固定,对家庭承担责任也更大,他们对于工作稳定性的要求更高,同时已婚员工较未婚员工年龄大,各方面相对成熟,更有自己明确的目标和认识,工作积累和经验都相对较好,对企业更有归属和认同感。

(李季单位为兰州工业学院经济管理学院;高海燕单位为中石油西北化工销售公司)

[作者简介:李季(1983―),男,辽宁开原人,博士,工程师,研究方向:企业管理及人力资源管理。]

参考文献

[1] Heaney C A,Israel B A,House J S . Chronic job insecurity among automobile workers:effectson job satisfaction and health[J]. Social Scienee & Medicine,1994.

[2] Davy J A,Kinicki A J,Scheck C L . A test of job seccurity,s direct and mediated effects on withdrawal cognitions[J]. Journal of organizational Behavior,1997.

[3] Greenhalgh L,Rosenblatt Z . Job security:toward conceptual clarity[J]. Academy of Management Review,1984,9(3).

人口统计学变量分析篇(2)

1个案与群体

〔实例1〕某调查报告称,某村2001年出生婴儿10人,其中男婴6人,女婴4人,出生性别比高达150,严重失调。

〔实例2〕某乡给某村下达人口计划,其中一项指标是计划生育率,要求当年的计划生育率不低于95%,而该村一般每年出生不足20人。

〔实例3]某地计生委根据群众举报,查出某县一个超生5胎的情况,据此称该县超生问题严重。

〔实例4〕某县总人口不足50万人,近年来在孕妇中推广服用“福施福”。上级要求检查服用“福施福”后,人口缺陷发生率是否逐年下降。还有不少地方把孕产妇死亡率是否逐年下降当作生殖健康服务工作的考核内容。

这几个例子所出现的问题都是以个案或少量发生的情况,说明一个地方宏观的情况。人口和计划生育统计所分析的对象(人口)或事例具有群体性,这个群体是由每个个体的人或事件集合而成。每个个体是否发现这种现象是偶然的,作为表现群体规律的统计数据,只有当群体具有相当的规模后才有意义。群体的规模太小,尽管对每个个体的统计是准确的,指标的计算也是正确的,但计算结果并不能客观地反映群体的规律。

如实例1,一个村的出生人数仅为10人,计算的出生性别比要么是100(“绝对平衡”),要么就是男女比例严重失调。实例2中计划生育率受出生总数的影响,要么计生率正好100%,只要有一个计划外出生,计划生育率就低于95%。例4涉及的出生缺陷发生率或孕产妇死亡率一般统计时均以10万作为分母,对于一个县,每年出生几千人或1万多人,即使按照出生缺陷、孕产妇死亡发生的平均水平,每年也只有几例,偶然性很大,在统计数据上很难表现为逐年下降。至于例3,以一个特例说明全县的情况,更是欠妥。各种人口和计划生育统计教材上并未说明各项统计指标适用的人群至少要达到多少,但一般说来这些统计指标绝大部分不能用于分析规模在几百人到一千多人的村级情况,许多指标在县、乡级使用也不太合适。多年来各级是通过报表收集人口和计划生育统计数据。报表由上级制发,基层单位按统一的口径填报每个项目,然后逐级汇总、上报。这样以来,上、下级的报表式样相同,只是数量大小有差别,于是,上级单位计算哪些指标,下级单位“照葫芦画瓢”计算相同指标。特别是实行人口与计划生育目标管理责任制后,各项工作任务和责任要逐级分解、落实,相应地,工作指标也被层层分解,上一级控制的指标(如出生率、计划生育率)也被一直套用到基层单位。在这种情况下,群体性的要求很容易被忽视。

2自然属性与社会属性

〔实例5〕1995年8月,在全国上半年人口形势分析会上,某省计生委分析本省当年上半年二孩出生数量比上一年同期减少的原因时称,由于自当年起全省广泛推行“三结合”,许多群众为了发家致富,主动退出二孩指标,于是二孩出生明显减少。笔者的同事立即对此理由提出了置疑:既然是主动退出二孩指标导致二孩出生减少,那么原来应在1995年上半年生育二孩的妇女至少在1994年上半年就应退出二孩指标,而那时候,该省并未开展计划生育“三结合”;至于1995年上半年开展“三结合”后退出的二孩指标,其二孩出生减少的效果应在1996年以后才能表现出来。群众退出二孩指标与二孩出生数量的减少在时间上出现了“矛盾”。

〔实例6〕许多文章分析妇女受教育程度越高,生育的孩子越少。

这两个例子说明分析人口出生数量的变化应考虑人口的自然属性和社会属性。人口首先是生物意义上的人口,具有自然属性,同时,人口生活、存在于一定的社会环境中,具有社会属性。人口现象的发生既受自然属性的影响,也受社会属性的影响。从根本上说,社会属性对人口现象的影响和制约是有条件的、间接的。而自然属性的影响和制约是无条件的、直接的。社会属性的影响和制约常常要通过自然属性来实现。在分析人口现象的时候,首先要解释人口的自然属性,然后再解释社会属性。就实例5而言,从妇女退出二孩指标到二孩出生减少,至少间隔10个月,即妇女的怀孕期,无论推行“三结合”力度多大,妇女10个月的怀孕期不能缩短。退指标的发生与出生数的减少在时间上不“同步”,至少要“滞后”一年。也就是说,1995年上半年因开展“三结合”妇女退出二孩生育指标不会影响这个时期的二孩出生数量。关于实例6,一个人的受教育程度属于社会属性,妇女受教育水平提高,的确会影响其生育行为。然而,影响生育的自然因素,直接因素是避孕节育行为,具体地说,影响生育的生物因素包括推迟结婚(不发生)、采取避孕措施和流产(终止妊娠)。妇女文化程度影响到上述生物因素发生变化(如文化程度高,能够更好地掌握避孕知识,可以提高避孕的有效性,减少怀孕的可能),并通过上述因素影响生育孩子的数量。直接讲文化程度与孩子数量的关系,未免有些牵强。

3定量与定性

〔实例7〕各地每年都要分析当年的人口形势,将当年的数据与上一年的数据进行对比。许多分析报告在列举了对比数据后得出结论:“今年的工作比上一年有明显的进步,取得了巨大的成绩,上了一个新台阶”。但如果我们仔细察看各项指标的数量,发现变化并不大,如计划生育率由88.5%上升到89%,出生率由15.4‰下降为14.9‰(这其中由于人口年龄结构的变化也能导致出生率下降),多孩出生由165人减少为149人,多孩率由2.2%下降为2%等等。根据这些数据的变化,得出的定性结论应当是:“工作稳步发展,人口增长保持平稳的态势”。人口和计划生育的统计分析主要是指对数据的分析,并由“定量”的描述引申到定性的判断。如果忽视定性的分析,那么,所谓定量分析不过是数量变化的文字描述而已。把握好定性分析的关键在于,定性分析应以定量分析为基础,即“定量”在前,“定性”在后。那种先“定性”,再计算数量变化的做法,违背了“定量”与“定性”的基本规律。这样进行的定量分析,只是给定性的结论加一些数量的点缀。

4模糊和精确

〔实例8〕某地区的一份材料称,根据20年来每年总和生育率的变化,推算本地区20年来少生了1831275人。

〔实例9〕某县计生委利用农村赶集日人口比较集中的机会,出动服务车,设置咨询台,向群众宣传计划生育知识,提供咨询服务。县计生委的汇报材料称,“一个月来在集日上接受宣传、咨询的群众累计达到127328人次”。

乍一看,实例8和实例9中的人数和人次数的统计和计算十分认真仔细,数字如此精确,令人钦佩。但转念一想,不免生疑:实例8中利用总和生育率计算少生人口,需要以年龄别生育率与分年龄妇女人数相乘计算出生人数,一般来看,每个年龄组的计算结果都不会是整数,只好四舍五入。每一年若干个年龄组累计下来,个位数已经含糊不清了。再把20年的少生人数累计起来,怎么可能精确到个位数呢?况且20年间,该地区的人口并非处于“封闭状态”,各年龄组人数因为人口迁移而变化,也会影响到计算少生的数量。至于实例9,在一个开放的、人们频繁走动的集市上,如何判定哪个人接受了宣传,哪个人接受了咨询,并没有一个客观的标准;即使有标准,实际操作中也很难把握,因此,根本没有可能逐人统计。实例8、实例9中看似精确的数据令人感到滑稽,倒不如模糊一些,说“20年大约少生了18万人”,“一个月在集市上接受了计划生育宣传、咨询服务的人次达10余万”,或许有几分可信。从某种意义上讲,人口和计划生育所涉及的是宏观层面的事情,与此相应的统计数据所反映的是大致的状态或趋势,没有必要也没有可能做到精确。许多同志在应用统计方法时,往往注意的是方法本身的定义和计算过程,而对计算中数据的来源不了解。人口和计划生育统计属于社会经济统计范畴,很多数据是通过抽样调查获得,允许有一定的误差;即使是全面的调查(如人口普查、全局报表),在实施过程中,也会遇到这样、那样的干扰或影响,存在着调查误差,这是无法完全避免的。从某种意义上讲,数据存在一定的误差,这是人口和计划生育统计的特点之一。

5原因与结果

〔实例10〕最典型的例子莫过于“人口出生率每降低1个千分点,人均GDP提高多少个百分点”的说法。这种说法的依据是利用相关分析法对全国各省的人口出生率和人均GDP的数量变化进行计算,得出二者之间的函数关系式和相关系数。把人口出生率作为自变量,看自变量的单位变化影响因变量(人均GDP)变化的数量大小。

在这个例子中相关分析法本身以及有关的数据都是正确的,然而,用这样一个函数式来解释人口增长与经济增长的相互关系是有问题的。其一,就统计方法来说,相关分析只反映变量之间的相关关系,而不说明因果关系;其二,人口增长与经济增长固然相互影响,但从本质上来说,是经济发展影响人们的思想,进而影响人们的生育行为,最终导致生育率下降,人口增长率降低,即经济增长是“因”,而人口增长是“果”。颠倒了因果关系,不仅逻辑上讲不通,数量上的“相关性”也失去了意义。

笔者在多年的工作中体会到,由于人口和计划生育所具有的特点,人口和计划生育统计分析方法的应用和统计数据的解释有别于其它部门和领域对于统计的一般要求。正确地应用统计分析有助于我们认识人口和计划生育的特点和规律,只有科学地认识和把握人口和计划生育的特点和规律,才能避免在统计分析中陷入误区。

社会科学实证研究中的统计分析方法应用

郑真真(北京大学人口研究所副教授)

统计学的应用随着微型计算机的普及越来越广泛,在社会科学实证研究中几乎是无处不在。有了一定规模的数据和一个统计分析软件,就可以很方便地进行各种估算和分析。然而由于统计分析方法本身并不像加减乘除那样简单,而一些统计分析软件已经发展到几乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情况下操作并得到结果,可能出现对统计分析方法误用或滥用的现象。本文仅对一些统计分析中比较常见的问题进行讨论,以引起各方面的重视。

1描述性统计

描述性统计是社会科学实证研究中最常用的方法。准确、全面、正确的描述是所有实证分析的基础,如果对某个事件或某种现象的描述不清楚或存在偏差,那么其后的所有分析都将是值得怀疑的。一项研究能够将所研究的现象或对象描述清楚,就是一个极大的贡献;而描述的偏差可能会引起公众或学术界对某些社会现象的误解,甚至误导政府决策。但是因为描述性统计所用方法简单易得,往往没有得到足够的重视。

均值的局限普遍用于描述样本集中趋势的测量之一是均值。它对于近似正态的对称分布样本来说是比较好的测量,对于不对称分布则不然,尤其会受到极端值的影响。两个分布完全不同的样本可能会有相同的均值,因此均值在某种程度上抹杀了样本内部的差异,而往往这种内部差异正是需要我们进行深入研究的、或应当引起人们注意的。为了弥补均值的这个缺陷,一般在报告均值的同时也报告方差,或用直方图/散点图的形式描述分布,以提请读者注意群体内部的差异。

不同群体的可比性在描述性统计中,往往涉及到对不同时期或不同人群的总体描述,以反映社会变化或地区差异。在社会科学中、尤其是人口研究中,不少事件的发生都是与年龄密切相关的,如我国妇女大部分在35岁以前完成了生育,从而导致35岁以上育龄妇女中极高的避孕现用率。在这种情况下,两个样本之间存在避孕现用率的差异可能只是年龄结构的差异,而不是年龄别避孕现用率的差异。又如在报告流动人口犯罪问题时,给人的印象往往是流动人口犯罪率高于常住人口,但忽视了流动人口的年龄和性别构成与常住人口完全不同,且青年男性是犯罪率较高的人群。这种对两个不同群体的比较往往会导致错误的结论。

绝对数的使用由于中国人口数量巨大,调查研究也比较容易得到大容量的样本,所以对任何小概率事件用绝对数报告都会出现惊人的巨大数字,单纯对绝对数的强调往往会产生戏剧性的效果。比较合理的方式一般是在报告某事件绝对数的同时,给出该事件的发生率或占研究人群的比例。

小样本的代表性在一次抽样的小样本中求得的率或比例会非常不稳定,与另一次抽样的结果可能会有较大差距。因此当研究仅限于从小样本获得的资料时,应当在报告比例的同时也报告样本量。

2双变量统计分析

在社会科学研究中,首先分析的往往是两个变量之间的关系,如用相关或列联表等方法。一般在确定两个变量之间确实有某种关系,如在经过统计检验后证实两变量有显著相关关系,进行更进一步的分析才有意义。因此,双变量统计分析在实证分析中占有重要地位。但是,由于在应用中对有些问题的忽视,双变量统计分析也很容易出现偏差或错误。

卡方检验的局限在利用列联表对两个定序/定类变量进行相关分析时,需要进行统计检验来判断两个变量的相关是否有统计上的显著意义。不少研究结果都用卡方检验的显著性报告相关状况。但值得注意的是,卡方统计量的计算本身是有局限性的,样本越大,卡方值就会相应增大,因此大样本的卡方检验很容易得到显著结果。所以一般在报告卡方检验结果以说明两变量是否显著相关时,还应当同时报告相关强度,即相应的相关系数,如Gamma,Lambda等。

统计意义上的显著与差别的实际意义在检验两个定距变量的均值差别是否具有统计上的显著性时,也存在相似的问题。由于样本量越大,样本均值分布的方差就越小,因此常用的t检验结果就越可能显著,任何细微的差别都可能有统计上的显著性。但有时具有统计意义显著性的差异,在实际生活中可能意义并不大,如同在两个草堆之间找出一根草的差距,对判断两个草堆的大小没有实际意义。因此,对任何检验结果都应当有符合实际的解释和说明。

虚假相关问题双变量分析中的虚假相关问题,几乎在所有关于社会科学研究方法的教科书中都会涉及到,在统计分析方法的教学中也被视为经典问题。但是多少年来,人们仍然在不断地重复着这个“经典的错误”,即认为可见的或统计检验结果显著的相关就是真正的相关;更为大胆的做法是把这种相关关系推向因果关系。我们知道,对于有的变量来说,即使是经过检验判定两者具有统计上显著的相关关系,也不一定存在实际意义上的关系,因为可能有未考虑到的变量或不可测量的变量在同时对两个研究变量起作用,有时甚至可能完全是偶然的巧合。例如,火灾的大小是以火灾损失来衡量的,而参加灭火的消防员人数是与火灾大小有关的,火灾越大,出动的消防员就越多,但凡是具有常识的人都不会根据出动消防员人数和火灾损失两个变量之间的高度相关,断定出动消防员越多火灾损失就越大,因为火灾的规模是决定因素(但很难直接衡量)。在有关人口科学研究中也有报告虚假相关的现象,如人口增长率的降低导致了经济增长的提法就是一例。因此,在分析相关关系时,应当根据理论、知识、经验、甚至常识来判断这种分析是否有意义、是否存在其他变量的作用(称为外在变量),避免得出有悖于常理的分析结果。有些虚假相关是可以通过统计分析方法判别的,如在控制了另外一些变量后观察两个变量的偏相关,或在双变量分析的基础上,进一步用多变量分析深入研究。

3多变量分析

回归分析是多变量分析中应用最多的方法,尤其是逻辑斯蒂回归更是被广泛地应用。在众多应用中,比较明显的问题是使用方法是否得当和对结果的报告和解释是否规范、合理(见2002年第2期《人口研究》刘金塘文)。此外还有一些应当引起注意的问题。

分析框架的重要性在社会科学研究中,各变量之间往往存在错综复杂的关系,如果在进行回归分析之前没有一个清晰合理的分析框架,那么回归的结果有可能会引起质疑。一般应在报告回归分析结果之前,介绍该分析的框架,如各变量的定义、各自变量与因变量的假设关系及其理由等,对建立的回归模型做出合理性论证。有一些变量可能是作为控制变量纳入回归模型的,如性别、年龄等,最好事先解释清楚。对假设因果关系的模型,应当至少能够说明:(1)该因果关系在理论上是正确的、在实践中是合理的;(2)从事件发生的时间上来说,应当是原因发生在先、结果发生在后。如有些回归分析中,未加说明即把所有与因变量显著相关的变量都囊括在自变量中,甚至有些自变量与因变量有明显的互为因果关系,显得分析逻辑混乱;还有的论文在简单介绍研究背景和数据来源之后,急于建立因果关系并推出回归分析结果,然后再根据各变量在回归模型中的显著性一一说明,这相当于事后解释;这些做法都是错误的。

在具备“奔4”微机和较易操作的软件的今天,转瞬间就可完成一次回归分析,但是在此之前,需要有大量的前期准备工作,包括文献检索和理论框架构建,才能确保统计分析的科学性。

分析方法应用的条件每种多变量方法都有各自的前提条件或假设,如果这些条件不具备或者假设不成立,该方法的应用就成问题。如Pearson相关是考察线性相关关系,多元方差分析只能辨别线性相关因变量的多元差异,线性回归分析假设自变量与因变量之间为线性关系,因子分析方法也是建立在各变量具有一定的线性相关基础之上的;另外,在逻辑斯蒂回归中,每个分类都应保证有足够的频数,如果频数太少就会影响参数估计的稳定性;等等。尽管一般不在报告分析结果时说明各种假设是否成立或条件是否满足,但是在进行分析时应当自觉地进行考察。如果不能满足条件或假设不能成立,就对数据进行转换或调整后再分析,或者改变分析方法。

多变量分析结果的展示和解释多变量分析的结果一般是通过列表来展示的。现在一种并不少见的做法是直接把统计软件的输出直接复制到论文中,我们往往会在文章中看到包括回归参数估计、参数标准差、检验统计值、检验显著性、偏相关系数等等n行m列的大表,使人有目不暇接的感觉。实际上参数标准差和检验统计值是提供给分析者的信息,没有必要列在结果中;如果不是有特别需要的话,偏相关系数也不是关注重点;最主要的应当是回归参数估计及其显著性。

在列出分析结果之后,应当对结果的实际意义进行解释和讨论,而不是复述分析结果的数学意义。此外,在多元统计分析中一个常见的问题是分析者对变量作用不具有预期统计显著性的失望,因此绕开不显著的变量,甚至对数据或模型进行各种调整以获得显著结果。其实,统计分析结果不显著往往也是有实际意义的。例如在分析我国高龄老人的地区分布时发现,高龄老人比例与当地医疗卫生指标没有显著关系,这说明我国医疗系统还没有具备延长老人寿命的功能;另一方面也说明这些高龄老人的存活不是主要靠医药维持的。所以,在解释分析结果时,只要是在分析框架中涉及并参与分析的变量,无论作用显著与否,都应当给予充分的讨论;对于那些由于知识或信息的限制难以下结论的结果,可以作为问题提出,以便进行更有针对性的进一步研究。

此外,任何方法都有其局限性,分析结果也不会十分完美。因此在讨论结果的同时,也应当就此向读者说明。例如当一个多元线性回归分析的确定系数较低时,需要指出该模型有限的解释能力,探讨可能存在但没有纳入分析的更重要的影响因素。

不必求最新、只求最合适有些研究生在撰写学位论文时,常常因为自己没有应用最新的统计分析方法而感到忐忑不安;在评论某项研究的创新性时,有时也出现把学术创新和应用新方法混为一谈的现象,例如认为应用描述性统计方法的研究水平低于应用解释性或预测性方法的研究。新方法是层出不穷的。但是,出现了新方法并不意味着传统方法就不再适用,而是各有千秋。统计分析方法是工具,哪件合适就用哪件,能用锤子解决的问题不必开冲床。有时越是复杂的方法,假设条件也会相应较多,应用的局限性更大。因此,盲目追求方法的新颖并不是高水平研究的保证,真正需要注意的是使用最合适的方法。而对所用方法的真正了解,是正确运用统计分析方法的前提。

总和生育率的内在缺陷及其改进

郭志刚(北京大学社会学系、北京大学中国社会与发展研究中心教授)

1总和生育率的应用目的及评价原则

年龄别生育率及其概括性指标总和生育率(TFR)是生育研究中最常用的指标体系。但是现在它们面临很多实际问题。本文不讨论出生漏报导致统计失实的问题,因为其性质并不在于统计方法,而是一个社会问题。本文只局限于这一指标体系内在的有效性问题的方法论讨论。一个指标是否有效应该以研究目的为标准来判断,因此这一讨论将结合当前实际工作的需要来进行。

统计指标有两种功能:一种是对调查对象本身特征的直接描述,另一种则用于推断估计。很多情况下,统计指标同时承担着这两种功能,比如样本统计量反映了样本对象的特征,同时又服务于推断估计总体参数。既然是一种估计,自然会有推断偏差或误差。评价不同估计的优劣是看谁的偏差或误差更小。

那么通常我们应用TFR到底要反映什么?一是为了在控制育龄妇女结构的条件下概括时期生育水平,二是作为终身生育水平的估计。(注:在这一方面,总和生育率与人口的粗再生产率和净再生产率的性质类似,后两个指标中只不过又控制了下一代的性别和死亡因素的影响而已。)两种性质都反映在各年龄组生育率的合计上。通常,不同基数的相对数指标不可以直接相加(注:如男性平均年龄加女性平均年龄没有意义。)。为什么年龄别生育率可加,是因为设置了假设队列的概念。TFR主要不是平均的概念(注:早期将其翻译为平均生育率的确是错误的。至于年龄别生育率对妇女其他差别所做的均质假设,其实存在于所有汇总指标之中,而不论其分组有多细,但是都不会因此而称为“平均××率”。),而是总和的概念(即假设队列经过所有年龄后生育总和)。因此,TFR一身兼两任,其内容为时期生育率总和,其形式为队列终身生育水平。从前一种意义上使用时描述了该时期生育水平,从后一种意义上使用时则是假设队列终身生育水平的估计(注:但这种估计从原理上不同于一般统计量从样本推断总体的情况,但有关评价原则却是类似的。)。其值实际上涉及了35个实际队列,并且只有在生育水平及年龄模式长期不变的苛刻条件下,它才真正与实际队列终身生育水平相吻合(但是队列仍是泛指的)。尽管这一假设队列与真实队列并不能很好对应,但起码可以及时提供一种队列终身生育的估计来满足实际需要。

2缺陷一:总和生育率对终身生育水平的背离

表现A:最早对TFR的批评是由于其剧烈的时期波动。一逢时期突发事件(如中国1958~1961),实际生育量发生了变化,TFR就会大幅度下降。应该说,批评并不是指向其描述时期生育水平的功能,而是指向其作为终身生育估计的功能。因为,这时TFR的下降只是由于时期特殊原因影响,并不意味着终身生育水平真的下降。实际上,时期效应一过,TFR马上便会出现反弹(即常说的生育补偿),然而反弹的水平也并不能标志终身生育水平真的那样高。总之,TFR短期内剧烈波动时,将其作为终身生育率估计来理解很成问题。其中最引人注目的是,反弹年份的分孩次TFR(i)会超过1,特别是一孩TFR(1)会大大超过1(注:1982年全国1‰人口生育率抽样调查数据显示(姚新武,1995),1963年TFR=7.463,其中各孩次TFR都大于1,最高的是TFR(1)=1.568。作为队列估计,即是说每人生育一个半一孩,显得很荒唐。)。人口统计学对此采取的对策是,避免采用这些年份的TFR来作为终身生育水平的估计,或者采用若干年份的TFR的平均值来作为终身生育水平的估计,希望将欠年与盈年的误差相抵消。

表现B:然而,有时即使社会中似乎并没有什么特殊事件,TFR也会背离终身生育水平。但是,往往只是在TFR提高时才会受到一定关注(注:如1983年左右中国人口学界对TFR的讨论。)。理论分析可以证明,这种背离既可以是正的,也可以是负的。特别是在负偏离的情况下,往往可能持续较长的时间。并且,这种负背离实际上正是当前所面临的实际情况,因此特别需要重视。

这种背离产生的原因是婚育年龄的变化,或者说是队列的年龄别生育模式的改变。而负偏离则对应着婚育年龄的推迟。与时期突发事件对婚育年龄的推迟的暴发性影响不同,生育模式的自身转变具有较长时期的持续性、变化上的渐进性、现象的隐蔽性等特征,并且它并不一定伴随生育补偿现象。甚至有时人们根本没有意识到这种偏离的存在。

人口统计学早就揭示出,晚婚晚育可以延缓人口增长,但这是从长期人口发展的角度来证明的。而晚婚晚育对年份TFR有什么影响,则很少有人涉及。从理论上说,取得同样的终身生育总量,可以有不同的进程表。即假定各队列的终身生育数量不变,从某一时期开始各队列的生育年龄开始推延,这一过程可以持续较长一段时期,直至最终稳定在一个新的生育模式上。我对此做过一些模拟计算,在这种情况下,生育模式转变时期中每年的TFR一定会低于事先所设的队列终身生育量,而这段时期两端及以外各年份的TFR则可以等于事先所设的终身生育水平。这表明,即使将整个转变过程或更长时期中各年的TFR都加在一起平均,得到的还是—个偏低的终身生育估计。

更普遍的情况是生育模式的变化与终身生育量的变化同时发生,这时TFR下降同时受这两个因素变化的影响,由生育模式变化导致TFR对终身生育水平的偏离便较难分析。

实际问题:实际工作需要不允许我们等很多年再提供真实队列终身生育统计,而现在只有TFR一种估计方法,并且我们知道TFR还会经常偏离队列终身生育水平,因此急需寻找一种更好的估计来取代它。否则尽管当前TFR的值虽然很低,即使不论统计失真问题,我们也不知道这是否仅仅反映TFR发生了负偏离,那么我们凭什么肯定生育率已经下降到更替水平了。我们又怎么能知道,当生育年龄推迟告一段落时,TFR向终身生育水平回归时会回升多少。要知道更替水平的真正概念是实际上某队列与其终身生育后代数量的比(注:从这个意义上,净人口再生产率等于1仅是一种时期估计的标准,并且也服从上述偏离,并不是真正的更替水平。)。

有关改进:Bongaarts和Feeney(1998)提出了去进度效应总和生育率(TFR'''')。该方法旨在提供一种根据时期数据对终身生育水平的较好估计(注:Bongaarts和Feeney(1998)警告说,这一方法不适用于那种特殊时期效应(即重大灾害等)的年份。)。郭志刚(2001)对此进行了介绍,并用中国多年生育数据对该方法进行了检测和评价,结果是TFR''''作为终身生育水平的估计的确大大优于TFR(注:郭震威(2000)认为TFR''''不伦不类,既不是时期生育指标,又不是终身生育指标,是个尴尬的指标。我认为,它只是应实际需要而产生的另一种根据时期生育信息对终身生育水平的新估计而已,其实这没有什么可尴尬的。统计中凡是不能直接测量的时候,都得采用估计来代替。真正有意义的问题是,它是否比传统TFR更接近于终身生育水平。)。

该方法基本原理可以这样来理解:现实中生育模式转变时,除了导致该年生育数量有所变化以外,还会有其他共生现象,如分孩次的平均生育年龄(MACi)也会变化(注:Bongaarts和Feeney(1998)强调要用分孩次的平均生育年龄,而不能用总的平均生育年龄,因为后者会抹煞实际变化。)。MACi实际上是生育模式转变的测量值,可以在理论上建立其变化量与时期生育变化量之间的函数关系。TFR''''便是在常规分孩次TFR(i)的基础上利用MACi的变化信息来调整,得到去进度效应的分孩次TFR''''(i),然后再汇总为TFR''''。经过调整,TFR''''可以在相当程度上修正TFR距终身生育水平的偏离,因此TFR''''更接近于队列终身生育水平(这里队列仍是泛指的)。也就是说,我们可以用TFR''''来替代TFR原来所承担的终身生育估计的功能,而TFR还可以继续承担描述时期生育水平的功能,TFR''''与TFR之差可以作为生育推延对当前生育水平影响的估计(注:我曾当面请教Bongarts,问TFR''''方法是否可应用于预测模拟,他毫不犹豫地回答说不能。)。

我认为,尽管TFR''''指标还有继续改进的余地(注:比如某一年的MACi的计算还要前一年和后一年的数据,因而多少丧失了一点及时性。然而,我自己曾尝试过另外的计算,比如只用前一年和当年两年的信息,调整的结果也并不差。),但显然Bongarrts和Feeney为解决这一估计问题指出了极富于科学价值的方法论途径。并且,这一新指标不仅可以用于监测队列终身生育水平,也可以用于分析以往的生育数据(郭志刚,2000),帮助我们更好地理解我国的生育转变史和计划生育史。

3缺陷二:总和生育率不能控制育龄妇女的孩次结构

对某些重要因素进行统计控制可以为不同年份或不同地区的比较提供更大的可比性。尽管TFR控制了育龄妇女的年龄结构,但是它并没有控制育龄妇女的孩次结构。然而,当前许多人口模拟研究都不能再忽略育龄妇女的孩次结构问题,否则会有损其研究结果的有效性(注:比如,与调整生育政策相联系的人口模拟如果忽略现有一孩的妇女人数,便无法计算由于多年积累在一孩的这批妇女在政策调整时将产生的特殊生育效应。另外,有关生育政策后果方面的研究(如四二一家庭结构)也有类似问题。)。

问题的表现:实际上生育过程是严格的递进事件,也就是说,只有未生育者才能生育一孩,只有生育过一孩且尚未生育二孩者才能生育二孩。而常规生育率则是以年龄别所有妇女总数作为基数,因而没有容纳育龄妇女的曾生孩次信息,也就不能控制曾生孩次这种结构影响。因此,比较孩次结构差别较大的年份或地区之间的年龄别生育率(或TFR),便不能区分其差异到底是出于生育水平不同还是出于孩次结构不同。当其用于人口预测模拟时,如果假定两地区育龄妇女年龄结构相同,同样的系列生育率的假设会导致孩次结构十分不同的地区(代表着不同生育政策类型)将会有相同的出生人数,显然这严重地偏离实际情况。因此,面对当前的许多研究需要,基于年龄别生育率的TFR方法无论是用于比较分析上还是用于预测模拟,都会影响其结果的有效性(注:至于分孩次的年龄别生育率,只是对分子(即出生)划分了孩次类别,但是并没有对育龄妇女本身划分孩次结构。其基数没有控制孩次结构,因而从本质上说也没有控制孩次结构。)。

替代方法的产生:实际上,计划生育采取了分类指导原则后,便产生了多种生育政策类型,其显著特征便是孩次控制上的不同。在不同地区实施不同政策时,育龄妇女的孩次结构便取得了越来越重要的意义。从这一角度出发,导致Feeney(1985)和马瀛通等(1986)分别以不同思路创建了孩次递进生育指标体系。

他们的共同点在于采用孩次递进比作为生育测量的基础来构建指标体系。如前所述,每年的出生可以划分孩次。如果再将某一群体生育指标的基数由对应口径的年中妇女总数换成年初对应(即前一)孩次妇女时,便称为孩次递进比(注:实际上可理解为一种概率,如本年年初某年龄组(或孩次间隔组)只有一孩的妇女中在本年生育二孩的比例。)。然后,还可以将孩次递进比换算成递进总和生育率。

Feeney的模型突出地考虑了孩次递进间隔因素,不考虑年龄结构,因而常被称为间隔递进模型。而马瀛通等的模型则突出地考虑了年龄递进因素,因此常被称为年龄递进模型。

这两种方法不仅可用于在控制妇女孩次结构条件下的比较分析,也可以用于预测模拟(注:应该指出,其实中国人民大学人口研究所的老一辈人口学家早在1970年代所自行创建的标准(或可变)生育率预测法中也已经包含了控制孩次结构影响的思想(刘铮、邬沧萍、查瑞传,1981)。)。递进方法不仅可以在预测中控制孩次结构,而且应用于模拟预测时实际上比常规生育率方法更方便(注:这里的方便指,它只需要每年期初妇女的孩次别人口数便可以直接乘以递进比便得到对应的生育量,而不需要再计算其中妇女人数。)。由于递进比的概率性质,还能根本避免孩次别总和生育率出现的那种超过1的现象(注:尽管如此,Bongaats和Feeney(1998)认为这一类应用生命表方法的生育指标仍然没有真正控制生育进程变化的影响。)。

主持人评论

本期论坛邀请的三位专家都有多年从事人口统计和数据分析的经验,对人口学研究方法有很深的造诣。王谦副司长通过从多年工作中积累的大量实例,分析了在人口和计划生育工作中经常发生的统计方法和统计数据被误用的情况;郑真真副教授则对统计分析中比较常见的问题进行丁独到的分析和总结;郭志刚教授对总和生育率指标进行了深入全面的剖析,分析了其内在缺陷和改进方法。

王谦副司长通过10个典型实例说明在人口和计划生育实际工作中,统计方法和统计数据在五个方面经常被误用。这五个方面的问题有些属于统计分析中容易犯的错误,带有普遍性,如,错误地解释变量之间的因果关系,在统计分析中忽视定性分析与定量分析的关系,结论不是由统计分析中得出,使得定量分析只是定性结果的一种点缀。有些问题则由于人口与计划生育领域的特点而显得更为严重,如他指出的,大部分人口和计划生育统计指标在村一级或县、乡不适用是因为总体规模不够。统计所研究的是总体的数量关系而不是个别的数量关系,所以统计指标在一定的总体规模下才有意义,这是统计学中的基本概念,但是在实际中却经常被误用。我们经常看到的错误都是统计学上的一些“基本概念错误”,而不是“高深错误”。统计学上的概念和方法可能很简单,也容易理解,但是要在实际工作中正确地、恰如其分地运用并不容易,需要结合研究对象的特点。

郑真真副教授从另一个角度对描述性统计、双变量统计和多变量统计分析中经常被忽视的问题进行了讨论和分析。她不仅指出了问题的所在,而且告诉大家应该如何做,她所讨论的内容是大部分统计教科书上所没有的,具有很大的实用性,对于正确地应用统计分析方法具有很大的指导意义,具体的问题这里就没有必要再评述了。她的分析源于多年教学和科研工作的总结和升华,很多观点具有独到性,如对描述性统计的重视,多变量分析结果的展示和解释,不必求最新、只求最合适的方法。

王谦和郑真真从不同角度对统计分析和统计数据应用中出现的问题进行了分析,郭志刚教授则对人口统计中的一个重要指标-总和生育率进行了深入分析。他指出指标是否有效应该以研究目的为标准来判断,他从总和生育率对终身生育水平的背离和不能控制育龄妇女的孩次结构这两大缺陷出发,对问题的表现形式、实际工作中的需求以及改进方法进行了分析和介绍,其中渗透了他自己近年来对这一问题的研究结果和体会。我看完他的文章觉得获益匪浅,如90年代以来中国的人口调查所得到的总和生育率指标都非常低,这里面有统计漏报的问题,也有总和生育率指标自身的缺陷所带来的问题,在婚育年龄推迟时,总和生育率会低估终身生育水平。在以往的人口学研究中,对方法论的讨论和重视是不够的。研究方法的创新源于实践的需求,面对21世纪更加错综复杂的人口问题,我们需要研究方法的不断创新与发展,这是目前我国人口科学发展面临的一个巨大挑战。

三位专家的分析和讨论有很大的实用性,值得从事人口和计划生育的实际工作者和学者认真学习,但是毕竟他们不可能把所有的问题都归纳概括全面,这也不是本期论坛的初衷。我们希望通过本期论坛起到抛砖引玉的作用,引起同行对这一问题的重视。中国规范的人口学研究毕竟只有20多年的历史,有问题是可以理解的,统计分析方法的误用和研究的不规范在其他学科领域也同样存在,甚至有可能更严重,但是我们不能漠视这种状况继续下去,问题的解决需要全体同仁的重视和努力。我觉得目前至少可以加强以下几个方面的工作:

(1)提倡学术争鸣,鼓励同行之间开展批评,这将有利于学科的发展与规范;

人口统计学变量分析篇(3)

关键词:港口货运统计 数据分析 系统构建

一、港口货运统计分析预测的现状问题研究

客观来讲,当前港口企业的货运统计工作,面临着来自于多个层面的问题所惑,在根本上给港口货运统计工作的信息化发展带来了一定的阻滞,因此若想自根本就港口货运统计分析预测方法做出完善得构建形成有序的体系,那么必然需要自根本找寻其当前港口货运企业所存在的问题症结,以此达到与时俱进:

(一)港口人员素质能力及知识结构存在着缺陷不足

自根本来讲:目前港口方面的货运统计工作开展中,依然运用着几年前的业务系统,这类早期所开发出来的系统软件,在使用中大多是在DOS环境之下进行使用,存在着相应局限性,且在管理维护方面,仅仅依靠着少量老一代的管理开发者进行,应用体现着较大的风险性。另外在集团企业到下属公司层面的工作人员知识结构组成上,中年以上的软件开发者较多,技术人员整体呈现着知识结构老龄化现状,无论是数量和素质技能层面皆无法良性满足发展所需。

(二)统计软件缺乏科学的规划指导

目前港口集团与各个港口分公司的业务应用软件系统呈现相互独立的局面,不同的应用主体所使用的软件系统在系统的开发、系统的运行负责任、系统内部运行和对外开放的平台都是不同的,虽然同属于一个港口集团,但是各个分公司之间不同的系统导致统计数据无法有效的进行整合,并且这些软件系统具有高度的重复性和数据冗余等缺陷,最终造成统计标准混乱、统计报表难以衔接。

(三)统计设备落后

当前,纵观港口货运行业的发展,诸多港口企业的统计设备,均面临着老旧化的发展现状,诸多设备均是早些年间所购置的,随着现代科技的发展,这些设备的配置,已然达不到统计工作对速度和精确的要求,配置低并且故障频发。加之相关的硬件维修维护人员相对缺乏,大量的维修工作无法作出协调有序的安排,极易造成硬件维护人员的怠倦,因为在根本上,影响到了港口企业信息化工作的有效开展。

二、港口货运统计分析与预测方法论述研究

(一)港口货运统计分析论述

首先要在法制层面上对港口货运统计制定相关的规定,提高人们在货运统计活动中的守法意识,开展遵守客观事实的统计工作,具体的可以参考《港口法》制定符合我国国情的法律法规,如《港口统计实施细则》,进而根据细则建立具有法律效力的港口管理制度。其次,要研究适合我国港口企业发展特点的货运统计方法和统计体制,在保证科学精确客观统计的同时,建立科学抽样调查方法、降低统计工作量,提高货运统计工作效率。第三,要紧跟信息化的时代步伐,加快港口企业现代办公的进程,借鉴世界先进港口发展管理经验,努力将港口货运统计朝着信息化、自动化、电子化方向转变。最后要对港口货运统计中的核心部分统计信息功能进行变革,在信息化社会,统计信息除了过去传统的记录、存储数据的功能以外,还要为港口企业的发展提供有效的参考功能,因此要不断地开拓统计信息的内容性质和渠道来源,拓展统计信息的服务功能。

(二)港口货运统计数据预测方法研究

目前运用到港口货运统计数据分析的方法主要有三种:线性回归分析法、季节变动预测分析法以及指数平滑分析法。运用线性回归方法对货运统计数据进行数学处理,根据货运统计中货物性质或名称与货物数量之间的相关关系,建立线性回归方程,加以外推,为以后的货运统计进行预测分析。季节变动预测方法是根据季节的变化波动来进行预测的方法,这种方法是建立在时间序列的变化规律基础之上的,经营条件以及外部环境的季节性变化都会呈现出季节性变动,这种变动周期性重复出现,在预测时,要根据货运统计分析方法计算出货运变化的季节性指数,掌握季节性变动的规律,然后根据这个规律对未来某个季度或月度的货运统计进行预测。指数平滑是在港口统计预测中运用最多的一种方法,由于其预测期间限于中短期预测,因此预测结果具有较高的精确性,能够提供有力的参考。指数平滑法也是建立在时间序列分析基础之上的,通过计算货运统计指数的平滑值,运用一定时间序列预测模型对货运统计在一定时期的指数值进行预测。

三、结束语

市场经济体制发展和信息化时代的来临对港口货运统计工作提出新的挑战,过去简单传统的货运统计分析思想和制度已经不能满足现代港口企业的发展要求,因此必须对其进行有效的改进。另外港口货运统计的预测服务功能能够为港口企业未来一定时期内的发展提供决策支持,因此要采取合适科学的预测方法对港口货运统计进行预测,更好地发挥港口货运统计工作的功能。

参考文献:

[1]刘丽.国际贸易与现代物流发展互动关系实证分析[J].物流技术,2013;32

[2]交通部水运司港口处,规划司统计处.持续增长形势喜人一季度中国大陆主要港口生产综述[J].中国港口,2011;4

[3]龚正平.金融危机对湖南水运的影响及措施建议[J].中国水运(上半月),2009;11

人口统计学变量分析篇(4)

[关键词]房屋贷款类神经网络

一、引言

对金融机构授信部门而言,数据挖掘技术已经开始扮演着日益重要的角色,如何发掘房屋贷款户数据库中所包含的信息,并利用这些信息及早预测出可能发生违约的不良房屋贷款户,并拒绝贷款给这些高危群,藉此降低呆账发生机率,同时减少金融机构损失,这就是房屋贷款信用风险管理。以往银行大多使用人工方式对申请人的信用状况,依照5C的原则,即房屋贷款户的特性、还款能力、资本、抵押品及总体经济环境,进行相应审核,但面对日渐增多的申请案件,若要维持人工审件,银行势必花费可观的人力成本。同时,人工审件时,审核人员大多根据经验主观判断申请人的信用状况,为此银行必须研发正确、有效且快速的信用审核制度。

二、审核系统建构方法

1.类神经网络模式

类神经网络是目前发展极为迅速的一门学科,其最大的优点是除可应用于拟合非线性形式外,还能弥补多元回归及建立ARIMA 模型时受诸多假设约束的缺陷。

类神经网络的网络型态有许多类,其中以倒传递类神经网络为最具代表性、应用最广的模式之一。其网络结构一般而言包含三层神经元:输入层、隐藏层及输出层。类神经网络对于变量的选取有较大的自由度,没有如回归分析般的限制,研究者须以文献、专家意见判断或经由统计方法处理,进而选取输入层的输入变量。而在输入层之变量决定后,对于网络结构中的隐藏层数目、隐藏层中神经元数目、训练的学习率大小等,都需要以主观逻辑判断,或以不同组合加以测试,以找到能产生最佳预测结果的参数。

2.判别分析

判别分析要求数据满足独立同分布,以及正态性的要求(Johnson等,1998),根据Fisher(1936)的线性判别模型,具体可表示如下:D=B0+B1X1+B2X2+…+BnXn

其中:D为鉴别分数;B0为估计常数项;Bn为估计系数;Xn为自变数。

判别分析主要优点是简洁方便,并能整合预测变量,而其主要的问题则为违反正态性等假设时模型的拟合效果会较差,目标维度的简化难以说明每个变量的相对重要性、难以使用在时间序列数据上,且当数据型态不符合相关研究工具的要求时,可能得到相当不理想的分类结果。

3.logistic回归

Logistic回归种应变量Y仅有两个可能类别结果,以0与1表示二元变量,例如分析发卡银行是否核准发卡给信用卡申请人,按照审核结果,其反应变量定义为发卡或是拒绝发卡,而自变量可以是任何形式的变量数据,其回归模型的参数利用最大似然法估计得到。

三、实证研究

本文采用我国台湾地区某金融机构大台北地区房屋贷款户共510笔资料进行实证研究,分成两组作实证研究,第一组为人口统计变数,采用性别、申贷时年龄、婚姻状况、教育程度、职业、服务年资、月收入等七个人口统计变量作为评估房屋贷款户是否违约的自变量。第二组为所有变量,采用除上述七个人口统计变量外,另加入其他十一个变量,即月付金占总收入比例、贷款成数、有无保证人、借保人关系、有无政府优惠贷款、自住或非自住、贷款型态、贷款金额、屋龄、借保人申贷时之信用状况、房屋是否为小坪数/国宅/工业区等,共十八个变量作为评估房屋贷款户是否违约的变量。

数据库中共包含510个样本,其中有90%的房屋贷款户属于缴息正常的客户,10%的房屋贷款户属于违约的客户。所谓缴息正常客户,表示房屋贷款户在贷款期间未发生异常行为,包括逾期缴款、催收或呆账等行为;至于曾发生异常行为中任意一项,银行均将此客户视为违约客户。

在实证过程中,本文将分别采用SPSS 10.07和Vesta出版的Qnet(1998)软件分别进行分析。

1.判别分析实证结果

由于房屋贷款户申请数据的可能自变量较多,为取得较精简的自变量,本研究使用逐步判别法进行判别分析,并且依据各变量的U统计量作为删减变量的准则。根据逐步判别分析的结果,第一组人口统计变量被删减成婚姻状况及教育程度2个较为显着的变数;第二组所有首先依违约比率10%随机抽出350笔样本作为回归样本,其余160笔(违约比率变量(即人口统计变量及其它变量),被删减成月付金占总收入比例、贷款成数及贷款金额等3个较为显着的变数。

根据相关分析结果,第一组整体的正确判别率为75.0%,第二组整体的正确判别率为79.4%,第二组所有变量所建立的判别方程优于第一组人口统计变量所建立的判别方程。

2.logistic回归实证结果

本文利用逐步logistic回归进行分析,并且依据各变量的t值作为变量采用的准则。根据分析的结果,第一组人口统计变量中7个变量筛选出婚姻状况及教育程度等2个较为显著的变量;第二组所有的18个变量筛选出贷款成数、月收入及自住或非自住等3个较为显著的变量。再按照所选出来的显著变量分别建立房屋贷款户核准与否的logistic回归方程。

根据相关分析结果,第一组整体的正确判别率为84.4%,第二组整体的正确判别率为85%,第二组所有变量所建立的判别方程优于第一组人口统计变数所建立的判别方程。

3.类神经网络实证结果

Cybenko (1989)等指出包含单一隐藏层之类神经网络模式已足够描述任何复杂的非线性系统,因此建构的倒传递类神经网络将只包含单一隐藏层。而由于第一组人口统计变量输入层包含七个神经元,第二组所有变量包含十八个神经元,因此隐藏层中神经元的数目分别选择 14及36进行测试;最后在网络的输出层部份则只包含一个神经元,即房屋贷款户是否违约。在参数的相关设定中,Rumelhart(1986)建议较小的学习率通常会得到较佳的结果,因此学习率将测试 0.002、0.003、0.004、0.005及0.006五种组合。而停止训练准则方面以训练数据的 RMSE值小于或等于0.0001,或最多训练3000次为准,拥有最小测试数据RMSE值的网络结构被认定为最佳结果。

建立类神经网络模式时,第一组采用人口统计变量、第二组采用所有变量作为预测房屋贷款户是否违约的输入层变量,以进行模式的建立,并以房屋贷款户缴息正常或违约作为反应变量;从510笔的房屋贷款户资料中随机抽样所得350笔样本作为训练样本,另外160笔样本数据则作为测试模式用。

利用Qnet(1998) 软件进行分析,测试不同神经元及学习率组合下类神经网络预测模式结果,当节点个数分别为14及36,学习率为0.005时可得到最大的正确判断率以及最小误差。而将样本数据测试测试模式准确度进行比较发现 ,利用类神经网络方法来判断房屋贷款户缴息正常或违约,第一组及第二组分别可得到96.9%及99.4%的整体正确判别率,第二组所有变量所建立的判别方程优于第一组人口统计变数所建立的判别方程。

四、研究结论

1.加入其他变量比单纯利用人口统计变量更能预测房屋贷款户违约的发生

判别分析实证结果部分,仅含人口统计变量的模型,整体分类正确率为75.0%,而加入其他变量后的模型,整体正确率提升为79.4%。在分类误差方面,加入其他变量的模型的型一、型二误差率都较仅含人口统计变量的模型有所改善。

logistic回归实证结果部分,仅含人口统计变量的模型,整体分类正确率为84.4%,而加入其他变量后的模型,整体正确率提升为85.0%。在分类误差方面,加入其他变量的模型降低型二误差率,但型一误差率并未改善。

在类神经网络模式中,仅含人口统计变量的模型,整体分类正确率为96.9%,而加入其他变量后的模型,整体正确率提升为99.4%。在分类误差方面,二模型的型一误差率皆为0,而加入其他变量后的模型的型二误差率有较佳的表现。

由上述实证结果显示,加入其他变量能有效增加房屋贷款户违约预测模式的预测精准度。

2.对于房屋贷款户违约的预测能力比较

以判别分析建立判别房屋贷款户信用状况的分类模式,使用线性判别模式(LDA)进行模式建构,采用月付金占总收入比例、贷款成数及贷款金额作为准则变量(X),可以得到79.4%的正确辨识率。以logistic回归进行判别模式建立时,以贷款成数、月收入及自住或非自住作为准则变量(X),可以得到85%的正确辨识率。而对类神经网络而言,当节点个数为36,学习率为0.0005时可得到99.4%的正确辨识结果。整体而言,类神经网络可以提供较佳的预测结果,对于未来的研究方向,可以考虑利用其他的分类工具,如回归分类树、模糊理论等建构辨识率较高的房屋贷款户分类模型。此外,利用统计或人工智能的工具针对自变量的部分进行重要变量的筛选,以增加类神经网络模式输入层变量决定的理论基础也值得深入探讨。

参考文献:

[1]黄文启:以LOGIT模型研究借款人特性与不动产抵押贷款提前偿还之关系.国立政治大学财务管理学系硕士论文,2002

人口统计学变量分析篇(5)

Abstract:China's inter-provincial migration study focused on the scale of migration, the direction of the impact of factors such as trends in four areas. Research methods in this article from the perspective of the last century since the 90's, these four areas of research related Commentary. The study found: on the scale of population movements, the direction of the research method has been more mature; factor analysis of the impact of migration research in the field of hot-spot issues, multi-disciplinary research methods to promote the introduction of the factors affecting the rapid development of research; to forecast the trend of population migration Study less, limited research methods.

关键词:省际人口迁移 研究方法 综述

Key words:Inter-provincial migration; research methods; Summary

作者简介:张冬敏,(1981.10―)女,辽宁,西安工业大学经济管理学院,助教,在读博士,研究方向:社会保障精算

【中图分类号】C92 【文献标识码】A 【文章编号】1004-7069(2009)-05-0119-02

一、人口迁移规模测定方法

人统计调查是测定人口迁移规模时最基础的,也是被广泛使用的研究方法。由于我国长期缺乏人口迁移的统计数据,在很大程度上阻碍了人口迁移研究。1990年进行的第四次人口普查,首次将省际人口迁移列为正式统计项目。2000年第五次人口普查中,将人口迁移统计项目进行了进一步细化,添加了对省、市、县内部的迁移流量和流向情况的统计。除全国普查外,1986年中国社科院人口研究所进行的74城镇人口迁移抽样调查 [2];1987年和1995年全国人口普查办公室进行的1%人口抽样调查[3];1988年[4]和1992年[5]国家计划生育委员会进行的全国生育、节育抽样调查中,内容也涉及了人口迁移的相关项目。

通过以上多次统计调查,已可以构建起过去二十年间我国的人口迁移数据库,进而为相关研究提供必要的数据准备,推进对人口迁移的定量研究。但值得注意的是,在利用统计数据进行人口分析时,必须认识到各次统计数据间,在对迁移者的定义、迁移者年龄范围、抽样标准等统计口径上,存在着较大差异。

由于对迁移人口的统计间隔较大,无统计数据年份的人口迁移规模需要通过构建人口迁移模型,测算得出。特定年份的区域总人口规模等于区域内原住人口规模与此时期内的净迁移人口规模之和。因此,在总人口规模已知时,只要测定出原住人口规模,即可计算出此时期内的净迁移人口规模。据此思路,徐国祥[7]提出了利用生命表对净迁移人口数进行估计的方法。

二、人口迁移方向判定方法

为准确描述人口迁移现状,除测定人口迁移规模外,还需判断人口迁移方向,对人口迁移进行动态描述。人口迁移方向判定可根据其研究范围的不同,分为宏观、微观两种判定方法。

人口迁移方向的宏观判定是以全国为研究范围,研究全国范围内人口迁移的主要流向,即判断出全国人口迁移的吸引中心及其主要吸引区域。其研究方法是通过统计各省份(或地区)的人口迁入/迁出规模,并比较各省份人口迁入/迁出规模占总人口迁移规模的比重,测定全国范围内的人口空间流向。丁金宏[8]总结了我国省际人口迁移的三类典型流场形态:以四川省为源地的辐散流场;以广东省为引力中心的辐合流场;山东与广东的对流流场。于弘文[9]将我国划分为东、中、西三大地区,指出近20年来,我国人口地域分布呈现东多西少的宏观格局没有改变,但人口分布进一步向东部聚集。王桂新[10]测定出我国形成的7个主要人口迁移吸引中心,包括北京、广东、上海3个强吸引中心;新疆、浙江、天津、福建4个次级吸引中心。

人口迁移方向的微观判定是以某一省份(或地区)为研究范围,研究此省份人口迁出的主要目的地,或人口迁入的主要来源,即判断出针对某一省份的人口迁移吸引中心及其吸引的迁入人口区域。屈琼斐[11]、章定福[12]、周一星[13]、伍理[14]等分别对广东省、广西省、北京市和上海市的人口迁移流向进行了判定。

以上两种方法的缺点是在判定人口迁移方向时,仅通过比较各个地区的迁移人口规模,判定人口迁移的吸引中心,而忽略了迁移距离对人口迁移的影响。经验表明,在其他条件一定时,迁移人口更倾向于选择距离较近的目的地。因此,周皓[15]提出在判定人口迁移吸引中心时,应考虑到距离因素,将人口迁移规模与迁移距离结合成一个数量指标。

三、人口迁移的影响因素分析方法

长期以来,影响因素分析是人口迁移研究领域内的热点问题,其通过分析迁移现象中的各种基本因素特征,判断哪些因素将会对人口迁移决策起到关键性的影响,及其影响力大小。

频数统计法是统计学中用以描述定类数据的频数分布的方法。魏星[16]利用频数统计法对我国东、中、西三大地带间人口迁移的个体基本属性特征的分析得出:2000年前迁移人口中男性居多,绝大多数长途迁移者为男性。但2000年后,迁移人口的性别差异逐步减少,截至2004年迁移人口的性别构成已较为均等。

回归模型是用以研究某几个因素间存在的影响关系的重要统计学方法。人口迁移决策的影响因素是多方面且复杂的,为了深入、准确地测定各种因素对人口迁移决策造成的影响,logistic回归、多层次logistic回归、嵌套logistic回归等模型被引入人口迁移研究领域。李树茁[17]应用logistic回归,分析社会经济发展与人口净迁移的关系,提出:导致人口迁移的最重要动因是经济水平,其次是社会结构,最后是生活质量。段成荣[18]利用logistic回归模型分析了影响我国人口迁移的个人特征,其中年龄、性别、受教育水平和婚姻状况等特征对人口迁移决策起着显著的影响作用。庞丽华[19]利用多层次logistic回归模型,从家庭、村和省级三个层次研究发现我国省际农村劳动力迁移的影响因素中家庭类型、家庭劳动力数量、劳动力平均受教育水平、家庭经营主业和家庭在收入分层中的位置等家庭层次变量,经济类型、交通条件和迁移传统等村级层次变量,以及投资强度、经济结构、农村社会保障等省级层次变量对农村家庭的劳动力迁移有显著影响。刘建波[20]采用嵌套logistic回归模型研究发现,无论是个人因素还是区域经济因素,都对个体迁移行为具有重要的影响。

空间相互作用模型,从地理学视角阐明了影响人口迁移的主要影响因素。王桂新[21]从区域经济发展的角度,应用空间相互作用模型,定量考察并分析发现我国80年代后,经济规模因素对人口迁移(量)的影响比较大,经济收入因素的影响相对比较小;经济规模因素主要是影响人口的迁出,经济收入因素主要是影响人口的迁入;经济规模因素对迁出人口的供给及迁移量的大小具有决定性影响,经济收入因素对人口迁移的流向选择及其分布模式具有重要的导引、定型作用。

众多关于人口迁移的影响因素分析模型,都以迁入地为主,或迁出地为主,这些模型常隐含着迁移者对目的地的信息和交通具有同等的使用权的假设,且这些使用权不因来源地不同而有所变化。这样的迁入或迁出模型可能会高估迁移者对目的地因素的响应强度,忽略了不同来源地和目的地的空间差异性[22]。

四、人口迁移的趋势预测方法

当前我国对人口迁移的研究多集中于上述三个方向,对人口迁移的预测研究较少。人口迁移的趋势预测是对未来一定时期内的人口迁移规模、方向等进行的测算。

对人口迁移的预测方法主要包括两种:一种是以某省份(或地区)过去一段时期内的净人口迁移规模为基础,通过预测未来的净迁移率变动趋势,达到预测今后人口迁移规模的目的。另一种是以某省份(或地区)人口迁移的关键性影响因素为基础,通过预测影响因素的变动趋势,进而分析人口迁移情况的方法。

五、结论

综上可以看出,学者们已对我国社会经济转型期的人口迁移新特征进行了较为充分的研究(见附录)。学者们应用多种研究方法,描述了近年来我国省际人口迁移规模、方向等特征,清晰地呈现出人口迁移现状。

目前,我国对省级人口迁移规模、方向的研究方法已较为成熟。漏报率估算模型、迁移规模测算模型、人口迁移力矩等研究方法的引入,使得以往对人口迁移规模、方向研究中存在的遗漏、忽略的问题已被逐渐解决。研究成果已较为全面的反映出我国的人口迁移形势。为了进一步完善本领域内的研究,就必须统一人口迁移统计口径,提供准确、规范的统计数据。

人口迁移影响因素的研究方法向多样化发展。影响因素研究是揭示人口迁移规律的重要步骤,其作为当前人口迁移研究的热点问题,被众多人口学家、社会学家、经济学家所重视。

人口迁移的趋势预测的研究方法较少。未来人口迁移的发展趋势是制定人口、经济等相关政策的重要依据。当前对人口迁移的趋势预测的研究方法包括基于人口自身发展规律的和基于人口迁移影响环境的两种,研究方法的局限,致使此领域内的相关研究较少。

参考文献:

[1] 杨杨,关于人口迁移调查设计问题的讨论――对一次人口迁移调查的几点认识[J] 人口研究,1997,(2)

[2] 同[1]

[3] 王谦.全国生育节育抽样调查报告集(迁移卷)[M].中国人口出版社,1993

[4] 周皓.从迁出地、家庭户的角度看迁出人口――对1992年38万人调查数据的深入分析[J]中国人口科学,2001,(3)

[5] 徐国祥.法赫德・尤素福.国内净迁移人口数估计方法研究.财经研究[J].1994(4)

[6] 丁金宏.中国人口省际迁移的原因别流场特征探析[J].人口研究,1994 (l)

[7] 于弘文.从2000年人口普查看我国人口状况的几个特点[J].2001(7)

[8] 王桂新.中国经济体制改革以来省际人口迁移区域模式及其变化[J].人口与经济,2000 (3)

[9] 屈琼斐等.广东省人口迁移区域性态势分析[J].人口研究,1997 (11).

[10] 章定富.江西省人口迁移与城市化[J].人口学刊,2000 (l)

[11] 周一星.北京千户新房迁居户问卷调查报告[J].规划师,2000 (3).

[12] ] 伍理,重视城市化过程中的人口分布变化―以上海市为例[J].人口与经济,2001 (5).

[13] 周皓.中国省区人口净迁移的两项数量分析[J].杭州大学学报.1997(10)

[14] 魏星,王桂新.中国东、中西三大地带人口迁移特征分析[J].市场与人口分析.2004(5)

[15] 李树茁,杨有社.我国的省间人口迁移与社会经济发展[J].人口与经济.1996(5)

[16] 段成荣.影响我国省际人口迁移的个体特征分析[J].人口研究.2000(4)

[17] 庞丽华.多层次分析方法在人口迁移研究中的应用―――省际劳动力迁移的多层次分析.中国农村观察[J].2001(2)

[18] 刘建波,王桂新,魏星. 基于嵌套Logit模型的中国省际人口二次迁移影响因素分析[J].人口研究.2004(4)

人口统计学变量分析篇(6)

【关键词】理工类研究型大学;英语口语课程;课程满意度

学术界对学生满意度的研究最初来源于经济领域的顾客满意度。一般而言,顾客满意度是顾客在使用某种产品或享受某项服务以后,形成的满意或不满意的态度。伴随着英美等发达国家的高等教育步入大众化阶段,高校的数量和规模日益扩大,学生群体和学生需求也更加多样化,高校竞争愈加激烈,以及以学生为中心的高等教育评价理念日渐兴起,这些都驱使高校更多地关注学生群体对高校的满意度。学生满意度的研究开始作为评价教学和改进教学的重要手段之一。大学生满意度测评研究开始于上世纪60年代,1966年CIRP(Cooperative Institution Research Program)对美国全国大学新生的测评是大学生满意度测评的起点。

在经济全球化的今天,英语口语技能在高层次的对外交流中发挥着越来越重要的作用,而研究生英语口语在研究生的专业和文化的国际交流上也发挥着日益重要的作用,开设高质量的研究生英语口语课程有助于推动研究型大学的进一步发展,提高其人才培养的质量和与国际接轨的水平。通过对已有的研究生英语口语课程的文献的分析,发现目前还未有从学生满意度的视角,来分析和探讨研究生英语口语课程的改进和优化。而从学生满意度出发来探究研究生英语口语课程的实施现状,可以为研究生英语口语课程的实施和教学质量的不断完善提供相关实证依据和参考。而相关研究的缺乏,进一步证实了开展此类研究的重要性和必要性。

华南理工大学作为一个典型的理工类研究型大学,研究生英语口语课程作为学校试行的选修课程,在实践中日益摸索,努力寻求最佳的教学模式,既积累了丰富的教学经验,也存在一些问题和不足。本文以华南理工大学为例,基于探究研究生对英语口语课程设置和实施的满意情况,先后进行了指标体系设计、问卷调查、统计分析处理等工作,运用调查研究方法,对英语口语课程的研究生进行调查,旨在通过分析该校研究生英语口语的教学现状,探究理工类研究型大学教学中存在的问题和教学的成效,从而为教学改进提供可参考的建议。

一、调查问卷设计与影响因素指标体系构建

(一)选取问卷变量

本研究根据华南理工大学研究生英语口语课程教学的实际情况,并参考了相关文献,将问卷的变量分为两部分。第一部分为人口统计变量,包括被试的性别、专业、英语知识水平;第二部分为英语口语课程学生满意度影响因素,其包括四个维度:教学准备、教学过程、教学效果和教学评价。本问卷主要采用李克特“五点”量表,将选项“不满意”、“不太满意”、“一般”、“比较满意”、“满意”分别赋予1、2、3、4、5 分。

(二)构建指标体系

本研究的指标体系的一级指标是研究生英语口语课程课程满意度,这一指标可划分为四个维度,即教学准备、教学过程、教学效果和教学评价等四个二级指标。二级指标下的评量问项按照Ai,Bi,Ci,Di方式标记。除此之外,还添加了整体的课程满意度一项,以了解研究生对英语口语课程整体的满意度。并根据此指标体系设计出调查问卷,详情见下表。

表一 指标体系构建

一级变量 二级变量 评量问项

研究生英语口语课程满意度 教学准备 A1 课程内容有针对性;A2课程与学生接受能力相匹配;A3公布课程计划

教学过程 B1 教学态度;B2师生互动;B3生生互动;B4 课程激发学生兴趣;B5课程激发学生参与;B6教学方式;B7讲授教学方法

教学效果 C1 英语表达观点和情感;C2英语交流;C3语音语调正常;C4语法基本无错误;C5就话题发言;C6跨文化交际能力

教学评价 D1学生对课程与教师的要求可以及时地反馈并加以改进;D2学生收到教师对学生学业的及时评价;D3教师采用多种方式考察学生学习成果

整体课程满意度 整体课程

评价 E1学生评价课程经历

E2 如果重新选择,学生是否会选择这门课

二、样本数据采集和分析

(一)调查样本情况

本研究以华南理工大学选修研究生英语口语课程的研究生为调查对象。由于选修英语口语的研究生人数较少,且采用小班教学,每个班级人数在30人左右。在2013年5月下旬共发放问卷240份,收回问卷223份,回收率为92.9%,删除无效问卷8份,共有215份有效问卷,问卷有效率为89.6%,问卷有效率比较高,这说明此次调查过程科学合理。

(二)调查分析方法

本文以SPSS做为本研究的统计分析工具,分别对问卷统计结果进行了描述性统计分析和因子分析。

(三)描述性统计分析

1.样本概况

首先对调查对象的人口学特征进行描述统计,发现样本总容量为215人,样本的性别构成为男136人,女79人,分别占总样本的63.26%和36.74%;专业构成为理工类学科177人,人文社会学科38人,分别占样本总数的82.33%和17.67%。对学生英语基础情况进行统计,发现通过大学生英语六级的学生为207人,未通过的有6人,分别占总样本的96.28和3.72%,说明本校选修英语口语课程的研究生具备较好的英语知识基础。

人口统计学变量分析篇(7)

【关键词】派遣工;工作满意度;人口统计特征

1.引言

近年来劳务派遣作为一种新型用工方式,在我国劳动力市场上得到了广泛的应用,对降低企业劳动管理成本、规避企业用人风险和避免劳动纠纷等起到了重要的作用。派遣工在企业中的比重越来越大,而随之对派遣员工的管理也引起了众多企业管理者与学者的重视。不同个体特征的群体,会由于年龄、学历等个体差异,具备不同的工作价值观,从而会产生不同的情感经验及差异化的工作期望,进而导致其工作满意度呈现不同的差异。研究不同统计特征下派遣工工作满意度的差异对于企业有着重要的意义。

工作满意度是员工在工作中对比自己期望获得收益与实际收益时产生的情感反应。Hoppock(1935)最早把工作满意看为是工作者对工作环境的主观反应[1],之后各学者进行了进一步的修改或完善,Locke(1969)就曾将工作满意度界定为因工作成就感或工作促进价值实现的评价而产生的愉悦情感状态[2]。本文通过研究人口统计变量如性别、婚否、年龄、学历等和工作满意度的关系,分析不同人口统计特征下派遣员工工作满意度的差异。

2.研究过程

2.1 问卷的设计

问卷的内容主要分为两个方面:基本信息和工作满意度。基本信息包括员工的性别、年龄、学历等三项,在本次数据分析中是重要的自变量。其中性别男性和女性两类。年龄分为五段:20岁以下、21-30岁、31-40岁、41-50岁、51岁及以上。学历分为:初中及以下、中专或高中、大专、本科、硕士及以上五个部分。

工作满意度部分是在参考Spector(1985)编制的量表[3]和台湾学者樊昌育编制的劳务派遣工满意度量表[4],经过删减与修订后编制而成[5]。该量表由五个分量表组成,分表代表了工作满意度的五个维度:工作本身、晋升、薪酬、操作程序和人际关系满意度等。量表采用李克特(Likert)的五点量表尺度计分法,得分越高表明满意度越高。

2.2 样本的发放

笔者借助学校某课题研究对天津市16家业的派遣员工进行了问卷调查。问卷以不记名方式,采用纸质或电子版形式,通过各种途径下发到企业的派遣员工手中进行填写,问卷填完后直接回收到研究人员处。问卷采用分层随机抽样的方法,共发放问卷594份,回收532份,其中有效问卷为495份,有效率为93.05%。

2.3 数据处理

文章以员工的人口统计特征为自变量,以工作满意度的5各维度和总体满意度共计6个变量为因变量,进行T检验和方差分析。将有效问卷数据录入后,用SPSS17.0统计软件分析不同人口统计特征下派遣工工作满意度各维度及总体满意度存在的差异。

3.研究结果

3.1 一般描述性统计结果

由于样本选取的限制,所能调查到的派遣员工年龄在51岁以上的较少,为了便于分析,将此类省略,即年龄段分为4个阶段。从派遣工人口统计特征变量的描述性统计信息中可以看出:在本研究中男女性别比例差别不大,以女性居多;年龄主要集中在21-30岁之间,占了总数的近80%;学历以本科为主,硕士以上学历也占了相当部分。

接着对所采用的量表进行主成份分析和内部一致性检验。对所有项目进行主成份分析发现,KMO值为0.883,所有项目汇聚成5个因子,累计解释的方差达64.040%。对量表进行(下转第245页)(上接第243页)一致性检验表见表1。满意度总体量表Cronbach a系数为0.911,各分维度的信度值也都在0.79以上,因此,量表的内部一致性比较高。

表2列出了工作满意度各分维度与总体工作满意度的方差、均值、各变量之间的Pearson相关系数。通过数据分析可以看出人际关系满意度最高,值为3.7957;晋升满意度最低,为2.8273;其他测量维度的满意度从低到高依次为操作程序满意度(3.2222)、薪酬满意度(3.3000)、工作本身满意度(3.6824)。工作满意度的5各维度与总体满意度之间显著相关,系数大小有所差别,说明工作满意度各维度对总体满意度的影响是不同的。另外本文采用工作要素总和评分法和单一整体评估法分别去测量满意度各维度和总体满意度,与以往研究仅用所有项目和的平均值即为总体满意度值的方法相比,考虑了各维度对总体满意度的影响权重,更具有科学性。

3.2 人口统计特征对工作满意度的影响

3.2.1 性别

从表3中的分析数据可以看出,性别对人际关系满意度的影响显著(显著性概率=0.000

3.2.2 年龄

从表4中数据分析能够看出,除了年龄对操作程序、人际关系及总体满意度差异性不显著外,对工作本身、晋升、薪酬有着显著的影响。31-40岁区间的派遣工在工作本身、薪酬方面的满意度水平高于其他年龄段员工;21岁以下派遣员工仅在人际关系方面满意度水平稍高于其他年龄段,而在另外四个满意度维度及总体满意度上均低于其他年龄段员工的水平。

3.2.3 学历

由表5中可以看出学历对人际关系和操作程序满意度的影响不显著,但是对工作本身、晋升、薪酬以及总体满意度差异性比较显著。初中以下学历派遣员工仅在晋升满意度上稍高于中专或高中学历员工,但在其他四个分维度及总体满意度水平上均低于高学历员工;随着学历的增高,工作本身及总体满意度的员工满意度水平总体呈上升趋势。

4.结论

通过对天津市16家企业的几百名派遣工进行问卷调查,对不同人口统计特征的派遣工在工作满意度的5个维度及总体满意度上的差异进行了比较研究。根据以上数据分析,研究可得出以下结论:(1)男性和女性仅在人际关系满意度上有差别,而在工作本身、晋升、薪酬、操作程序及总体满意度上差异性不显著。(2)年龄对操作程序、人际关系及总体满意度的影响差异性不显著,而对工作本身、晋升、薪酬方面的满意度差异性有着显著的影响。(3)学历对人际关系和操作程序满意度的影响差异性不显著,但是对工作本身、晋升、薪酬以及总体满意度差异性影响比较显著。

由于时间及调查范围的限制性,本研究局限在派遣工人口统计特征对工作满意度总体及各维度的差异性影响,并没有考虑其他因素的影响,也没有考虑人口特征的交叉作用对工作满意度各维度及总体的影响。另外,本次实证研究的结论只是根据数据统计分析的结果总结出结论,并没有与之前学者的研究结论进行对比分析。但就本研究总体而言,通过本次对派遣工工作满意度的实证研究,能为目前正不断深入加强企业派遣工的管理提供了借鉴,也为以后学者继续对派遣工的工作满意度分析提供参考。

参考文献

[1]Hopppock,R.“Job Satisfaction”.New York:Harper & Brothers Publishers,1935.

[2]Locke,E.A.What is job satisfaction[J].Organizational Behavior and Human Performance,1969,4(4):309-336.

[3]Spector,P..Job Satisfaction.Thousand Oaks,CA:Sage.Copyright,1997 by Sage Publication,Inc.

[4]樊育昌.转换型领导对于员工工作满意度与组织承诺之影响――以台湾某科技公司大陆厂为个案分析[D].台湾:国立中山大学,2006.

[5]卢嘉,时勘.工作满意度的结构及其与公平感、离职意向的关系[A].第九届全国心理学学术会议论文摘选集[C].2001.

作者简介: