期刊大全 杂志订阅 SCI期刊 投稿指导 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 数据分析统计学方法

数据分析统计学方法精品(七篇)

时间:2023-07-23 09:15:44

数据分析统计学方法

数据分析统计学方法篇(1)

关键词:统计学;教育改革;大数据

一、引言

最早提出大数据时代到来的机构是全球知名的麦肯锡咨询公司,该公司在一份研究报告中指出:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来”。

大数据是随着互联网技术的广泛应用带来的数据量和数据类型激增而衍生出来的一种现象,但大数据一词不仅指规模大、种类多的数据集,还包括对这种数据集进行采集、处理与分析以提取有价值信息和直接创造价值的技术构架和技术过程。大数据的第一个特征是数据量巨大。截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。第二个特征是数据类型繁多、异构性突出,包括网络日志、音频、视频、图片、地理位置信息等等。第三个特征是数据价值密度较低,数据中存在大量重复性和无价值性信息或噪声。如何通过强大的计算技术和统计分析等方法迅速完成数据的价值提纯,是大数据时代亟待解决的难题。第四个特征是处理速度快、时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。

目前,不同的学科领域对大数据概念有着不尽相同的解释,但各种解释中大致可以从两个方面去理解。首先,大数据概念体现在数据量的巨大、种类的众多及产生速度的飞快,同时产生的数据集极有可能包含着各种半结构化和非结构化数据;其次,大数据概念还体现在对数据进行处理的手段和流程方面,由于数据量的庞大和类型复杂,利用常规的统计软件已经无法对当今的数据进行及时有效的存储、分析及处理。因此,所谓的大数据并不是单纯指数据流量的巨大,还指其结构的复杂和种类的多样,在数据处理和分析上需要采用高端计算平台或高级统计软件,以及海量数据中存在着可挖掘的潜在的大量价值信息与知识。

近年来,随着高速计算机的应用、信息技术的快速发展,特别是云计算技术的发展,使大数据的存储和分析技术得到迅速发展,目前的核心技术有MapReduce、GFS、BigTable、Hadoop,以及数据可视化等。在数据搜集上,可方便地通过在线互联网数据库获取二手数据或一手实时数据。在数据分析上,传统统计学方法采取的是基于统计模型的样本数据分析,而大数据分析技术则是通过高端计算平台,对大数据中的信息进行挖掘。

统计学作为对数据进行处理和分析的科学,必然受到大数据的影响。在大数据时代,统计学教育必须与时俱进,跟上时展步伐。近年来,有不少文献讨论了大数据环境下我国统计学教育的改革问题(例如[1]-[5]),本文在分析大数据时代特征的前提下,进一步讨论我国统计学教育的现状与挑战、统计学教育改革的内容、方法、借鉴和适应时代要求的变革问题。

二、统计学教育的现状与挑战

2013年,教育部对我国统计学专业设置进行一次新的调整,将原来的既可授予理学学位,也可授予经济学学位的统计学专业划分为统计学、应用统计学和经济统计学三个本科专业[6]。根据教育部高等学校统计类专业教学指导委员会2013年11月公布的数据,当时全国有194所高校开设了统计学专业,156所高校开设了应用统计学专业,164所高校开设了经济统计学专业[6]。目前,全国开设这三个统计学专业的高校个数和在校学生人数与2013年相比都有不少的增加。

面对大数据时代,我们目前的统计学教育无论在培养目标和教学内容上,还是在教育方式和人才培养模式上,都存在着亟待解决的挑战性问题。例如,在专业培养目标和人才培养过程中,我们比较重视课程层面上的评价,比较轻视专业层面上的整体评价,缺乏对学生综合能力的反馈机制。

关于教学内容,目前三个统计学专业在统计理论和应用统计两个方面有不同的侧重。统计理论主要包括:抽样理论、实验设计、估汁理论、假设险验、决策理论、贝叶斯统计、半参数和非参数统计、序贯分析、多元统计分析、时间序列分析、小样本理论和大样本理论等。在数据分析中,现今的统计方法基本以结构化数据为主要处理对象,而对非结构化和半结构化数据的分析和工具涉及较少。因此,现今统计学课程及内容已不能满足从事非结构型和半结构型的大数据研究和商业应用对人才培养的需要,必须进行必要的改革。

对于教育方式,鉴于大数据时代要求,统计分析人员需要具备较高的数学和现代统计学基础,具有较高的软件操作能力,掌握一定的大数据收集、整理、分析、处理和挖掘数据的技能。日本学者城田真琴认为:“数据科学家要有计算机科学专业背景,数学、统计方面的素养和使用数据挖掘软件的技能,善于利用数据可视化的手法展现晦涩难懂的信息,而且具备相应的专业知识、眼界和视野,具有适应社会发展和创造价值的能力”。现今的统计学教育方式还不能很好适应大数据时代数据科学人才培养需要,必须进行必要及时的调整和变革。

对人才培养模式,大数据时代不仅要求培养具有数据处理和分析所需的基本素质与技能,更重视培养从海量数据中发现和挖掘价值信息、把握市场机遇、创造利润的潜在能力。面对大数据时代的诸多挑战,现代统计技术、数据挖掘方法、计算机信息技术、软件工具和理念的日新月异,培养统计人才的教育模式也需要相应变化,统计学教育只有与时俱进,主动做出全面的调整和变革才能适应新时代知识进步和激烈人才市场竞争的需要,积极迎接大数据时代的挑战。

大数据时代对统计学教师有更高的要求,统计学教师需要与时俱进,跟上时代步伐。随着互联网、物联网、云计算等信息技术的发展,对数据的分析和处理的技术也随之要求更高,统计学教师固有的知识体系已不能满足培养现代统计人才的需要,必须进一步深化和更新原有的统计学理论知识,而且还需要学习掌握计算机技术、互联网、数据库和信息科学等有关知识和技术,同时还要熟悉处理非结构型和半结构型数据的知识和技能,以适应现代统计学教育对教师的知识结构和基本素质的要求。

大数据时代对统计专业的学生也提出了更高的要求,他们不仅需要掌握现代统计理论、统计方法和专业统计软件,还要学会如何分析、处理来自互联网或各种实际问题中的海量数据,如何利用统计软件和互联网技术进行数据操作,如何借助软件技术和统计准则判断数据质量,如何进行模型选择和评价模型方法的有效性,如何准确清晰地呈现统计分析结果和结论,等等。

2014年11月,美国统计学会了统计学本科专业指导性教学纲要 [7],该教学纲要对统计学专业提出四个方面的要求:(1)具有扎实的数学和统计学基础、强大的统计计算和编程能力,熟练使用统计软件和数据库;(2)分析来自现实问题的真实数据,真实数据是统计专业教育的重要组成部分;(3)掌握多样化的统计模型方法;(4)具有通过语言、图表和动画等方式解释数据分析结果的能力。美国是统计学教育和人才培养最先进的国家之一,该指导性教学纲要代表着美国统计学专业培养人才的基本要求和发展方向,对我国统计教育的改革具有重要的参考价值。以该指导性教学纲要为参考依据,对照我国目前的统计学本科专业教育,无论是在培养目标和课程设置方面,还是在教学内容和教学方法方面,都存在着亟待解决的挑战性问题。

三、统计学教育的改革

大数据时代的统计学教育不仅是各种统计方法、数据挖掘方法和信息技术手段的延续或发展,更主要的是这些方法的集成应用和在实际数据分析中的真实体验。过去,企业数据库价格昂贵,在统计学教育的教学案例或实验课教学中,很少采用真实和海量的数据库资源,基本都是采用过时或虚拟的数据。今天,像百度大数据引擎这样的数据库的逐步对外开放,将有助于开展“线上大数据统计实验”教学。为了适应大数据时代要求,有必要利用网络资源以及各种数据处理软件,搭建线上大数据分析实验教学平台,全面开展大数据统计实验教学的改革。实际上,借助大数据分析平台,本科阶段的统计学教育就可以融人联机分析和数据的可视化教学。其次,要时刻关注大数据分析理论的进展,及时将新理论新方法融入课堂教学内容。

需要指出的是,在大数据时代,经典统计理论和方法并没有过时,但需要进行改进和进一步发展。这是因为,网上采集的巨型数据集往往存在大量的重复性和无价值数据信息,使得大数据价值密度降低。在对这些数据进行分析处理之前往往需要通过去噪、分层、截断、聚类等方法的预处理,将其变成便于进行分析处理的小数据,继而借助于经典统计方法进行分析和处理。因而在大数据时代仍然需要采用传统统计学的小样本理论和方法。所以,即便是在大数据时代,经典统计方法仍然是进行统计分析的基石,其核心地位不可动摇。所以,在大数据时代仍然要强化统计学的基本理论和方法,尤其是在长期发展和实践应用中经过验证的、成熟有效的经典和现代统计方法,在大数据时代仍然没有过时,但需要结合大数据分析的需要对经典统计方法进行必要的发展和改进。

大数据科学需要统计学与数学、计算机等学科的结合。亚马逊大数据科学家John Rauser 认为:“数据科学家是统计学家和计算机工程师的结合体”。为了满足大数据时代的要求,统计学专业的课程设置需要进行必要的调整。应根据新时代人才培养的要求,增设与大数据前沿领域发展相关的课程,如计算机网络和大数据相关的软件应用,同时要加大实验课和社会实践课的比重,引导学生理解和掌握大数据概念、理论、技术和方法,培养其运用大数据的相关分析工具解决实际问题的能力。对于理论课程,除基本统计理论外,还应开设一些较为现代和深入的课程,如现代贝叶斯方法、神经网络、数据挖掘、应用随机过程论等。另外,还应开设与大数据分析相关的关联规则、决策树、机器学习、支持向量机等课程。

为了培养与时代适应的统计学人才,统计学专业教师应不断更新自身的知识结构和价值观念,改变认识数据、收集数据和分析数据的思维,主动学习和补充互联网、现代数据分析技术、数据库和数据挖掘技术,使自己的知识体系不断更新和提升,跟上时展的步伐。

在大数据时代,要注意培养学生适应社会的能力。统计专业人才培养模式应以提高本专业学生数据分析方面的能力,开阔他们的视野,培养其适应社会的能力。应积极引导学生进入实训场所动手操作和锻炼,尝试以企事业单位的财政、金融、保险、统计、咨询和信息公司等部门为主构建专业性教育实践基地。鼓励学生到大数据相关的机构部门、产业园区和企业中去调查研究和实践。此外,统计专业应积极同其他专业进行合作,联合培养适应新时代要求的数据分析人才。鉴于大数据对数据分析人员在计算机技术、行业认知、业务知识、数据分析工具和方法的要求提高,统计学科应主动与计算机、经济学、管理学等相关学科合作,培养学生的计算机能力、专业素质和业务修养。

“它山之石可以攻玉”,关于统计学专业的课程设置,可以参考和借鉴美国统计学会公布的统计学本科专业指导性教学纲要。根据该教学纲要,统计专业的课程设置应该涵盖五个模块[7]:(1)统计方法与统计理论。建立统计模型并对模型的输出结果进行评价,熟悉统计推断,能够从数据分析中得出恰当的结论。(2)数据操作和统计计算。熟练使用一款专业统计软件进行探索性数据分析,发现和清洗数据中的错误记录,具有编程能力和算法思维,可以进行各种数据操作,还应掌握统计计算技术,能够进行模拟研究。(3)数学基础。熟练掌握微积分、线性代数、矩阵论、概率论和数理统计的基础知识。(4)实践训练和表达能力。具有良好的表达和交流能力,善于通过图示和动画等听众易于理解的方式展示分析结论,并且具有团队合作精神和项目领导能力。(5)特定领域的知识。掌握特定应用领域的知识,并用统计学特有的思维方法来分析和解决特定领域的实际问题。

大数据时代是以数据为中心的时代,统计学专业的教育改革必须适应这个时代的要求。统计数据分析中软件应用能力至关重要。在众多统计软件中推荐使用R和SAS软件,因为R是免费开源软件,其统计建模、统计计算和可视化功能强大,更新迅速,是最新统计方法的主要平台,非常有利于培养学生的编程能力和知识更新能力,而SAS软件被很多公司用于数据管理和数据分析,在实际应用领域具有长期而深远的影响,是数据分析不可或缺的专业统计软件。当然,教学中也可以尝试使用其他专业统计软件,例如经济统计专业学生也可使用SPSS软件,但最好会使用SAS或R软件。在加强软件使用和编程能力的基础上,应加强学生统计计算和统计模拟能力的培养。在大数据时代,强调统计计算的重要性是大势所趋。统计模拟技术是伴随着高速计算机和信息技术的快速发展而广泛应用的现代技术,可用来解决传统学科领域中无法解决的问题。例如,在计算技术飞速发展的今天,贝叶斯统计方法过去曾经面临的计算瓶颈正在逐渐消失,基于马尔科夫链蒙特卡洛(MCMC)技术的统计模拟方法在数据分析中的强大威力正在日益显现[8]。

参考文献:

[1] 刘春杰,大数据时代对当代统计学教育的挑战,统计与决策,2015年,第8期。

[2] 孟生旺,袁卫,大数据时代的统计教育,统计研究,2015年,第32卷4期。

[3] 葛虹,韩伟,大数据时代统计教育变革的SWOT分析与发展策略,统计与决策,2015年,第4期。

[4] 张海波,黄世祥,统计学专业学生大数据分析能力的培养方式选择,统计与决策,2014年,第24期。

[5] 李卫东,大数据对统计学科发展的影响,统计与决策,2014年,第13.期。

[6] 教育部高等学校统计类专业教学指导委员会.统计学专业教学单位.http:///category/信息公开/教学单位,2013-11-15.

数据分析统计学方法篇(2)

关键词:数理统计;国际关系研究;定量分析

一、数理统计分析的目的与意义

数理统计就是通过对随机现象有限次的观测或试验所得数据进行归纳,找出这有限数据的内在数量规律性,并据此对整体相应现象的数量规律性做出推断或判断的一门学科。它不仅可以对所需研究的内容进行描述与分析,还可以对已有命题进行验证,是应用数学在自然科学和社会科学中的重要应用方法。目前,中国的国际关系研究,主流的理论研究方法仍然是历史的和逻辑的方法,其他的一些方法如系统论、计量分析、社会学、心理学等则极少在国际关系理论研究中出现 。因此运用数理统计进行国际关系研究还有待进一步探讨。

在国际关系研究中,数理统计分析可以对国际关系中的某类具体事件或事实进行分析和检验,比如利用各类统计数据对国家的综合实力进行比较研究和分类研究、对影响一国外交政策的影响因素进行检验以及对国际冲突行为进行研究等。而统计分析的方式主要有两种,一是运用较大样本数据进行统计描述,二是运用来自部分样本的数据进行统计推论。

二、数据来源

国际关系领域的定量数据,种类繁多,涉及政治、经济、军事、社会、地理等等各种类别,这些量化数据对于国际关系的定量研究具有重要的利用价值。刘丰、陈冲(2011)对国际关系的定量数据进行了划分,他们把国际关系研究的定量数据分为:冲突数据、国际经济政治地理数据、组织数据和调查数据等几种主要类型,并对每一种数据的获取及信息作了详细的介绍,比较可靠。郭锐、王箫轲(2011)提出中国建立国际关系定量数据库的建议,具有开拓意义。国际关系领域的数据类型较多,按照数据来源,可以分为三类:官方数据;研究机构数据;新闻媒体数据等。

第一类,官方数据主要是指各国政府和国际组织公布的相关国际关系类型的数据。比如在中国国家统计局网站上公布的世界各国主要的经济和社会发展数据;美国美国国际开发署公布的历年美国对外援助数据;世界银行网站公布的世界各国经济社会发展指标数据;国际货币基金组织网站公布的国际金融统计数据等。这些官方网站公布的数据可信度高,可以直接利用进行各种分析研究。

第二类,数据来源是一些国际关系领域研究机构所的数据,这些数据有些是历史收集整理的数据,有些是采访调查的一手数据,这类数据专业性和针对性强,具有重大参考和利用价值。如密歇根大学国际政治学教授J. David Singer1963年开始组建的“战争相关指数(Correlates of War,COW)”项目,其中的国际军事争端数据(MID Data)可以免费下载使用。美国国际和平科学学会(The Peace Science Society International,PSSI)的“国家间军事争端(Militarized Interstate Disputes,MID)”数据库。

第三类,数据来源于新闻媒体的数据。新闻媒体十分关注一国的对外政策,对公众舆论也有塑造额引导作用。美国众多新闻媒体都热衷于进行各种社会调查、民意测验(public opinion poll),以此来了解“舆情”,顺应“民意”。自1935年美国心理学家G.H.盖洛普创立美国舆论研究所开始,民意测验便广为流行。现在媒体也广泛参与到民意活动中来,主要的民意测验机构有专业的盖洛普公司(Gallup Inc)、皮尤研究中心(Pew Research Center)、哈里斯民意测验(Harris Interactive)等。新闻媒体类往往进行一些民意调查,以了解民众对外部世界的态度,比如对中国崛起的态度。这些机构的网站上都会公布他们民意测验的结果数据,具有较高利用价值。

三、数理分析应用

定量分析大都属于专家评估类型,通常是在确定研究内容之后,对需要量化的数据,根据事实由专家进行赋值。比如,而不同的专家学者对不同的事件所赋的分值则会有差异,因此会带有一定的主观性。但是有些直接由数理统计分析软件进行分析或检验的定量分析数据则可以排除主观的偏见或不足。如秦亚青在《霸权体系与国际冲突》一文中就利用已有的国际冲突数据和国力数据,利用数理统计分析,得出分析结果检验命题:霸权与大国间冲突频率的关系。

目前,在国际关系研究中,统计分析主要是统计描述和统计推论。统计描述,主要是对所收集的相关数据进行频数分析、集中趋势分析、离散程度分析等。统计推论不仅有相关分析、回归分析还有聚类分析、主成分分析、时间序列分析等。数理统计分析通常需要相应的软件,Excel可以进行一些简单的频数统计和图形生成,复杂的统计推论分析的软件如SPSS、SAS、STATA、DPS、Matlab等也应用较多。统计推论是比较复杂的数理统计分析过程,相关分析和回归分析是在国际关系研究中比较普遍使用的方法,下面介绍几种其他方法:

主成分分析法,是指在众多因子中找出主要因子,以便对事件进行更容易操作的方法。比如要评估一个国家的综合国力会有许多因子,包括:经济实力、军事实力、人口数量、国土面积、资源储量、科技实力、文化实力等等许多因子,这个时候如果要求评估准确,面面俱到则很难操作,因为有些数据是无法量化的,数据众多,操作起来便很困难。而更为精确的方法是,可以采用SPSS分析软件对各数据进行主成分分析以确定决定综合国力的主要因子和次要因子。

聚类分析法,聚类分析的基本原理,根据样本自身的属性,用数学方法按照其某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。在国际关系中应用,谱系聚类方法可以把不同的国家类型按照不同的要素进行排列分类。如按照发动战争的次数分为好战国家、非好战国家;按照国家实力大小,将国家按照不同层次进行聚类。而这种聚类可以采用把所采集的数据导入计算机里进行聚类,得出一系列有用的结论。

四、总结

数理统计分析作为一种应用数学分析工具,对于更加准确地去描述和分析国际关系中的具体事物和事件具有一定功效。而当下,中国在国际关系领域中的定量分析研究明显不足,在国际关系研究中还略显不足,有待进一步的挖掘。由于数理统计研究需要用到很多定量数据,而中国在这方面又做的十分不足,没有建立一个数据库,因此只能利用国外已有的数据库,这无疑限制了我们的研究范围,不可长久。因此,为建立中国的国际关系学派,需要在这方面做一些有用的尝试。而另一方面,目前国际关系研究还是集中于统计描述,而在统计推论中也多采用相关分析和回归分析,许多其他的研究方法也不被运用,比如时间序列分析、主成分分析、谱系聚类分析以及一些预测性方法都运用不足,有待于进一步发展。(作者单位:贵州财经大学国际经济学院)

参考文献:

数据分析统计学方法篇(3)

一、数据分析观念的内涵

(一)《标准》中“数据分析观念”的主要内涵

1.了解在现实生活中处理很多问题时,应当先做调查研究,收集数据,再通过分析进行判断,明确数据中蕴含的信息。这一描述强调了确立统计意识是培养数据分析观念的前提。面对复杂的现实情境,学生要从数据中提取有用的信息,必须具备数据意识,意识到数据包含有所需要的信息,同时也要具备数据分析意识,知道只有通过分析数据,才能挖掘出数据中所蕴含的丰富信息。

2.了解对于同样的数据有多种分析方法,需要根据问题的背景选择合适的分析方法。数据中所蕴含的情境性,是数据与数字的最大区别,这也使得在各种问题情境中所收集到的数据有可能相似,但采用的分析方法却大相径庭。不同的数据分析方法不能简单地用“对”与“错”来评判,只有“合适”与“不合适”。同样的数据,因为研究的问题和目标不同,所以选择的分析方法也不同,决策者要根据具体的情境和期待的结果作出正确的选择。

3.通过数据分析体验随机性:一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。[1]这说明数据具有随机性的特点,但是通过大量的实验可以发现,数据又呈现出一定的规律性。数据分析是在大量的甚至无限次的实验的基础上作出相应的数理统计的过程,而每一次实验都存在随机性,无法保证实验结果一定准确无误,这是数据出现随机性的原因。

分析《标准》中关于“数据分析观念”的阐述可以知道,针对义务教育阶段统计教学如何培养学生的数据分析观念,《标准》提出了3个方面的要求:一是过程性的规定,即数据分析观念是在学生调查、收集和整理数据的过程中发展起来的,并在分析的基础上作出相应的决策;二是方法性的规定,即面对不同情境的问题,如何选择恰当的、合理的解决方法;三是感悟性的规定,即让学生从中体会数据的随机性和规律性特点。

(二)关于内涵解读的研究

“统计是关于收集和分析带有随机性误差的数据的科学和艺术。”[2]y计的对象――数据,是统计研究的基础。正如美国统计学家戴维・S・穆尔所说:“统计是用来处理数据的。数据由数字组成,但它不仅是单纯的数字。数据是有内容的数字。”[3]小学阶段的统计学习正是探讨这些具有一定实际背景的数字,教学时教师需要将其与学生熟悉的“数与代数”中那些单纯的数字进行区分,帮助学生认识统计的特殊性。

数据分析观念是数据意识、统计技能的统一体。在现实生活中,数据意识体现在,当遇到问题时能够想到进行调查研究,用数据说话,运用统计的方法解决问题。数据意识是统计活动的起点,也是统计教学的核心内容。统计技能是完成统计活动所必需的各种能力和技术的总和,它包括数据的收集、整理和分析,从数据中提取有价值的信息,进而作出决策。因此,数据分析观念也可以划分为3个维度:一是认识到需要收集数据,这包括3个要素,即有数据意识、发现和提出运用数据解决问题、根据问题的需要设计收集数据的计划;二是了解数据中蕴含的信息,也包括3个要素,即从数据中提取信息、通过分析数据进行判断、选择恰当的统计方法;三是体会数据的随机性特点,认识到所收集的数据是随机的,但数据较多时会呈现某种稳定性和规律性。

尽管表述方式不同,但学者们都把数据分析作为统计内容的核心,并一致强调数据的现实背景来源,具体表现为:①数据分析应当建立在统计的基础之上;②应当选取合适的方法对收集到的数据进行分析和处理;③根据已经整理好的数据作出解释、得出结论,运用数据进行推断,在推断的过程中还要对数据的来源、处理方法和分析结果进行合理的质疑。

二、数据分析观念的教育价值

在知识经济和信息技术时代,加强数据分析观念的培养是新时代对人才的要求。可见,数据分析观念是义务教育阶段学生必备的数学素养之一。

(一)结合数据的情境性激发数据意识

在信息化社会中,无论是人口预测、投资贷款、风险评估、市场预测,还是学生学习统计与概率的知识,都需要数据分析观念的指导,而数据意识更是发挥着重要的作用。数据分析观念并非简单的汇拢数字、计算平均数和众数、画统计图,而是人们在经历调查行动后形成的对事物加以整理和分析的意识。所谓数据意识,是指遇到现实情境问题时能够想到用数据来解决问题,将现实情境中遇到的问题转化为数据问题。

例如,小红、小明的10次射击训练成绩(环数)如下:

如果你是教练,会选择谁参加比赛呢?遇到这样的问题,学生首先会计算小红和小明射击训练成绩(环数)的平均数,这时会发现两人射击训练成绩(环数)的平均数相同,于是产生疑问:那要根据什么进行选择呢?小学生虽然还没有接触方差等概念,但利用众数和折线图的陡缓程度能够初步判断谁的射击训练成绩(环数)更稳定、更有潜力。如果教师对学生进行过相关的训练,在看到一组数据时,学生就会有意识地对数据进行分析,从而发展数据意识,那么,今后遇到类似的问题时就能够自觉地运用学到的知识和技能对数据进行处理和分析了。

(二)在统计活动中体验和发展随机性思维

在生活与工作中,人们必须掌握处理不确定性现象的概率统计知识,具备一定的数据分析意识与数据处理能力,只有这样,才能在面对大量的、不确定的数据信息时作出正确的选择。小学生在学习“统计与概率”之前就已经掌握了数与代数、图形与几何等内容,具备了以逻辑推理为主的确定性思维,在学习统计与概率的内容时,教师要让学生知道事物的发展既有偶然性又有规律性,从而形成数据分析观念和随机性观念。

例如,一个不透明的袋子中装着若干个红球和蓝球,事先不告诉学生红球和蓝球的数量,而是让学生重复摸取、放回,进行多次实验。在活动中我们发现:每次摸取球的颜色可能不一样,但是随着摸取球的次数的增加,就会发现一些规律。学生在摸球过程中理解了随机的概念,体验到了随机知识在生活中的应用,进而意识到学习随机性的意义。

(三)亲历问题解决过程,训练思维的灵活性

数学思维的灵活性是需要重点培养的思维品质之一,而这需要学生在解决数学问题的过程中获得锻炼和发展。比如,教师可以设计一些有效的统计活动,鼓励学生采用不同的统计方法,从多角度对数据进行分析,发散学生的思维,并根据情境的变换及时调整解决问题的思维方向,引导学生学会解决不同情境的实际问题。

例如,教师可以创设这样的情境:假设学生是任教五(1)班和五(2)班的数学老师,期末总结时要对自己任教的这两个班级的期末成绩进行比较。在这个过程中,教师应当引导学生按照不同的标准来评判两个班级的数学成绩。这时我们会发现:有的学生依据两个班级各自的数学平均分进行比较;有的学生依据85分及以上为优秀这个标准,先统计出两个班级获得85分及以上的学生各有多少人,然后分别计算出两个班级的优秀率,再进行比较分析;有的学生依据60分以下为不合格的标准,统计出两个班级不合格的人数,按照不合格人数的数量比较两个班级数学成绩的优劣。其实,这里的答案并不唯一,每一种答案都可以作为教师分析学生成绩的标准。因此,教师应当鼓励学生进行多维度思考,训练学生思维的灵活性。

三、稻莘治龉勰畹呐嘌策略

数据分析观念不是凭空想象出来的,也不是教师说统计有用,学生就能够体会得到的,更不是凭借收集数据就可以形成的,而是学生在经历统计活动解决问题的过程中建立起来的一种认识。从某种意义上说,观念是意识的高级阶段,是在意识、能力的基础上形成的认识。培养学生的数据分析观念是一个循序渐进的过程,教师必须根据学生的认知特点设计教学。

(一)引导学生树立统计思想

数据分析观念是统计思想的重要组成部分,要让小学生树立统计思想,教师首先要让学生意识到统计的必要性,重视统计的应用。课堂上,教师可以向学生展示生活中与统计相关的事例,指导学生学会判断在什么情况下需要采取统计的方法解决问题,并自觉地朝着统计这个方向思考问题。其次,学生具备了统计意识后,教师要让学生掌握具体的统计方法和策略,以便更好地进行数据分析。需要注意的是,面对不同的问题要采取不同的统计方法。

例如,调查统计“我们最爱吃的水果”,教师可以创设生活情境:生活老师要为同学们准备课间水果,准备哪些水果比较合适呢?首先,生活老师需要了解全班同学的喜好,为此必须采用统计的方法,设计统计方案。其次,当收集到所有数据之后,为了确定哪一种水果最受欢迎,必须采用合适的统计方法进行统计,比如可以采取扇形图对水果进行分类;至于每一种水果需要的数量是多少,则应当再次根据前期的数据调查进行分析。

(二)体验数据分析的全过程

学生要将数据分析观念真正地纳入已有的思维模式中,最有效的方法就是经历数据分析的整个过程,包括发现问题、提出问题、调查现状、收集数据、整理分析、得出结论以及反思交流。小学生抽象思维尚未成熟,接触的数据都应源于现实生活背景,只有丰富的数学情境才能够帮助他们更好地理解概念,并学会迁移应用。因此,教师应当充分挖掘贴近学生生活的情境资源,创设学生感兴趣的问题情境。

以估计全校学生上个月家庭用电情况为例,如果对全校每个学生都进行调查,有点不切实际,浪费时间和精力。当学生碰到这个问题时,教师可以渗透抽样统计的方法,选取每个年级段的一个班级进行调查,收集数据。在这个活动中,如何利用收集到的数据对全校学生进行合理的估计,学生需要具备较强的数据分析能力。教师可以通过这个活动,发展学生的数据分析能力。学生掌握了基本的统计方法,经历了调查研究、整理数据、分析数据的过程,将会逐步形成数据分析的观念。

(三)培养批判意识,提高辨别能力

在信息社会,人们每天都要接触大量的数据信息,其中绝大多数是无用的信息或伪信息。辨别信息的真伪并作出理智的选择,离不开批判意识和辨别能力。培养学生的批判性分析能力,教师要引导学生读懂数据,理解数据内在的含义,并对数据的来源和处理方法进行考察和分析。小学生心智发展尚未成熟,加上认知发展水平还处于具体运算阶段,对于外界复杂的信息缺乏理性的判断,因此,教师可以呈现案例,如生活中误用或滥用统计数据的现象但大多数人对此并未警觉或质疑,从而培养学生的批判意识,提高辨别能力。

例如,超市为了促销牛奶,打出的广告是第二箱半价。如果不加思索,消费者就会认为很实惠,马上买了两箱牛奶。但仔细思考发现,两箱牛奶的平均价格和促销前其实只相差几毛钱而已,这是因为,消费者只注意到半价,而并没有留意到第一箱牛奶的价钱。又如,超市有两种不同品牌的商品,甲品牌打八五折,乙品牌买满150元送50元,我们应该怎么选择呢?面对这样的问题,我们不能凭感觉乱猜,而要根据不同的需求量进行分析。诸如此类的实例都是小学生在日常生活中常常会遇到的,学生要作出理性的选择与判断,必须具备质疑能力和一定的数据分析能力。

(四)合理利用信息技术

小学生每天大部分时间都在学校度过,接触外界事物的机会不多,而数据分析观念的培养又需要呈现大量的真实的生活情境,让学生对数据进行整理、分析和判断,信息技术正好可以弥补这一缺陷。教师可以利用信息技术的优势给学生呈现更多的生活实例。另外,当碰到需要分析大数据或需要多次实验才能够解决的统计问题时,教师可以利用信息技术对原始数据及分析结果进行直观展示,这样做有助于学生理解统计过程及其内涵。

例如,调查分析全班学生对颜色的喜好情况,教师可以借助信息技术,让学生先在电脑中输入自己最喜爱的一种颜色。待全部学生输入完毕,电脑便会自动生成全班学生对颜色喜好的原始数据。接下来,学生就要对这些原始数据进行分类、整理,再通过电脑将整理后的数据生成不同的统计图表,并依据这些图表分析学生对颜色的喜好情况。在这个过程中,教师利用信息技术不仅节省了宝贵的教学时间,将数据的收集、整理和绘制统计图表生动形象地展示在学生面前,而且帮助学生经历了数据的收集、整理及图表绘制的过程。

参考文献:

[1]中华人民共和国教育部.义务教育数学课程标准(2011年版)[S].北京:北京师范大学出版社,2012:6.

[2]陈希孺.机会的数学[M].北京:清华大学出版社,2000:58.

[3](美)戴维・S・穆尔,郑惟厚译.统计学的世界[M].北京:中信出版社,2003:4.

数据分析统计学方法篇(4)

 统计学是经济管理类专业必修的专业基础课。统计学课程的教学目的在于培养学生的统计思维,掌握理解统计基本技能,培养学生统计分析、解决实际问题的能力。因此,在统计学理论教学基础上,通过实验教学,既可以巩固所学的理论知识,也可以培养以定量分析为特征的统计思维能力,提高学生分析和解决问题的综合能力。

一、统计学实验课程教学开设的必要性

(一)统计学的课程性质要求开展实验教学。统计学作为探索和研究经济现象的数量关系的重要方法和手段的专业基础课程,其教学内容包括统计数据搜集、统计数据整理和显示、数据的概括性度量、概率及概率分布、抽样推断和参数估计、假设检验、方差分析、时间数列分析、统计指数和因素分析、相关与回归分析和统计预测与决策等内容。在统计学课程的学习、应用过程中,学生需要学习处理大量的数据,利用各种统计图形、表及统计模型,探索出数据中内在的数量规律性,这使得统计学需要实验教学,使理论教学与实验教学相结合,让学生学会处理日益复杂、精确的模型,对实际中各领域的问题进行正确的统计分析。

(二)实验教学可以激发学生学习统计学课程的兴趣。统计学实验教学可以让学生利用统计软件将枯燥、乏味的数据用各种形象、生动的统计图表显示出来,达到活跃教学气氛,激发学习兴趣,提高学习效率的效果。统计学实验教学内容可以结合现实社会经济问题和学生的专业背景,不仅可以调动学生的参与意识,而且有利于提高对教学内容的理解和消化吸收,增强学生解决实际问题的能力。

(三)可以培养学生实践能力和创新能力。培养学生的实践能力和创新能力是统计学教学的基本要求,统计理论知识的学习需要通过实验课让学生将统计理论应用到实际问题当中,在实验中加深对统计理论和方法的理解,增强学生运用统计方法的创新意识。统计实验教学一般采用计算机加统计软件包的教学方式,不仅可以使教学内容更加深入、生动和更全面,还可以使学生在宽松的环境下认知统计应用的实质,提高统计学的教学效果。

(四)可以促进教师统计学理论教学水平的提高。通过统计学实验教学,可以将统计理论知识和使用方法应用于实际问题的解决,从而将统计方法、统计软件包、实际数据以及相关领域专业知识结合起来。统计学实验教学改变了教学形式,这就要求教师对实验教学的内容、工具、方法进行深入研究,把统计理论与实际应用相结合,提高自身的业务能力,从而促进教师教学水平和应用研究水平的提升。

二、统计学实验课程内容设计

统计学课程实验项目包括三种类型,分别是验证型实验、设计型实验和综合型实验,验证型实验主要是让学生使用统计基本概念、方法来分析和处理统计数据,可以用于强化学生对基本概念、思想和统计方法的理解与掌握。设计型实验是训练学生使用计算机和统计软件等工具实现统计方法,通过分析具体的案例,使学生能够运用统计思想、方法,设计出解决问题的步骤并进行相应实验操作。综合型实验是训练学生综合应用统计方法及统计软件等工具来分析、解决实际问题的能力,可以让学生在社会实践活动中,结合自身专业方向进行问题收集、整理资料,利用软件进行具体分析操作,并对计算机输出结果加以解释说明。

(一)验证型实验

1、统计数据的整理与显示。实验内容主要有数据排序,频数分布表的编制,条形图、圆形图、圆环图、箱线图、茎叶图、直方图、折线图和累计折线图等数据的直观显示。

2、统计数据的基本统计分析。实验内容包括计算描述数据分布特征的测度值,主要有描述数据集中趋势的测度值,如算术平均数、众数、中位数等;描述数据离散程度的测度值,如极大值、极小值、四分位数、标准差(方差)、离散系数等;描述数据分布程度的测度值,如偏度系数、峰度系数等。

3、统计数据的参数检验与方差分析。实验内容主要包括单样本t检验、独立样本t检验和配对样本t检验、单因素方差分析、多因素方差分析等。

4、统计数据的相关与回归分析。实验内容主要是利用统计软件绘制变量数据的相关散点图、计算相关系数等方法分析变量之间的相关关系,并根据数据构建回归方程,对回归方程进行统计检验,利用回归方程分析解决实际问题等。

5、统计数据时间序列分析。实验内容包括时间序列逐期增长量和累计增长量的计算,时间序列定基、环比发展速度的计算,用移动平均法、最小二乘法对时间序列的趋势进行测度等,用季节比率法测度时间序列的季节指数等。

6、统计指数的编制实验。利用平均指标指数的技术公式,根据所给数据资料,编制居民消费价格指

转贴于 http://

数。

(二)设计型实验。抽样调查设计实验:根据提供的资料,运用统计软件对研究对象进行不同组织形式的抽样,计算其抽样误差,并对总体参数做出一定可靠程度的估计。

(三)综合型实验。根据学生兴趣,制定统计调查方案;完成该问题调查问卷的设计,并进行问卷调查;利用统计分析软件对采集的信息录入、整理、分析;写出3,000字以上的统计调查报告,要求根据处理后的数据信息,分析存在的问题,提出有效的解决方案。

三、统计学实验课程教学设计

(一)实验课程软件选择。统计学实验课程可以使用的统计软件很多,如sas、eviews、excel、spss等软件。sas软件在设计上也是完全针对专业用户进行设计,操作以编程为主,非统计专业人员掌握起来较为困难。eviews主要运用于经济计量模型的设立、估计、检验和应用等,掌握和熟练使用该软件需要专门的训练和较长时间的摸索。excel提供包括数据管理、描述统计、概率计算、假设检验、方差分析和回归分析等统计分析功能,但是没有直接提供箱线图、茎叶图、无交互作用可重复的双因素方差分析、方差分析中的多重比较、非参数检验、质量控制图等方法。spss是应用最广泛的专业统计软件,它的操作界面极为友好,窗口方式展示各种管理和分析数据方法的功能,只要掌握一定的windows操作技能,粗通统计分析原理,就可以使用该软件。因此,统计学实验课程教学中采用spss软件,就可以满足统计学实验教学的需要。

(二)实验教学的组织形式与教学要求

1、实验教学组织形式。实验教学的组织形式采取实验与理论课穿插进行,以理论教学的知识内容为基础,在理论教学完成后,进行相应的实验教学,使学生将理论教学中所学知识利用spss软件进行计算与验证。实验课以学生自己动手为主,教师运用多媒体课件讲授实验的指导内容,并进行现场的指导和点评,加深学生对相关理论知识的认识和理解。

2、实验教学要求。(1)学生要掌握spss软件的基本统计分析功能,熟悉spss软件的基本操作,利用spss软件的基本统计分析功能完成相应问题数据的分析;(2)学生要熟练地掌握spss软件统计分析功能的基本结构及对其分析结果的解释,特别是对实际问题统计分析结果的经济学解释;(3)学生要掌握统计学案例分析。课余时间进行统计案例的设计、资料的收集、讨论,对经济数据的分析与整理,做成相关的数据分析表,在实验课堂上进行示范、交流和讨论。

3、实验考核方法。统计学课程实验成绩以一定比例纳入总成绩,实验成绩由实验出勤、实验报告、上机测试三部分组成,具体通过实验报告体现。实验评分采用100分制:实验课考勤10分、实验状况25分、实验调查报告65分。学生每完成一个实验项目,根据上机操作结果撰写相应的实验报告,实验报告上应该注明实验目的、实验内容、实验准备、实验步骤、实验操作结果及分析、实验体会等项目。实验报告以书面形式提交,评分标准主要根据实验目的是否明确、操作步骤是否完整、实验结果及分析是否合理、实验报告格式是否规范等。

四、结论

实验教学是统计学课程教学的重要组成部分,实验教学的重点是利用统计软件,在统计基本理论、基本方法分析的基础上对统计数据的处理,使学生可以实现统计知识和技能解决实际问题。提高学生运用统计知识和计算机技术解决实际问题的能力,最终培养出适应经济管理需要、具有较强动手能力、创新意识和创新能力的高素质应用型人才。

主要参考文献:

数据分析统计学方法篇(5)

关键词:多元统计分析;教学内容;教学方法

中图分类号:G424.21 文献标识码:A 文章编号:

多元统计分析是统计学中的一个重要分支,是收集、处理和分析多维样本数据的统计方法。特别是随着计算机技术的发展,计算软件的普及,多元统计分析已成为分析多元数据的一个重要工具,在自然科学、管理和社会科学、经济领域等都有广泛的应用。

多元统计分析是我校财经管理类本科生大部分专业的一门必修课程,总学时为45学时,其中理论教学时数36学时,实践教学时数时。该课程涉及到许多数学知识,有大量的理论和公式推导,且计算量比较大。同时,本课程的学生为财经管理类的本科生,大多数学基础不好,且学生基础差异较大,部分学生感觉本门课程学习有困难。本文根据本学科的特点和学生的实际情况,结合自己从事多元统计教学的实践和体会,提出几点思考,以供同行参考,共同探讨。

一、重视统计方法的应用

针对财经管理类本科生数学基础较弱的情况,在教学过程中,理论推导部分不必讲解过多,也不应该过分强调复杂的数学证明和公式推导。对于多元统计分析的每一种统计方法,重点阐述它们的统计思想,结合实例介绍涉及到的背景,在实际应用中需要解决什么问题,如何用这种统计来解决这些问题,用了这种统计方法后可以得到什么结果。以及各种方法应用的前提条件、适用范围和局限性等,教学重点从理论转移到实际应用中。为了加深学生对概念的理解,适当做一些数学推导,可以省略复杂的证明。例如在聚类分析的教学中, 借助“物以类聚,人以群分”的道理给出了“就近原则”, 聚类分析的基本思想就容易被学生接受, 然后再逐步引入为了实现就近原则的度量远近的距离及各种具体聚类方法。学生在短时间内就对统计方法有了理解,效果非常明显。

二、重视各种多元统计方法的联系

各种多元统计分析方法虽各自具有不同的特点,但它们彼此之间均有着紧密的联系。在解决实际的问题中,也需要用多种方法结合起来解决问题,对于这一点一定要讲清楚。在聚类分析和判别分析的介绍中,我们介绍了在度量工具选择上两种方法的共同点。同时,聚类分析与判别分析有以下的不同点:①聚类分析可以对样本进行分类,也可以对指标进行分类;而判别分析只能对样本进行判别归类;②聚类分析事先不知道事物的类别,也不知道应分几类;而判别分析必须事先知道事物的类别;③聚类分析直接对样本进行分类,而判别分析根据训练样本建立判别函数,然后对新的观测对象进行判别归类。在实际问题处理中,针对聚类分析归类,判别分析分类的特点,常常将两种统计方法结合使用。在因子分析的基本思想、数学模型、因子载荷矩阵的估计方法、因子得分等几个环节的学习中, 我们随时将主成分分析的相关内容拿来与之比较分析, 分析了两种方法在模型、参数唯一性、取舍因子等问题上的不同与使用环境等方面的共同之处, 学生不仅对因子分析有了深入理解,而且对主成分分析的内容有所复习,更容易实现对着两种统计方法的掌握。

三、重视统计软件地使用

各种多元统计方法解决的是大量多维数据的分析问题,自然离不开复杂数据的计算,所以在教学中必须重视统计软件的学习,完成大量的计算过程。SPSS软件简单易学,操作方便、功能强大、应用广泛,可以进行大部分多元统计分析方法的操作,基本能满足教学和实践上计算的需要。且在多元统计分析课程之前,学生已学过SPSS课程,对软件的应用也基本掌握。在教学过程中,当介绍每一种统计方法的基本思想、原理后,先对教材上的已有详细步骤和结果的例题进行操作,使学生将统计软件操作结果与其进行比较。进一步要求学生针对某一专题或结合自身专业,对某一实际问题收集数据,整理数据,利用软件进行具体分析操作,得到自己需要的结果。但是在教学过程中,需要让学生知道统计软件只是一种分析工具, 重点还是掌握各种统计分析方法的基本原理和科学选用上。同时,结合自己的一些研究课题,与学生一起探讨、研究,培养学生初步的科研能力。

四、合理制定考试方式和内容, 科学评定学生成绩

针对多元统计分析课程的特点,本门课程考核不仅要注重基本知识点的掌握,也要包括各种统计方法的理解、分析和应用。在考试的方式上,可以采用闭卷考试,开卷考试和课程论文相结合,从而多角度、全方位对学生的学习成绩给予综合评价。通过以上多种方式,考察学生理解能力、跨学科综合能力、解决实际问题的能力及创新能力。在考试的内容上,闭卷考试着重考查学生对各种统计方法和理论知识的掌握程度,并对量不大的数据进行处理;开卷考试以学生上机操作的方式进行,着重考查学生利用统计软件处理多元数据的熟练程度,以及对统计软件输出结果进行分析判断和解释说明的统计素养;课程论文侧重于考查学生运用多元统计方法解决实际问题的能力及创新能力。总成绩则有闭卷考试成绩(占60%)、开卷考试(占20%)和课程论文成绩(占20%)三部分组成,从而科学评价学生对本门课程的掌握情况。

多元统计分析作为多元数据处理的一个重要工具, 必将随着社会的需要而不断的有广泛的应用。多元统计分析教学模式的选择必须根据教学的需要和学生的实际接受水平发生改变。而作为教师,需要不断地总结经验,完善自己的教学,不懈努力,传授给学生正确的统计思想, 实用的统计方法和综合的统计能力。

参考文献:

1何晓群. 多元统计分析[M]. 中国人民大学出版社,2012.

2任雪松,于秀林. 多元统计分析[M]. 中国统计出版社,2011.

3苏金明,傅荣华等. 统计软件SPSS系列应用实战篇[M]. 北京: 电子工业出版社,2002.

4张文彤,邝春伟.SPSS统计分析基础教程[M]. 北京:高等教育出版社,2011.

5吕洁. 多元统计分析课程教学探讨[J].中国成人教育,2007 ( 8): 153- 154.

6陶胜,胡明颖. 多元统计分析课程教学研究与实践[J]. 集美大学学报, 2011( 2): 99- 102.

数据分析统计学方法篇(6)

关键词:生物统计学;教学方式;实践教学

中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2014)48-0145-03

生物统计学是数理统计在生物学中的应用,它是用数理统计的原理、方法来分析解释生物学中各种现象和实验调查资料的一门科学。生物统计学是本科生专业必修课,对提高学生的科研能力和综合素质有重要意义。生物统计学,不仅提供设计科学试验和收集数据的方法,而且也提供整理和分析数据、得出科学结论的方法。同时,生物统计学也是一门理论性和实践性较强的课程,课程内容广、概念多、公式多;加上学生缺乏背景知识,对该课程认识不够,使这门课程有教师难教,学生难学、难记、难用的“四难”课程之称[1,2]。从2012年开始,我校生物统计学教研组针对课程特点,重新确立了教学目标和教学计划,改进教学方式,增加学生上机操作训练,使学生由传统的学习统计基础知识向掌握具体数据处理和分析方法的目标上转变,将过去以笔试为主的考试方式转变为基础知识测试和统计分析方法应用相结合的考核制度,从源头上使教学模式向注重人才培养和提高学生科研素质上转变。经过教研组全体教师的努力,生物统计学的教学质量和教学水平得到了大幅提升。笔者根据两年来的生物统计学教学工作的实践,结合课程特点,对生物统计学课程教学方法的探索和实践作如下总结。

一、确立教学目标、调整教学计划

2012年前,我校生物统计学,主要由数学专业的老师进行讲授,教学内容以数理统计为主。学生学习本课程后,仍然无法将统计学这一工具应用于生物学的相关领域。针对这一情况,学院领导研究决定生物统计学这门课程由学院相关专业的教师授课,教研组接到通知后进行了研究部署。笔者在确立人才培养目标时,首先将生物统计学课程定义为工具课。在确保这一基础后,笔者根据我校本科生培养目标,将生物统计学的目标明确为:以一线教师和科研工作中最常用的统计分析方法为内容,要求学生了解现代科学研究的基本方法、统计学基本概念和主要参数的意义;理解生物学实验设计方法和常用统计模型的应用条件;掌握实验设计和统计分析方法,掌握EXCEL和STATISTICA软件操作方法,能够独立进行生物学试验结果的统计分析,并具有综合运用所学知识分析问题和解决问题的能力。

根据上述教学目标,笔者选择合适的课程教材,制定教学计划,将生物统计学的课程重心放在让学生了解统计学的一般原理和方法、掌握实验设计和数据分析的原理、掌握统计软件处理和分析数据的方法上。

二、优化教学内容,突出课程重点

教学内容贯穿整个教学过程,是人才培养的主要落脚点。生物统计学的教学内容非常庞杂,笔者根据教学目标和教学计划,将生物统计学课程进行了梳理,主要以一线教师和科研工作者最常用到的统计学知识为基础。教学内容,主要包括数据和数据类型、总体和样本、数据的描述性统计、概率和分布、统计推断、t检验、方差分析、数据转换、多重比较、相关和回归、因子分析、非参数检验、实验设计等。教学的重点,是让学生理解各种统计方法的使用条件和基本原理,通过在计算机上运行EXCEL和STATISTICA软件,结合生物学实例掌握各类统计模型和检验方法的具体操作步骤,得出统计检验结果,并根据实验数据运用已掌握的生物学原理解释实验数据所产生的科学意义。此外,我们在教学过程中,会将近年来生物学方面有重要意义的一些统计学方法和原理做简单的普及,如将系统发生关系纳入形态数据中,检验形态特征进化的谱系依赖性;利用不同地理种群的生活史特征和形态特征计算物种的表型分化,结合遗传分化数据分析物种分化的原因等。我们通过这样的方式,在学生心中埋下进一步学习统计学的种子,为他们以后的科研和学习提供帮助。从教学内容上,笔者将以往所注重的统计原理介绍和统计模型推导的部分转变为让学生理解统计模型的原理和应用条件,内容上侧重于让学生掌握统计分析方法的应用。因此,笔者在授课过程中,上机实习的学习时间约占整个课时的50%。根据人才培养目标,生物统计学课程重点要求学生掌握实验数据分析处理的一般方法,并利用EXCEL和STATISTICA软件综合分析数据并得出科学结论。教学过程中,笔者注重生物学实例教学,利用已发表文章的数据为训练内容,将课程所涉及的各类统计模型贯穿于实例教学中,使学生在学习理论知识的同时,将所学方法应用于实际科研项目中,激发学生学习的积极性和主动性。

三、“以学生为本”,优化教学方式

现代教学观念认为,课程是学生的发展,课程是教师与学生之间的契约[3]。这里体现了一种“以学生为本”的教学理念,传统教学较多地体现在对教师和教材的关注上,而“以学生为本”的教学思想,则更多地关注在课程教学活动过程中学生的参与和知识的获得,关注在课程教学过程中为学生创造出充满生机的学习、研究氛围,为学生提供张扬个性、充分发展的环境[4]。在“以学生为本”的教学思想指导下,针对生物统计学理论性较强,内容枯燥、乏味等特点,笔者在教学过程中,以多媒体教学为主,辅以传统的板书教学。教学过程,笔者为学生提供大量的实验数据,启发和引导学生主动挖掘数据,通过小组讨论等形式探究数据处理方式,应用已学习的统计模型分析实验数据并得出科学结论。

在教学过程中,将传统的教师讲授模式转变为教师讲授和实例教学相结合的模式,笔者将上课的地点安排在计算机机房进行,每次上课根据教学内容的不同设置1~2课时的实例教学。从应用统计方法解决实际科研问题的角度组织课堂教学,以小组的形式就某个实际问题展开讨论,教师的角色定位成课程组织者,充分调动学生学习的积极性和主动性。例如,我们在讲解t检验时,前1个课时,我们通过多媒体教学结合板书的形式讲解t检验的应用条件和计算原理;其余2个课时,我们提供一定的生物学实验和中学生考试成绩相关的数据,以小组讨论的方式要求学生对数据进行统计检验并得出科学结论。在学习相关与回归时,我们要求学生将生物化学实验和生态学实验的数据拿到生物统计学上进行统计检验,如分子量和电泳迁移距离的实验数据,可以用来检验蛋白质分子量和电泳迁移距离的相关性,并预测已知迁移距离的蛋白质分子的分子量;通过卡方检验验证果蝇杂交结果是否符合实验预期等。我们通过对自己实验数据的统计检验,让学生深刻体会到学习生物统计学的重要性,从而激发学习的主动性,变被动接受为主动学习和探究。

四、“学以致用”,加强实践教学

实践教学是高校实现人才培养目标的重要环节,是高校生物专业教育教学体系的重要组成部分,是培养学生专业技能及实践技能的重要途径。它对提高学生的综合素质,培养学生的创新能力,造就学生成为具有社会竞争力和国际竞争力的高素质人才具有特殊作用[5,6]。因此,笔者根据大学生人才培养目标,将生物统计学的教学内容融入到学生实践教学中。在教学过程中,我们将整个班级按照每6个人一个小组进行分组,在教授不同的教学内容时,给每组同学收集一定的数据,采用研究型教学的方式让学生根据已有的知识对数据进行分析和整理,并得出相应的统计结果。我们通过研究型教学的方式,可以使学生积极参与到教学和科研实践中,对提高学生利用生物统计学的原理解决实际生物学问题有积极的推动作用。

此外,笔者利用动物、植物和微生物野外实习和大学生创新训练等实践教学活动引导学生将所学的统计学知识应用到实际科研训练中。教师根据已学过的统计学原理组织和指导学生在开展野外调查和创新训练前,针对性地查阅文献、设计实验方案,学生在实习过程中根据已确定的实验方案进行数据的收集和采样工作,完成野外实践活动并获得相应实验数据后,对数据进行统计分析得出科学结论。我们通过完整的实验设计、获得数据、分析数据和得出结论等过程,使学生更好地掌握生物统计学这门工具课,提高学生的科研创新能力和综合素质。

五、注重实效,改革考核形式

考试是教育教学工作的重要环节,正确理解和掌握考试的目的对促进学生学习和改进教学工作、提高教学质量有重要意义。在以往的教学过程中,考试以笔试为主,考试内容主要偏重于概率论和统计学的原理和基本概念等,期末考试的成绩决定了这门课的最终成绩。在这种考试指挥棒的作用下,学生往往是平时松、考前紧,考后不复习。这种考试方式不能全面考查学生对各种统计分析方法的掌握和应用情况,同时也不利于学生形成良好的学习习惯,学习课程后也不能将具体的统计学方法应用到今后的科研或教学实践中。为了扭转这种局面,对学生进行准确、客观、公正地评定学习成绩和能力的改革势在必行。笔者根据人才培养目标,将课程最终考核成绩分为以下三个部分:平时成绩(占总成绩的40%,主要由出勤和课后作业成绩组成)、期末笔试成绩(占总成绩的24%,主要是生物统计学一些重要的概念和统计原理)和实验数据分析(占总成绩的36%,根据给定的实验数据,利用EXCEL和STATISTICA软件选择正确的统计分析方法,得出可靠的实验结论)。

在教研组实施上述教学改革后,我院学生应用统计学处理和解决科学问题的能力有了明显提高。在大学生科研训练中,我们要求学生不断地把统计的方法应用到解决实际科学问题上,使他们形成了一个不断巩固统计学方法和学习新的统计学知识的良性循环中,对统计学的学习有了更进一步的提高。总之,我们通过对教学内容、教学模式、教学方法和考核形式的一系列改革,可以有效地将学生从机械地学习生物统计学的理论知识向利用统计学的原理解决实际生物教学和科研的实际问题上转变,让学生能够在理解统计学理论的基础上,正确选择和熟练运用统计方法解决实际问题。作为专业教师,我们也会在今后的教学中,仍需要不断学习统计理论,探索教学规律,完善教育体系,提高课程教学质量,为培养具有较强社会适应能力和竞争能力的高素质应用型人才而努力。

参考文献:

[1]邹永梅.《生物统计学》课程建设的探索[J].江苏教育学院学报,2012,28(5):51-52.

[2]王春强,马巍,王洪才.高校《生物统计附实验设计》课程现状分析[J].中国校外教育,2012,(11):102.

[3]葛岳静.关于精品课程建设的几点看法(精品课程建设专家谈)[J].中国大学教学,2003,(4):4-6.

[4]郭祥群,阮源萍,杨利民,黎朝.以学生主体的教学优化模式探析[J].厦门大学学报,2004,增刊:1-4.

[5]洪梅.深化实践教学改革,构建合理实践教学体系[J].科技信息,2008,(12):201.

数据分析统计学方法篇(7)

 

2011年2月,国务院学位委员会进行了学科调整,统计学完全从数学和经济学中独立出来,上升为一级学科,设在理学门类中,编号为0714。统计学上升为一级学科后,下设的二级学科包括数理统计学、社会经济统计学、生物卫生统计学、金融统计、风险管理和精算学、应用统计学。统计学上升为一级学科对统计学专业的教学带来巨大影响。

 

同时,随着大数据时代的到来,使得传统的统计数据收集、处理与分析方法面临新的挑战,从而推动统计学的发展进入了一个全新的阶段。在统计学上升为一级学科以及大数据时代已经到来的大背景下,统计学专业的课程教学也面临着新的挑战,需要进一步改革与调整。

 

一、大数据时代的到来

 

(一)大数据的生成

 

伴随着人类对客观世界各领域数字化程度的不断提高,每天都有大量的数据产生,并且其产生的速度也越来越快。这些数据来源广泛,其中最主要的来源有:科学研究(如天文学、生物学、高能物理等实验数据)、社交网络、电子商务、物联网、移动通信等。

 

(二)大数据的定义

 

为了应对数据大规模增长带来的机遇和挑战,美国《Nature》杂志在2008年9月4日率先提出了“大数据”的概念。国际数据中心IDC 是研究大数据及其影响的先驱,在2011年的报告中定义了大数据:“大数据技术描述了一个技术和体系的新时代, 被设计于从大规模多样化的数据中通过高速捕获、发现和分析技术提取数据的价值”。但是大数据是一个新兴而且内涵不断发展的概念,尚没有统一公认的定义,只能从其特点上加以认识。

 

(三)大数据的特点

 

与传统数据相比,大数据的特征可以用五个“V”来表示,即Volume(容量大)、Variety(种类多)、Velocity(时效性强)、Value(价值高)、Visualization(可视化呈现)。大数据容量大是个相对的概念,受时间、行业和数据类型等因素的影响;种类多是指数据集的结构异质性,科技进步导致了结构化、半结构、非结构化数据的日益增多;时效性强是指大数据被生成、处理、移动的速度相当快,是区别于传统数据最显著的特征,这也增加了对即时分析、加工数据的需求;价值高是指大数据潜在的高价值能为评价和决策提供依据。可视化是大数据分析的关键步骤,是对有价值信息加以提炼并显示的过程。

 

(四)大数据的应用

 

大数据具有5Vs(Volume、Velocity、Variety、Value、Veracity)特点,蕴含着巨大的社会价值、经济价值和科研价值,已引起了产业界、学术界、政府部门和其他组织的高度关注和重视。

 

近年来,世界发达国家相继布局大数据战略,诸如联合国“数据脉动”计划、美国大数据战略、英国“数据权”运动,大力推动大数据发展和应用。大数据已纳入我国国家发展战略,国务院2015年8月31日印发了《促进大数据发展行动纲要》的通知(国发[2015]50号),指出:“大数据成为推动经济转型发展的新动力,大数据成为重塑国家竞争优势的新机遇,大数据成为提升政府治理能力的新途径。以数据流引领技术流、物质流、资金流、人才流,将深刻影响社会分工协作的组织模式,促进生产组织方式的集约和创新。探索发挥大数据对变革教育方式、促进教育公平、提升教育质量的支撑作用”

 

二、大数据给传统统计学带来的冲击

 

(一)数据收集方法上

 

不同于传统的调查抽样方法获取数据,大数据的收集来源渠道通常为现代网络渠道,如互联网、物联网等。不同的数据源的数据采集需要专用数据采集技术, 如包含格式文本、图像和视频的网站数据,通常需要web爬虫技术。

 

(二)数据存储上

 

大数据的存储不同于传统的数据存储方式,有固定的格式和结构,对于大数据的数据库来说,可以直接将所探测到的信号自动容纳到其中;大数据需要有先进的存储设备,传统的存储设备已经不能容纳如此大量的数据。

 

(三)数据分析上

 

传统的统计分析方法,难以胜任对非结构化的大数据的分析。当前大数据分析技术的研究可以分为6个重要方向:结构化数据分析、文本数据分析、多媒体数据分析、web数据分析、网络数据分析和移动数据分析。

 

(四)数据展示上

 

数据可视化的目标是以图形方式清晰有效地展示数据的信息。一般来说,图表和地图可以帮助人们快速理解信息。但是,当数据量增大到大数据的级别,传统的电子表格等技术已无法处理海量数据。大数据的可视化展示需要专业的软件来完成。

 

三、大数据时代统计学专业教学改革

 

大数据时代的到来对统计学也带来了新的机遇和挑战,特别是大数据对于数据分析人才产生了巨大需求,同时也要求统计专业学生掌握更为复杂统计软件的编程和操作。大数据背景下,统计学要适应新的形势,需要对课程教学进行有针对性的改革。

 

(一)大数据时代统计学专业毕业生就业方向定位

 

大数据时代的到来,使各行各业,包括政府、企业、个人都希望能从大数据这座金矿中挖掘出对自己有价值的金子,从而增加了对统计专业毕业生的需求。一直以来,我国统计工作领域主要是政府统计、部门统计、民间统计。传统意义上,政府及各个部门是统计学学生就业的首选。然而,随着大数据时代的来临,越来越多的毕业生选择发展空间更为广阔的民间统计。民间统计相对于政府统计来说,涉及范围十分广泛,包括各类统计咨询公司、统计调查公司、统计研究院等,介于市场和企业、行业之间。民间统计的发展前景十分广阔,可以预见,随着大数据时代的来临,统计学作用的提高,民间统计必会成为统计专业毕业生选择就业的主要渠道之一。

 

(二)大数据时代统计学专业课程设置改革

 

大数据时代,在对统计数据分析人才需求增加的同时,也对统计专业毕业生的大数据处理能力提出了更高的要求,这就需要统计学专业在课程设置上,增加大数据处理与分析方法课程,如《大数据分析方法》、《数据挖掘》等,培养学生能够使用专业统计软件(R/SAS/Python)进行大数据的挖掘、清洗、分析等。

 

(三)大数据时代统计学专业学生实践能力培养改革

 

在课堂教学之外,通过广泛举办大数据技术创新大赛、大数据技术创新与创业大赛、数据挖掘挑战赛,支持学生成立大数据研究协会,举办大数据相关讲座论坛等方式,增强学生分析和处理大数据的能力。另外,还要加强校外大数据实践教学基地建设,通过与通信、互联网、电子商务等企业大数据开发中心以及大数据研究咨询机构合作,为学生提供给更多的实习、实践机会。

 

四、总结

 

总之,面对大数据时代的到来,统计学专业需要积极改革与调整课程的设置,注重学生实践能力的培养,以适应各行各业对大数据分析与挖掘人才的需求。

 

作者简介:

友情链接