期刊大全 杂志订阅 SCI期刊 投稿指导 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 化学反应的基本特征

化学反应的基本特征精品(七篇)

时间:2024-02-05 15:21:06

化学反应的基本特征

化学反应的基本特征篇(1)

[关键词]图像检索;用户研究;相关反馈;感兴趣区域;用户情感

1.引言

随着多媒体技术的高速发展和Internet的普及,数字图像的数量快速增长,我们已经进入读图时代。图像以其内容丰富、表现直观等特点,已在国防军事、工业制造、医疗卫生、新闻媒体和大众娱乐等领域发挥着重要作用。但是随着日益增大的图像数据库,图像无序化问题也越来越突出,如何在庞大的图像数据库中快速找到用户感兴趣的图像已成为一个亟待解决的问题。

Internet网中图像的检索经历了两个阶段:第一阶段是以关键字为基础的检索;第二阶段是以图像内容为基础的检索。以关键字为基础的检索是基于文本的检索,由于图像内容复杂,不同个体理解不一致,难以用文字描述图像,并且对图像标注费时费力,基于文本的图像检索效果并不能很好地满足用户的需求。在20c90s开始出现基于内容图像检索(Content-Based Image Retrieval,CBIR),借助于对图像从低层到高层进行自动处理和分析来描述其内容,并根据内容进行检索[2]。它是将图像表示为高维空间中的矢量,这些矢量是由从图像中提取的颜色、纹理、形状等底层特征组成的。基于内容的图像检索在一定程度上提高了图像检索的效果,但又出现的一个很严重的问题―语义鸿沟:抽取出来的图像低层特征与人对图像的语义理解之间存在很大的差距,用户仍然不能找到满意的图像。研究者发现将用户作为图像检索研究中的一个出发点能够很好的减少语义鸿沟现象。目前研究者提出多种方法,包括:(1)相关反馈法,其思想是通过人机交互,让系统能够根据用户的选择猜测用户的检索意图,并能自动地调整相似度量准则;(2)感兴趣区检测法,其思想是以分割后的区域的特征来描述图像,并以区域为单位来匹配图像,以找到用户感兴趣的图像;(3)基于用户的情感出发,以用户情感为线索检索图像,其目标是以图像可能激发的人的主观体验(即情感语义特征,或者感性特征)为中间桥梁,实现用户检索需求与图像之间的匹配。

2.基于相关反馈

相关反馈法是基于内容的图像检索中最常用的方法,其检索过程有如下几个步骤:(1)提交初始检索,系统返回初始检索结果;(2)用户对排序前10(或前20)的结果评价是否和本次检索相关,相关称为正反馈样本,不相关称为负反馈样本;(3)系统根据用户提交的反馈对检索优化,将新的检索结果返回;(4)如果用户仍不满意,可重复反馈。

根据相关反馈算法所采用的检索模型把算法分为查询点移动、特征权重调整、基于概率模型、基于机器学习、基于聚类分析等方法。

(1)查询点移动:查询点移动算法是通过用户的反馈信息,改变数据库中每幅图像与查询图像之间的距离,使相似点靠近查询图像,不相似的点远离查询图像。

(2)特征权重调整:对图像不同的特征赋予不同的权值,系统根据用户的反馈信息,把用户认为与查询图像相似的特征赋予较大的权重而不相似的特征赋予较小的权重,然后根据调整后的权重计算图像间的相似度。曹奎等提出一种新的基于灰关联分析(GRA)的相关反馈技术,它使用GRA来描述“例子图像”与“相关图像”之间的关系,并据此更新查询向量和特征的权重,据此自动更新图像的相似度量和用户的查询需求。

(3)基于概率模型:把相关反馈看成是一个分类问题,大部分情况下考虑的是两类分类问题。以贝叶斯(Bayesian)理论等为基础,通过用户的反馈信息,估计每一幅图像与查询图像的相关概率,将高概率的图像检索出来,从而提高检索效率。张亮等提出一种基于动态学习用户模型的贝叶斯概率检索方法。通过对历史反馈信息的长期学习,动态估算用户模型,从而预测目标图像的概率分布。

(4)基于机器学习:将交互过程看做一个训练过程,通过对训练样本的学习,逐步了解用户的具体查询目的,并建立图像特征与用户查询目的间对应的模型,根据该模型来进行新一轮的检索。常小红等从机器学习的角度出发,提出了一种基于RBFN的相关反馈算法。即在检索阶段用户对检索结果标记为相关图像、模糊相关图像和不相关图像,然后将这些反馈信息作为训练样本,动态地建立RBFN的结构,这个过程反复进行,直到用户得到满意的结果或失去耐心为止[8]。

(5)基于聚类分析:首先对特征空间进行聚类划分,形成不同的图像类,相关图像落在一类中或距离较近的类中,而不相关图像则落入距离较远的类中,然后计算每两个类之间的权重作为类间相似度的度量。通过调整类的大小和类间权重,进一步减小相似类间距,并使不相似的类远离。陈光鹏、杨育彬等在图像检索中引入蚁群算法的思想,来建立图像的语义网络,将用户反馈日志转化为图像的语义关联信息并存储在语义关联矩阵中。

(6)结合机器学习和聚类分析:有些学者将以上几种方法综合起来应用,如陈旭文等提出了一种综合用户反馈信息时空特性的用户反馈学习方法―时空特性支持向量机(SKSVM)方法。在学习中,时空特性支持向量机(SKSVM)根据用户反馈信息的空间特性,强化用户感兴趣的正例集合,弱化用户不感兴趣的负例集合,合理利用正负例子蕴涵的信息;同时在时间上考虑反馈信息的时间特性,强化最近的反馈信息,实现快速准确的跟踪用户的查询需求。

3.基于感兴趣区域

研究表明用户在观察图像的时候,最容易引起用户注意的部分往往是用户感兴趣的部分,也就是图像中最“与众不同”的部分,与周围其他部分相比更加显著的部分。于是产生感兴趣区检测法ROI(region of interest),这种方法的基本思想是以分割后的区域的特征来描述图像,选取用户最感兴趣的关键区域来描述图像,并以区域为单位来匹配图像。这种检索方法区分了区域的重要程度,进一步消除冗余信息,回避了精确分割的困难,并明显地降低图像处理的复杂度,提高运算速度。

基于感兴趣区域方法的关键是获得用户感兴趣区域,总结近年来的研究可以归纳为三种方法:(1)人机交互;(2)自动化方法;(3)视点跟踪技术。

(1)人机交互

人机交互的方法是目前最常用的获取感兴趣区域的方法,它是基于各种算法将图像划分区域,由用户选择图像中的若干区域作为感兴趣区。如郝红卫等提出先由用户选择感兴趣区域,然后提取所选区域的多种特征,分别构造相应的分类器,最后通过对各分类器结果的集成得到检索结果。实验结果表明,这种方法能够准确获取用户的查询意图,具有更高的查准率。金磊等提出了一种基于用户感兴趣区域的图像检索算法。该算法首先对样例进行多分辨率树状分解,再由用户选择分解后的任意多个感兴趣的子图,提取子图的特征以进行相似性度量,并应用相关反馈以更好地捕获用户的检索意图。高和蓓等采用基于目标的图像分割的方法把图像分成几个目标区域,提取能表达该区域内容的特征向量并保存在特征库里,然后再通过与用户的交互,确定用户感兴趣的区域,把这些感兴趣区域投射剑目标区域上,继而用这些区域的若干特征来表示该区域内容,并从图像数据库中查询具有相应特征区域的图片反馈给用户。

(2)自动化方法

李丽君认为感兴趣区域是图像中显著的像素集合,这些像素称为显著点或兴趣点。基于显著点划分图像,更符合人眼的视觉感知特性,有助于用户理解图像,并且显著点能够有效地捕捉到图像的局部信息。李丽君提出的方法是利用最小差错概率准则,检测图像的显著点。显著点是显著度图的局部最大值,显著点通过将后面点送到峰值检测模块识别出来。

(3)视点跟踪技术

人眼注视运动传递了大量反映个体心理活动的信息。赵孟凯等提出了一种利用视点跟踪技术检测感兴趣区的方法,通过实时捕获人眼的注视点,客观地获得用户兴趣信息,根据注视点位置计算用户兴趣度,最终提取图像感兴趣区。这种方法在高分辨率及保证精度的前提下,同时满互自然性和实时性的要求。

4.基于用户情感

目前的图像检索大多是基于低层物理特征的相似性匹配,对用户的爱好、情感等主观感性化因素考虑较少。感性信息处理通过让计算机能够模拟和识别用户的偏好、喜爱等主观信息,适应不同用户的不同需求。基于此,出现了基于用户情感的图像检索。

基于用户情感的方法的基本原理:借鉴心理学中的“维量”思想,建立情感空间;同时,抽取图像的主色调、不变拒、颜色和灰度分布,这些较容易引起情感变化的特征作为图像的视觉特征,建立图像的特征空间;采用支持向量机的方法建立图像的低层特征空间到用户的高层情感空间之间的映射,自动注释用户未曾评估的图像,实现了图像情感注释,在情感空间进行公共情感检索,快速获得用户情感信息。检索流程包括感性提问的接收和转化、检索匹配、检索结果的反馈、相关反馈。具体的基于情感的图像检索过程如下例所示:(1)用户提出带有情感色彩的检索要求,如检索“美丽的”的图片,检索子系统根据情感用户模型获取侯选图像显示给用户;(2)通过交互,系统记录用户的反馈信息;(3)采用合适的学习机制,动态调节用户情感模型,以使系统能够实现个性化的情感图像检索。

王胜惠等将可视化交互式遗传算法应用到情感图像检索中,提出了一种可视化交互式遗传算法(VIGA)模型,允许用户参加遗传搜索过程,用户可以通过对整个搜索过程加一个导向的信号,引导遗传过程朝用户的主观情感方向发展,这样不仅能够加快收敛速度和减少用户疲劳,而且能够更准确的反映出用户的主观情感,在更高程度上实现图像的感性搜索。

5.总结

纵观图像检索技术的发展,从基于文本的关键字检索发展到基于内容的图像检索是图像检索领域的重大跨越。但是基于内容的图像检索中低层次的物理特征与用户高层次的语义需求之间出现严重的不匹配现象,进而发现在图像检索中考虑用户的因素,从用户的相关反馈、用户感兴趣区域、用户情感、用户图像检索中的交互行为等角度考虑都能不同程度地提高图像检索系统的检索结果。因此要提高图像检索的检索效果,用户研究是研究重点。

参考文献:

[1]马超,唐治德,. 相关反馈技术在图像检索系统中的应用[J]. 重庆科技学院学报(自然科学版),2007,(1): 81-84.

[2]张亮,周向东,张琪,施伯乐. 图像检索中基于长期学习的动态用户模型[J]. 软件学报,2005,(2): 233-238.

[3]常小红,张明,. 基于RBFN的交互式图像检索方法[J]. 计算机技术与发展,2007,(9): 31-34.

[10]陈旭文,朱红丽. 一种高效的图像检索方法[A]. .[C].: ,2007.

[4]官倩宁,田卉,覃团发,. 基于ROI多特征和相关反馈的图像检索算法[J]. 计算机科学,2008,(5): 257-259+269.

[5]赵孟凯,张菁,卓力,沈兰荪,. 基于视点跟踪的感兴趣区检测方法[J]. 数据采集与处理,2010,(1): 50-55.

化学反应的基本特征篇(2)

【关键词】 图像检索 底层特征提取 近似匹配

一、需求分析

本文是通过提取图像底层特征,利用近似匹配算法建立分类模型,并由用户反馈优化分类样本已达到基于内容的图像检索。本系统要满足以下功能:加载目标图像,并可提取其基本特征信息;建立被用于检索的图像库和其对应的底层特征库;反馈给用户近似的检索结果及优化选项;能够对检索结果作出数字化评估。该系统在建立特征库后,通过算法的计算和用户的优化,找到语义程度上最满意的结果,以达到满足本课题的要求。

二、详细设计

本文在规划图像检索的过程中时,不仅需要提取出图像底层的多方面重要特征,还需要将这些特征转化成向量或数值,一方面方便记录特征信息以对其建立索引,使之便于处理和存储,另一方面使其m应近似匹配算法.以便利用这些特征为图像分类。在检索算法的设计中,如何利用用户的反馈,动态地优化特征的选择和分类的方法是本课题设计的核心。本部分分三个部分,分别介绍了底层特征的具体提取算法,近似匹配算法和反馈优化检索的设计过程。

2.1 图像颜色特征

颜色空间对于相关颜色以数字形式表示是一个很重要的成分,是数字化颜色理论的重要组成部分。RGB颜色空间是图像处理中最常用的颜色空间,它通过互相垂直的坐标轴表示一幅图像在红、绿、蓝三个色度上的分布情况。

2.2 图像纹理特征

方块编码(Block Truncation Coding),是一种快速有损图像压缩技术。其原理是将图像划分成若干子图像块,然后统计子图像块的平均值,将块中低于平均值的像素点置为0,高于平均值的点置为1,这样就将图像二值化,可以作为二电平输出,不但传输速度快,且重建时可保持均值。

2.3 近似匹配算法

在将图像的颜色、形状、纹理等底层特征提取出来并记录后,这些特征就变成向量的形式供近似匹配算法使用以达到比较图像间相似度的目的。不同的近似匹配算法计算出的相似结果也不同,对于不同的特征和相似性需求,需要采用多种近似匹配算法,再对结果评估后确定合适的一种。

三、系统测试

对于本软件的检索方式,分为综合检索和基于单一特征检索两种。其中单一特征检索是根据目标图像所提取出的一种特征向量(如灰度颜色直方图)与特征库中其他图像的同一特征向量做比较,找寻最近的图片,以此来反映该特征的检索能力;而综合检索则是将所有7个主要的底层特征按流程逐一检索,每一步采纳用户反馈的信息,最后综合所有特征向量,在反馈信息修正下进行检索,以此来融入用户反馈的内容达到精确检索的目的。对于检索的结果,本软件也提供了数值化的评估方式,通过多种数据具体地反映检索效果。

在CBIR的测试中,查全率(recall)和查准率(precision)是评价检索效果的主流方法。其中查全率表示检索到有效的图像占图像库中所有有效图像的比例,而查准率表示有效图像占所有返回结果的比例。定义如下

S检索到的有效图数目,u为检索结果中无效图的数目,v为在图像库中有效但未被检索到的图像数目。

四、结论

本课题设计并实现了基于用户反馈优化算法的图像检索系统,该系统能够将用户对检索结果的评价转化为检索方法的改进参数,使系统在交互过程中动态地达到图像精准检索的目的。在设计过程中,图像底层特征信息的提取和检索优化的算法是主要解决的问题。在实现的过程中既遇到了棘手的问题和难点,也学到了图像处理和分类的许多方法技巧。

【参考文献】

[1] 孙君顶.图像特征提取与检索技术[M].北京:电子工业出版社,2015.

化学反应的基本特征篇(3)

关键词: 胜任特征;反馈控制;运筹学;工商管理专业

中图分类号:G64 文献标识码:A 文章编号:1006-4311(2012)22-0251-030 引言

作为工商管理专业骨干课,运筹学是一门应用科学,它广泛应用现有的科学技术知识和数学方法,解决实际中提出的专门问题,为决策者选择最优决策提供定量依据。运筹学课程成为众多专业的基础课程,它是基础课程(微积分、线性代数等)与专业课的桥梁。但在运筹学实际教学过程中,却会遇到一些问题,例如,课程教学内同安排不合理,容易造成教学目的与专业人才培养目标相背离;课程教学模式单一,学生积极性不高,综合能力提升不明显;因此,有必要在课程教学体系上有所创新,构建一种新型的体系和模式有效解决教学实践中遇到的实际问题。

1 基于胜任特征运筹学课程教学体系——以工商管理专业为例

由于笔者工作单位为工商管理教研室,因此,以工商管理专业为例探讨《运筹学》课程教学体系。

1.1 建立胜任特征体系 1973年,MCCLELLAND[1]首次正式提出了胜任特征的概念,从而引发了从理论界到实业界对胜任特征研究的热潮。所谓胜任特征是指能将某一工作(或组织、文化)中表现优异者与表现平平者区分开来的个人潜在的、深层次的特征,它可以是动机、特质、自我形象、态度或价值观、某领域的知识、认知或行为技能—任何可以被可靠测量或计数的,并且能显著区分优秀绩效和普通绩效的个体特征[2]。

参照胜任特征的一般定义,工商管理专业的胜任特征就是该专业的学生在未来工作和研究中表现出优异绩效的个体能力特征,包括学生的洞察力、逻辑思维能力、创新能力、分析综合能力、交流沟通能力、合作能力等。建立工商管理专业的胜任特征模型包括以下步骤:

1.1.1 建立专业期望能力胜任特征集合 可考虑社会经济发展需要,校方根据专业人才培养计划初步编制专业能力胜任特征集合。以此为基础,采取企业访谈与专家德尔菲法,征询工商管理专业学生应具备的能力特征,并以此作为胜任特征集合修改和完善的依据,进过几轮的反复,最终确定工商管理专业期望能力胜任特征集合。

1.1.2 分析专业学生胜任特征现状 通过设计调查问卷,明确工商管理专业学生胜任特征现状。问卷设计要依据调查对象的不同而有所调整。面向专业教师的问卷侧重于调查学生的洞察力、逻辑思维能力、综合分析能力等,面向学生的问卷侧重于调查交流沟通能力、合作能力等,面向企业事业单位的问卷侧重于实际解决问题的综合能力的调查。

1.1.3 总结胜任特征差距,设计运筹学课程教学体系

对每一个胜任特征项目的现状与其期望值之间的差距进行认真分析,总结出工商管理专业学生能力胜任特征的差距,作为设计运筹学课程教学体系、提升学生能力胜任特征的依据。

1.2 基于胜任特征的运筹学课程教学体系设计 体系设计的目的是培养学生运用数学模型和方法解决现代管理优化决策问题的能力,使学生在今后的工作中能科学地制定方针和政策,以实现最有效的管理。考虑到工商管理专业学生能力胜任特征的差距,构建了理论与实践相结合的《运筹学》课程教学体系。该体系将运筹学的基础理论、案例、实验、综合实践和校外实践紧密联系起来,课堂讲授通过基础理论、案例、课堂讨论、课程作业等内容,着重培养学生的学习能力和逻辑思维能力;课程实验和专题讲座通过使用运筹计算软件和专项讲座,着重培养学生的动手能力和综合分析能力;课程实践进行运筹案例分析,培养学生的逻辑思维能力;综合实践环节通过工商管理综合案例分析,培养学生的综合分析能力和组织能力;在毕业实践环节通过课程设计实习、毕业实习等内容,对上述能力进行巩固和完善,并培养学生的品德素质、洞察能力,最终提升学生能力胜任特征,降低胜任特征差距。

2 运筹学课程教学体系反馈控制模型

2.1 反馈控制模型 系统科学的教育哲学认为,教学的基本原理是适应与转化;教学的最终目的是发展与创造;教学的主要手段是系统与控制[3]。借助于反馈控制理论,建立了运筹学课程教学体系的反馈控制模型,如图1所示。

将胜任特征体系和反馈控制理论有机的结合,构建运筹学课程体系的胜任特征和反馈控制模型。一般来说,控制活动就是保持系统的稳定状态或把系统由一种状态向另一种状态转换[4]。首先,教师将运筹学的课程目的与要求传递给学生胜任特征系统。其次,明确学生在经过该门课程的学习后应该具备怎样的胜任特征,并对学生现有的胜任特征状况进行合理的评价,将应具备的胜任特征和现有的胜任特征进行对比分析,发现存在的优势特征和弱势特征,以此为基础,设计运筹学课程体系。然后,根据设计的教学体系进行教学实践,并对学生进行胜任特征后评价,形成能力评价信息。一方面,能力评价信息反馈至运筹学的课程目的与要求环节,作为调整教学大纲的依据;另一方面,评价信息反馈至学生胜任特征系统,用以分析学生的胜任特征和课程体系调整的依据。同时,在学生胜任特征系统内部存在着内部反馈,根据不断变化的胜任特征差距进行课程体系调整。

化学反应的基本特征篇(4)

笔迹检验是文件检验技术的一种,它是通过对可疑笔迹和嫌疑人的笔迹进行比较鉴别,确定是否为同一人的笔迹,或确定检材是否为某人书写的一项专门技术。其任务就是要运用多学科的知识和专门的检验技术要领,根据侦查和案件的需要,对案件中以文字、阿拉伯数字和标点符号等为表现形式的笔迹进行鉴别和判断,以查明案件真相,“锁定”犯罪事实。下面以一起职务犯罪案件笔迹检验来浅析笔迹检验技术要领。

[基本案情]2011年10月,钟祥市人民检察院在审查钟祥市某工贸有限公司周某、马某涉嫌职务侵占、贪污一案中,办案人员提出周某、马某利用担任公司总经理、副总经理兼会计的职务便利,假借他人名义将公款以应付账款、集资款等名义列入单位财务往来账上,后又假冒他人名义以签名、打领条的方式从账上取走公款20余万元。由于相关证据缺失,庭审时倘若犯罪嫌疑人翻供,法院就会作出无罪判决。为确保案件质量,需对涉案资料(文字证据)进行笔迹检验。

一、检验前的分析

受案后,技术人员首先对送检涉案检材进行了初步分析,发现该案检材有以下几个特点:

一是涉案时间长,跨度大。这起案件最早的涉案检材发生在1997年,距今已有14年,两名嫌疑人自1997年10月至2002年3月,先后10余次假冒他人名义以签名或打领条的方式从账上套取公款,作案期间长达5年之久。

二是涉案人员多,分布广。该案检材反映涉案嫌疑人10余人,被假冒他人签字的19人,虚构人名的8人。因时间久远,这些涉案人员分布在全省各地,有的已无法查找到本人。

三是涉案检材多,手段复杂。该案以签名形式套取现金的检材有6份,包括股金利息发放花名册、工资发放花名册和自制付款单等形式,涉及12个人的签名;领条形式的检材有24份,包括领取货款、集资款、退房款和劳务费等形式,涉及文字484个,数字符号119个,并且检材中反映有涂改、添加、重描、临摹和缺损等现象。

四是检材不符合要求,缺乏比对条件。办案人员送检的检材全部系复印件,不符合笔迹检验的要求,客观地讲是不具备检验条件的。在鉴定人员的要求和指导下,办案人员提供了符合检验要求的检材原件。

二、检验经过

针对上述情况,为确保将案件办成“铁案”,技术人员与办案人员进行了沟通,在了解案情和全面收集嫌疑人各个不同时期样本材料的基础上,对该案进行了检验。

一是结合案情,制定有效检验方案。为了确保笔迹检验结论准确可靠,就必须按规定的程序和科学的方法进行检验。在仔细研读案情后,我们根据案件需要将涉案的36份检材对应案情分成12笔进行检验,避免了在工作中出现差错的可能性。

二是科学收集样本,严谨规范制作比对表。为满足检验条件,我们共查阅账册100余册,复印资料200余份,提取同期样本材料300余份;想方设法寻找涉案人员收集案后样本材料,共找到涉案人员10余人、收集案后样本20余份;采用科学的专业方法收集实验样本40余份。在检材和样本材料的收集、整理过程中,我们及时将发现的笔迹特征按一定要求客观记录下来,重点发现和寻找检材、样本中的笔迹细节特征,从细微处发现价值较高的笔迹特征。通过扫描仪将检材和样本材料输入计算机设备中,运用光影魔术手、Word等软件进行编辑,调整好色阶、对比度、色彩和图形大小。使用能全面反映检材和样本全貌及细节特征的方法,制作特征比对表78份,使其在形式上和程序上更加科学、规范。

三是综合评断,作出科学检验结论。我们会同省院文检专家,采用VSC6000文检仪和显微镜观察,按照正常笔迹和伪装笔迹的检验方法,对相关笔迹进行检验。从书写水平、书写速度、字形字体、字的大小、单字的起收笔动作、笔画搭配比例、运笔方向、阿拉伯数字和标点符号等细节特征方面寻找差异点,进行比较和综合评断,科学地作出了12份鉴定结论。这12份文件检验鉴定书作为该案的关键性证据,在案件审理中全部被法院采信,为案件判决起到了至关重要的作用。

三、笔迹检验要领

总结该宗案件的检验鉴定,笔迹检验主要把握以下几点要领:

一要仔细研读案情,做到科学鉴定。根据笔迹检验原理,一个人的书写习惯在其自身同一中包含着差别和变化,同时也包含着与他人书写习惯之间存在不同程度的相似之处,加上书写活动本身随意性较大,案件中的情况又各不相同,这就使笔迹检验工作相当复杂,因此笔迹检验就必须按规定的程序和科学的方法来进行。为了确保检验结论准确可靠,技术人员必须了解案情,特别是要了解检材的形成过程和收集样本的手段与方法,了解嫌疑人书写方面的情况,犯罪目的和动机。如该案周某、马某系情人关系,公司长期处于二人控制下,在国企改制过程中,为了侵吞国有资产而利用职务便利实施犯罪行为。因此我们分析作案者实施犯罪时的心理状态一定是有恃无恐,自信不会被发现。通过全面细致地了解案情,发现该案嫌疑人在实施犯罪假冒他人书写时,相同字、相同偏旁间的特征反映基本一致,书写水平前后一致,文字布局、搭配比例、运笔形态自然合理,基本上未改变自己的书写习惯。

二要吃透检材,充分收集样本材料。检材和样本材料的质量对案件鉴定十分重要,只有高质量的检材和样本材料,才能为科学准确的鉴定结论奠定良好的基础。移送的检材要进行核实和确认,确保真实可靠并对其负责。不能将甲的笔迹材料当作乙的笔迹材料,张冠李戴,更不能将检材与样本材料弄颠倒。样本的真实与否,直接影响到鉴定结论的准确性,很多错误的鉴定,都是与样本材料不真实或弄错了样本材料有关。为此我们必须细致分类清理检材与样本,确保收集的材料真实可靠。

笔迹检验的样本材料原则上应为同期样本。收集的样本材料要有可比性,样本不但要有足够的数量,还要有很好的质量,要具备与检材进行种类认定和同一认定的基本条件,如果样本与检材没有可比性,则无从检验。收集的样本材料一定要得到有关部门或双方当事人的认可,并由有关单位或当事人形成书面材料盖章或签字,以免给鉴定工作带来影响。收集的样本材料要全面、充分,要有足够的数量,这样才能更多、更好地暴露出被鉴定人的特性、特征,鉴定人才能够全面利用这些特性、特征,从中找出一定的规律,以便更全面地与检材进行比较检验,从而得出科学准确的检验结论。

三要正确区分正常笔迹和变化笔迹的特点。正常笔迹是在正常的书写环境、正常的书写条件以及正常的心理生理状态下书写的笔迹材料。正常的笔迹书写水平前后一致;文字布局、搭配比例、运笔形态自然合理;书写水平与语文水平基本适应;相同字、相同偏旁间的特征反映基本一致。如马某的笔迹书写速度均较快,书写自然无伪装,涉及“领”“到”“现”“整”“款”等单字笔迹在文字布局、字形字体、偏旁部首、书写水平等特征上反映基本一致。

变化笔迹是在反常的书写环境、反常的书写条件以及反常的心理生理状态下书写的笔迹材料。变化笔迹有两种:一种是自然变化笔迹,即由书写环境、书写条件或书写人生理因素特殊等客观原因引起的笔迹变化;如收集贾某案后样本时,贾某的笔迹因生理变化引起的抖动弯曲现象。另一种是书写人心理上的特殊而采用某种手段引起的笔迹变化,是主观因素造成的,是书写人故意伪装的结果。如在看守所提取周某实验样本时,因周某意识到办案人员意图,书写时故意伪装真实笔迹,运笔反常,笔画不适当的拉长缩短,文字布局混乱现象。虽然不同的原因造成的笔迹变化的特点有所差别,但从总体来看它们都反映书写水平前后不一;书写水平与语文水平相矛盾;相同字、相同偏旁间的特征反映不一;文字布局混乱、搭配比例失调;运笔反常,笔画出现不适当的拉长缩短,笔画的书写生涩呆板,并伴有停顿、重描、弯曲、抖动及拖带现象;常用字出现错误。在分析物证笔迹时,如果发现有上述现象就应考虑是变化笔迹,并根据不同的特点分析引起变化的具体原因。

四要认真分析选取样本笔迹特征。选取样本笔迹特征的过程一般是由小到大、由浅入深,即先选用总体的大的特征,如文字布局、书面语言、字体字形、书写水平等特征,然后再深入到每个笔画、每个单字的细微末节之处选用单字的写法、笔顺、运笔、搭配比例等特征。为了避免出现遗漏,在选取样本笔迹特征时一般还应以字迹的先后顺序为基本线索寻找确定笔迹特征。

在选取样本笔迹特征时要特别注意去选那些最能反映书写人书写习惯本质的特征,即最稳定和最特殊的特征。同期样本笔迹一般都比较正常,它选取笔迹特征的分析也比较简单。但要特别注意的是对案后样本和实验样本选取笔迹特征的分析,要分析其笔迹特征有无伪装变化及变化的程度如何,以确定它的使用价值。我们选用在看守所提取周某的实验样本时,因周某意识到办案人员意图,书写时故意伪装真实笔迹,使提取的实验样本丧失了使用价值。选用样本笔迹特征要以检材笔迹为依据,要从样本笔迹中找出与检材笔迹特征相同的单字、偏旁部首、文字布局、书面言语和标点符号等特征,并把它们如实的描绘记录在特征比对表的右侧,不管是符合点特征还是差异点特征。对马某的样本材料,我们就是依据检材笔迹,按笔顺,起收笔动作,笔画搭配比例,运笔方向等细节特征,选那些最能反映书写人书写习惯,最稳定和最特殊的特征,来寻找检材笔迹中“领”“到”“现”“整”“款”“元”的单字,“亅”“丩”“兀”“千”的偏旁部首和阿拉伯数字“0”“6”“9”,标点符号“〈〉”的写法,制作比对表进行比对。

五要正确评断符合点和差异点特征的价值。符合点特征的价值在相比较的笔迹中一般都或多或少的存在,要说明相比较笔迹的书写习惯是否同一,仅有符合点特征是不够的,还要看符合点特征的价值,价值高的符合点特征能够说明相比较笔迹书写习惯的同一,因此正确区分符合点特征的价值是作出正确鉴定结论的前提条件。

象符合点特征一样,无论最后结论如何,相比较的笔迹之间都会存在或多或少的差异点特征。符合点特征的价值主要是由特征的稳定程度决定的,稳定的差异是高质量的差异。重复出现的稳定的差异点特征往往反映了不同人的书写习惯,即通常所说的本质差异。虽然书写条件不同、书写速度不同、书写年代不同、字形字体不同以及样本笔迹不足等原因也会形成比较稳定的差异,但这种稳定只是一种假象,不能说明特征的实质。如在鄂检技鉴字[2011]72号鉴定书中JC2011-108-5号领条中书写的“领条”二字稍慢,“退、整”有添加笔画,JC2011-108-11号领条中书写的“杨”和“9”字有添加,重描外,其他笔迹的书写速度均较快,笔迹均书写自然无伪装。我们分析认为,添加或重描现象可能是因书写人书写时笔力较轻或墨水较淡导致笔画不清晰而形成的,不属于故意伪装所致。因此,在确定差异点特征价值时要结合具体的案情和具体的笔迹现象进行分析,看这种差异是否有可能由上述的某种原因所致,从而确定该差异点特征的价值。

化学反应的基本特征篇(5)

关键词:新课程;化学概念;教学策略

文章编号:1005-6629(2008)06-0028-04中图分类号:G633.8 文献标识码:B

化学概念是将化学现象、化学事实经过比较、综合、分析、归纳、类比等方法抽象出来的理性知识,它是已经剥离了现象的一种更高级的思维形态,反映着化学现象及事实的本质,是化学学科知识体系的基础。在化学教学中基本概念的教学是中学化学中一个重要的组成部分,也是学生学好化学的基础。许多学生在学习化学概念时,只是去背诵、记忆概念的定义,虽然下了很大功夫但是在解决实际问题时却困难重重,不知如何运用;有的学生则反映化学基本概念抽象、难懂,不如元素化合物知识易学,等等。心理学研究表明,概念的学习过程是学生通过积极的思维活动,对各种各样的具体事例进行分析、概括,从而把握同类事物的共同关键特征的过程。这是一个有意义的学习过程,在这一过程中,对具体事例的选择和分析、对概念关键特征的突出以及学生已有的知识经验是影响概念学习的重要因素。

针对化学概念知识的特点,在遵循一般学习规律的基础上,本文是笔者在教会学生化学概念的学习策略方面进行的一些探索。

1 概念形成策略

化学概念至少包含4个要素,一是概念的名称,如“酸”、“碱”、“盐”等,它们各代表一类事物;二概念的内涵,指概念正例的共同本质属性;三是概念的外延,即概念所包含的一切对象;四是概念的正例、反例。同类事物即为其正例,非同类事物则为反例。如盐酸、硫酸、硝酸等是酸的正例,氢氧化钠等为其反例。概念形成是通过知觉、辨别、假设、检验等心理过程,找到被肯定的属性并将之应用到概念正例中,排除非本质属性,发现概念关键属性的过程。概念的形成可用如下图式来概括:

由于A处于例证上位,这种学习常称为上位学习。

概念形成策略是指学习者从大量的具体例证中,以比较、辨别、抽象等形式自己概括得出事物关键特征的一种学习策略。这种学习策略强调学生主动参与知识的获得过程。运用概念形成策略一般要经历以下3个阶段:

首先,收集足够多的与要形成的化学概念有关的具体例证,这是获得感性认识阶段。具体例证的获得有多种方式,可以直接从教科书或教师那里获得,可以亲自动手实验,也可以查阅资料,只要能通过自己努力获得的要尽量自己动手。化学实验是获得例证常用的方式,学生需要根据具体情况设计并实施实验,通过观察并记录实验数据获得有关例证,对理解抽象的化学基本理论概念较为有利。

其次,是自觉地对获得的具体例证进行分析、比较、辨别,提取其共同的特征信息,逐步舍弃干扰信息,然后将特征信息进一步抽象和概括,这是一个由感性认识上升到理性认识的过程,需要去伪存真,去粗取精,这是形成化学概念的关键。

最后,将获得的结论与同伴展开交流,在交流中使正确的观点进一步得到明确,并在练习应用中加深对化学概念的理解。

运用概念形成策略时,概念的具体例证越丰富,关键特征越明显,越有利于概念的学习和理解。概念学习不仅要求掌握一类事物的共同本质特征,而且要求它能排除非本质特征。因此,在学习中应重视通过变式与比较的方式,使学生对概念的理解更清晰、更准确。

所谓变式是从材料方面促进理解,比较则是从方法方面来促进理解。一切包含概念关键特征的事物都是概念的正例,变式变是指概念正例的变化。例如,铁与氧气反应、硫与氧气反应、氢气与氧气反应等,这些反应事实就是“化合反应”这一概念的正例。在这些正例中,“反应的产物只有一种”是概念的关键特征,而这些反应在反应物和生成物的种类、颜色、状态、反应现象等方面的特征则是属于无关特征,这些无关特征往往会干扰学生对概念关键特征的把握。在学习中通过对不同的变式进行比较,突出概念正例的关键特征,舍弃其无关特征,可以使获得的概念更精确、稳定和易于迁移。

案例1概念形成策略示例

“电离”的概念,是比较抽象的,因为学生不能通过感官,直接感觉到物质电离后自由离子移动的过程,学生难以接受这样的化学结论。

首先,教师可演示氢氧化钠溶液、氨水、蔗糖溶液、酒精、硫酸、醋酸等溶液导电性的实验,或者是由学生自己完成实验,通过对实验现象的观察、记录,学生观察到有些物质在水溶液中能导电,有些则不能导电的实验例证。不同的合作小组相互交流各自的实验结果,从而使获得的例证更充分。

其次,在此基础上,介绍氯化钠、硝酸钾、氢氧化钠等固体分别加热至熔化后能导电,这样能比较容易形成电离的概念,从而正确理解、认识电解质与非电解质的内涵。与此同时,进一步引导学生观察电解质导电能力的实验,使学生获得不同物质导电能力有强有弱的感性知识,这样,对学生形成全部电离和部分电离的理论概念,找到了极有说服力的依据。

最后,通过flas展示氯化钠在水中的溶解和电离过程,引出氯化钠电离方程式的书写,以及盐酸、硫酸、硝酸三种酸的电离方程式,通过师生、生生间相互交流与讨论,从电离的角度得出酸的定义,再引导学生自己从电离的角度概括出碱和盐的本质,学生掌握电离概念的应用,进一步加深对电离概念的理解。

2 概念同化策略

认知心理学家奥苏贝尔(Ausubel D P)认为, 同化是指主体利用已有的心理机能结构一图式,对外界刺激进行过滤或改变的作用,将外界刺激吸收到本身的结构中,引起图式量变的过程。同化理论的核心是:新的意义是新知与认知结构中原有的概念或命题相互作用的产物。概念和原理学习的实质是新概念与学生认知结构中原有的概念通过相互作用,建立其内在的逻辑联系。新旧概念的相互作用,就是新旧意义的同化,其结果是新概念纳入原有的认知结构中,原有的认知结构得以丰富和扩大。所谓概念同化策略就是指学习者利用原有认知结构中适当的概念来学习新概念的一种方法。在概念同化学习中,学习者认知结构中原有的概念起着决定作用。运用概念同化策略,一般要经历以下3个环节:

首先,寻找并激活认知结构中与新概念学习相关的已有概念,这是概念同化的前提,通过将新概念与已有概念建立联系,初步理解新概念的涵义。

其次,将新概念与原有概念进行精确类比。这个过程包含了对新旧概念的各方面之间的比较,既要找出二者的相同之处,又要认识到其差异,毕竟它们不完全相同。这是在新旧概念之间建立联系的过程,是概念同化策略的关键。

最后,将相关的概念融会贯通,使新概念以适当的方式纳入认知结构之中,形成系统的概念网络体系,便于记忆和运用。

概念同化策略能够较精确地将新旧概念联系起来,使学习者运用已有的概念去掌握新概念。在概念同化过程中,学习者是否具有与新概念学习相关的适当概念,以及这些概念的清晰和稳定性是影响概念同化的重要因素。

案例2 概念同化策略示例

按照高中教材内容的编排,学生在学习“电离平衡”概念之前,已经学习了“化学平衡”的有关知识。因此,对“电离平衡”的学习就不必先让学生去观察有关的实验现象或收集有关的事实,而是可以采取“概念同化”的策略进行学习。

首先,回忆以前学习过的“化学平衡”的知识,将电离平衡与化学平衡建立起联系,初步理解电离平衡的涵义。

其次,将电离平衡与化学平衡进行精确类比,找出二者之间的关联点(即异同点)。它们的相同点在于都具有“平衡”的一般特征(动、定、变等), 平衡移动原理对二者都适用等;二者的区别在于建立平衡的本质不同(电离平衡是由弱电解质的部分电离所引起的),影响平衡的外部因素不完全相同等。通过这样一个比较过程,能够促进对新旧概念关键特征的把握,有利于准确理解概念。

最后,在明确了二者的异同点之后,通过对化学平衡和电离平衡的分析,将相关的概念从不同侧面联系起来,形成概念的整体结构,使“平衡”的概念体系进一步扩大。

根据新概念和原有知识结构中用来同化新概念的概念之间的关系,又可以分为下位学习和并列学习。当要学习的新概念与头脑中要同化的概念之间存在一种类属关系时,这是所进行的概念学习就是下位学习。例如学习了元素周期律知识以后,再进行氧族元素的学习。由于氧族元素许多性质(下位知识)的递变规律知识都已经包含在元素周期律(上位知识)之中,而氧族元素知识的学习只是验证、细化元素周期律的知识;新概念的习得有时不能通过同化到原有的上位概念中习得,但它与知识结构中的整个内容具有一般的关系,此类概念学习时,一般就采用并列结合学习模式,即通过分析原有知识的基础上,通过对比、分析,来进行新知识的学习。例如,初中化学中的化合反应、分解反应、置换反应和复分解反应,四者之间的关系就不能相互包含,但它们之间有共同之处(都是从物质组成和数目角度对化学反应进行研究)。学习了前者,再学习后者时,就属于并列结合学习。

进行概念同化学习时,关键是要把握好新概念和原有概念之间的关系。在教学时,这就要求教师先要分析出学生头脑中具有的原有概念是什么,它们与新概念之间是什么关系。在教学时,就要将新概念的定义或特征描述呈现给学生,并要求他们在两者概念之间建立联系,以促使同化。以同化的方式习得概念,也需要用概念的例证来演示概念的重要特征,这样做可以增加概念运用于新情境的机会。为此要给出来自不同情境的概念例证。

认知心理学派认为实现概念同化应具备一定条件:首先,学习者要具备把新概念与认知结构中原有的适当观念关联起来的意向;其次,学习材料呈现新概念对学习者必须具有潜在意义,表现在:一是学习的概念本身应具有逻辑意义;二是学生原有认知结构中已具备同化新概念的适当上位概念。实现概念同化,两个条件缺一不可,否则会导致机械学习。

3 概念图策略

一个化学概念的获得,既包括对它本身涵义的理解,同时还包括对不同概念间的各种相互联系的理解。新的概念只有纳入相应的概念系统中,与其他概念建立其必然的联系,才能被学习者全面、深刻地理解和掌握。概念图策略是指学习者按照自己对知识的理解,用结构网络的形式表示出概念的意义以及与其他概念之间联系的一种策略。

一个完整的概念图要包括命题、层次等级、横向联系和实例4个方面:

①命题:命题是两个概念通过某个连接词而形成的,例如“胶体是分散质粒子直径在1nm~100nm之间的分散质”,这个命题是通过“是”而形成的。

②层次等级:概念图中的概念必须是有层次的,这以概念的抽象水平为依据。一般说来,最抽象的概念列于图的上方,具体的实例列于图的下方,中间按抽象程序依次排列各个概念。

③横向联系:概念图必须反映同一或不同抽象层次概念之间的“横向”联系,这种联系的揭示往往标志着学生的创造能力。

④实例:概念图不只是抽象的概念,还需要用具体实例丰富和加深学生对概念的认识。

在绘制概念图时,首先要抓住核心概念的定义及其直接相关的中心内容,其次抓其他的性质特征,然后再抓它与其他知识的联系。

概念图是一种有效的教学策略。概念图(下图为“胶体”概念的概念图)制作是一种将教学内容中的概念和命题具体化的技术,它是一种有效的“学会学习”的教学方法。其实质就是以科学命题的形式显示概念之间的意义联系。通过概念和连接词构成的命题的形式可生动形象地反映出概念之间的意义联系。教师在教学过程中是逐渐引导学生完成概念图的绘制过程,使概念在学生的头脑中形成一个整体的印象。

概念图的实质就是以科学命题的形式显示概念之间的意义联系。它帮助学生首先弄清楚并理解教学内容中少数关键性的概念,最后用具体的知识或实例来佐证和充实概念。通过概念和连接词构成的命题的形式可生动形象地反映出概念之间的意义联系。学生掌握概念图策略的过程可分为以下3个环节:

首先,教师要结合具体实例给学生讲清楚概念图的构成及其制作步骤,给学生做出示范;

其次,学生模仿教师的步骤,师生共同编制概念图,教师及时给予指导,使学生初步掌握概念图的制作技术;

最后,学生自己制作有关的概念图,并相互交流、比较和评价,及时对自己的概念图进行修改和补充,从而加深对有关概念及其内在联系的理解。一般通过这三个环节的学习,学生都能掌握概念图策略,而且有的学生还能绘制出一些极有创造力和趣味性的概念图。

概念图是一种能形象表达命题网络中一系列概念含义及其关系的图解。对于化学概念学习,只有理清概念关联,并纳入系统之中,才能真正掌握它。当学生把所学到的化学概念经过自己的综合整理,并通过分析概念的内涵和外延将分散的概念系统化、结构化时,他们对概念的把握才能更准确,理解得更深刻,并且能够对其他化学知识的学习产生积极、有效的迁移。化学知识的系统化就是要突出概念之间的联系,形成知识网络。化学概念教学深化阶段的主要任务就是概念体系的建立。因此,化学教师应积极引导并教会学生把学过的概念进行分析、比较,揭示概念的共性、特性、联系和差别,形成概念的结构。

概念图作为一种教学策略,强调学生自身对知识的建构过程,注重师生之间的互动关系。

概念图已被证明为有效的教学策略,但要防止变成灌输学习、机械学习的又一种工具。教学中,教师一方面要启发学生掌握这种结构化的方式,使教学策略转化成为学生的有效的学习策略;另一方面,借助于概念图,还可培养学生的元认知能力,即引导学生注意改进个人的学习方法,提高自我监控的能力和意识。

当然,不论哪种教学策略,它在适用范围上都有一定的限制。这就要求教师在教学中应充分考虑学生的个性与特性,根据实际情况选择最佳的教学策略,在教师与学生相互沟通、相互学习中实现学生认知成长的过程。

参考文献:

[1]张大均.教与学的策略[M].北京:人民教育出版社,2003.

[2]张庆林.当代认知心理学在教学中的应用[M].重庆:西南师范大学出版社,1995.

[3]刘电芝.学习策略研究[M].北京:人民教育出版社,1999.

[4]钟启泉.崔允,张华.《基础教育课程改革纲要(试行)》解读[M].上海:华东师范大学出版社,2001.

化学反应的基本特征篇(6)

关键词:过程生成;矩阵对角化;研究性教学;教学设计

中图分类号:G642.0 文献标识码:A 文章编号:1674-9324(2012)06-0191-03

研究性学习不愧为创新教育的有效方法,然而由于种种原因却很难广泛实施。因此退一步思考:参照研究性学习方法设计研究性教学模式,即可能克服研究性学习实施中的实际困难。所以本文基于“过程生成”教学理念,以高等数学为例,探讨研究性教学模式及其教学设计。

一、“过程生成”理念

基于过程哲学思想,参照基础教育新课改的三维目标,笔者提出“过程生成”教学理念。

教学是动态的知识生成过程。该过程始于某种背景,在思想、情操的层层支配下,激发对学习目标的步步追求,从而诱导已有知识、技能、方法的循循摄入,形成流变与合生:创造新知识、练就新技能、获得新方法、增长新智慧、形成价值观、积聚创造能量。过程生成并非是过程与生成的简单叠加,而是强调在过程中生成。因为对教学而言,有过程未必有生成,有生成未必有良好的过程。同时过程是基础,生成是创造,二者缺一不可,相辅相成。过程生成教学以怀特海的过程哲学为思想观念,以波兰尼的意会哲学为认知方法,以基础教育新课改的三维目标为基本要求,以知识在过程中生成为基本策略,以整体性(反对片面认知)、连续性(反对支离破碎)、摄入性(反对强加于人)、生成性(反对简单注入)为基本原则。

二、研究性教学述说

关于研究性教学的研究为数不少,但有的等同于研究性学习,有的则是探究式教学,等等,尚无定论。笔者的观点是移植研究性学习到研究性教学。因为研究性学习,是学生在教师指导下,从自然、社会和生活中选择和确定专题进行研究,并在研究过程中主动地获取知识、应用知识、解决问题的学习活动。而实施的一般步骤是:确定课题制订计划搜集资料总结整理交流评价。所以研究性教学是教师向学生展示针对学习内容而提出课题、研究课题、获取知识、应用知识、解决问题的过程。其实施的一般步骤是:提出课题拟定方案搜集资料探究论证总结应用。基于“过程生成”理念的研究性教学,亦即是在“过程生成”理念指导下实施研究性教学。

三、案例设计

基于张禾瑞、郝鈵新的《高等代数》教材,设计线性变换对角化问题的研究性教学案例如下:

1.提出课题。我们已知:若V是数域F上的n维向量空间,σ∈L(V),{α1,L,αn}是V的一个基,σ关于此基的矩阵为A,则?坌ξ=(α1,L,αn)x∈V((X=x1,L,xn)T)σ(ξ)关于{α1,L,αn}的坐标是AX,可见σ(ξ)坐标计算的复杂度完全取决于A,于是就希望:找到v的一个基,使得σ关于此基的矩阵最为简单。

2.拟定方案。首先确定具体目标:因为对角形矩阵最简单,所以希望σ关于某基的矩阵为对角形,不过遗憾的是这是不可能的(分析略)。于是有两种选择:一是寻求能是对角形的条件,二是因为对角形矩阵是准对角形矩阵的特例,所以先以准对角形为目标,得到结论后再研究特殊情况,当然选择后者!其次确定研究路线:因为n维空间有无穷多个基,所以不能一一试探,于是一种可能的做法是:任取基{α1,L,αn}及相应的矩阵A,设法由{α1,L,αn}变得{β1,L,βn},使σ关于{β1,L,βn}的矩阵为准对角形。为了表述方便,对于σ∈L(V),若存在V的基使σ关于此基的矩阵是对角形(准对角形),则称σ可对角化(或可准对角形化)。这样即确定研究方案如下:对于σ∈L(V),(1)研究σ可准对角形化的条件;(2)在准对角形化的基础上研究σ可对角化的条件及方法;(3)对于不能对角化的σ,研究特殊的准对角形矩阵问题(亦即是有理标准形、若而当标准形问题,如教学计划没有要求,可请同学们自行研究)。

3.搜集资料。综括已经学过的相关的概念、结果及相互关系(略)。

4.探究论证。Ⅰ、探究σ可准对角形化的条件。欲求之,先设之,寻觅方法:设σ关于基{β1,L,βn}的矩阵为B=diag(Br,Bn-r)(其中下标表示方阵的阶数),那么由σ(β1,L,βr,βr+1,L,βn)=(β1,L,βr,βr+1,L,βn)B可得:(σ(β1),L,σ(βr))=(β1,L,βr)Br,(σ(βr+1),L,σ(βn))=(βr+1,L,βn)Bn-r由此发现,若W1=L(β1,L,βr),W2=L(βr+1,L,βn),则:(a)、σ(W1)?哿W1,σ(W2)?哿W2,具有如此性质的W1、W2保证了B是准对角形。所以应关注这样的子空间,为说话方便称具有如此性质的子空间σ为的不变子空间(或σ-子空间)。显然,如果只考虑σ在Wi上的作用(为方便,称之为σ在Wi上的限制,记为σ|Wi),那么σ|在Wi即是Wi上的线性变换,且σ|在W1关于{β1,L,βr}的矩阵是Br,σ|W2关于{βr+1,L,βn}的矩阵是Bn-r。(b)、V=W1?堠W2,此条件保证W1与W2的基构成了V的基,并且σ关于此基的矩阵就是B。因此得到猜想:“若向量空间能分解为不变子空间与的直和,那么就存在的基,使得关于此基的矩阵就是”。于是深入认识不变子空间,证明猜想并予推广等,参见教材275~278进行设计处理。Ⅱ、寻求σ可对角化的条件及方法。①基本分析。据Ⅰ结论可知:σ可对角化?圳V能分解为一维σ-子空间的直和。并当V是一维σ-子空间W1、…、Wn的直和时,任取Wk的基{βk},则σ(βk)=λkβk且{β1,L,βn}构成V的基,于是σ关于{β1,L,βn}的矩阵是diag(λ1,L,λn)。可见具有性质σ(βk)=λkβk的基是可对角化的关键,为了方便称满足σ(ξ)=λξ的λ为σ的特征值、ξ为σ属于λ的特征向量(其中,λ∈C,ξ≠0,因为基向量不能为0)。这样又可说:σ可对角化?圳σ存在n个线性无关的特征向量。所以研究应从特征根与特征向量开始。②特征根与特征根向量的研究。首先应考虑是否任一线性变换存在特征根与特征向量,为此可考查已知道的线性变换(如教材255~257页之例1例8、及265页之第2题等),结果是不一定。于是即需寻求特征根与特征向量的存在条件及求法,为此任取V中向量考查,因为V是n维空间,所以V中向量都可用其基表示,任取V的基{α1,L,αn}及相应的σ的矩阵A,那么,?坌ξ∈V都存在X∈Fn,使得ξ=(α1,L,αn)X,所以,σ(ξ)=(α1,L,αn)AX,于是有:σ(ξ)=λ(ξ)?圳AX=λX?圳(λI-A)X=0,进而得:ξ是σ属于特征根λ的特征向量?圳(λI-A)X=0有非零解ξ?圳|λI-A|=0。所以:λ是σ的特征根?圳λ是|λI-A|的根;|λI-A|=0?圯σ有属于λ的特征向量,并且(λI-A)X=0的任一非零解都是σ属于λ的特征向量。也就是说可从A来求得σ的特征根与特征向量,但随之而来的问题是:如另取基{β1,L,βn}及相应的矩阵是B,是否会得到不同的特征根与特征向量?分析:其一,由B:A可得fB(λ)=fA(λ),说明特征根与基的选择无关,因此即可称fA(λ)为σ的特征多项式,记fσ(λ)=fA(λ);其二,因为B:A?圳B=T-1AT,于是(λI-B)X=0?圳T-1(λI-A)TX=0?圳T-1(λI-A)Y=0,说明特征向量也与基的选择无关,于是可称(λI-A)X=0的解空间为σ属于特征值λ的特征子空间,记为Vλ。为了后续研究需要深入了解特征多项式、特征根、特征向量、特征子空间(参见教材相关内容278~285)。③对角化的条件及方法研究。能求得特征根与特征向量,也就有了对角化的基础。为了寻求可对角化的具体条件和方法,假定{β1,L,βn}是σ的基,且σ(βk)=λkβk,其中λ1,L,λn中可能相同。为了寻找规律,将其进行规整:不妨设其中λ1,L,λt互不相同,且有s1个λ1,…,st个λt,s1+L+st=n,β1,L,βn那么也可相应地重新编号为β11,L,β1s■,L,βt1,L,βtst,满足σ(βkj)=λkβkj(j=1,L,sk),这样即可写出关系式:

σ(β11,L,β1s■,L,βt1,L,βtst)=(β11,L,β1s1,L,β1s■,L,βtst)

,记 (*)

由(*)可见:(1)若B是σ的矩阵,则问题已经清楚,然而注意到λk是fσ(λ)的根,但fσ(λ)的根不一定在F中,所以未必有B∈Mn(F),于是σ能否对角化的关键之一是σ的特征根是否都在F中(为区别称σ在F中的特征根为本征值,相应的特征向量为本征向量);(2)由σ(βkj)=λkβkj知βk1,L,βkSk∈λk但如果dimλk<sk,那么βk1,L,βkSk就不存在;(3)β11,L,βkSk,L,βt1,βkSk能否是V的基,取决于σ属于不同特征根的特征向量是否线性无关。于是应该研究以下问题:(a)属于不同特征根的特征向量是否与线性无关;(b)是否dimVλ■≤Sk(为方便称dimVλ■为λK的几何重数,而Sk为λK的代数重数);(c)猜想:σ可对角化?圳σ的特征根都在F中,且每个特征根的几何重数=代数重数。

关于(a),参照教材的定理7.6.1及推论7.6.1的证明设计研究过程288~289。

关于(b),分析dimλk:因为?坌ξ∈Vλ■?圯σ(ξ)=λKξ,所以感觉且易证Vλ■是不变子空间。鉴于不变子空间的研究经验,将Vλk的基α1,L,αS扩充为V的基,则σ关于此基的矩阵是AλKIs* *,所以fA(λ)=(λ-λK)sg(λ),可见λK的重数不小于s,即dimVλ■=s≤sk,即得:λK的几何重数≤λK的代数重数。

关于(c),在以上讨论的基础上,参见教材的相关证明291~292设计研究过程。

完善σ可对角化的理论,如教材的推论7.6.2等289。

④矩阵对角化问题。从上述讨论可见,σ对角化实质上是σ的关于某个基的矩阵的“对角化”,所以可相应地给出矩阵对角化的概念及结论(略)。

⑤结论。系统总结,给出所得知识结构图,且做综合应用练习(参见教材294~295,并补充应用例子)。

探究:限于篇幅,本文从略,参见文献。

四、结语

本文提出了研究性教学及基于“过程生成”理念的研究性教学模式,并以对角化问题为例给出了教学案例。该案例设计体现了整体性:以准对角化向下拓开而得到对角化、有理标准形、若当标准形,使学生很清楚地认识到相关知识的整体脉路;体现了连续性:整个思维过程都是连续的,没有产生断层;体现了生成性:所有概念都是在研究过程中根据需要而命名的,所有结论都是在研究过程中获得的,没有丝毫的注入行为;体现了摄入性:研究进程的每个环节都是思想、情感、思维、相关知识的综合演变体,其中通过相互摄入作用而形成阶段性共生,且推动研究进入下一个环节(限于篇幅不便具体分析)。总之该案例符合“过程生成”教学思想。

研究性教学的目的是将教师指导学生研究性学习的过程转变为教师向学生展示一种研究过程,以解决因班容量大、课时紧张等客观原因而不能实施研究性学习的矛盾。这样做尽管不是学生亲历,但只要教师处理得当,使学生与教师思维共鸣,也能使学生得到研究过程的历练,受到创造性思维的熏陶。笔者的教学实践证明,如此教学很受学生欢迎,有益于提高学生的基本素质及创新能力,效果良好。当然如果条件允许,完全可以此为基础变形为其它教法,效果会更好。

因篇幅所限,本文只做了简要的介绍,希能抛砖引玉,不妥之处,敬请斧正。

参考文献:

[1]中华人民共和国教育部教育部.普通高中“研究性学习”实施指南(试行)[J/OL].2001,(2001-04-09)[2011-10-26].

[2]崔允漷,安桂清.试论普通高中研究性学习的课程框架[J],教育发展研究,2003,(6):24-29.

[3]张禾瑞,郝鈵新.高等代数[M].5版.北京:高等教育出版社,2007.

[4]王积社,杨晓鹏.高等代数典型问题精讲[M].北京:科学出版社,2010.

[5]王积社.《系统科学视阈下:对三维目标的过程化解读[J].《大家》杂志(待发表).

化学反应的基本特征篇(7)

关键词:内容过滤;垃圾邮件;机器学习

中图分类号:TP393文献标识码:A文章编号:1009-3044(2007)06-11627-02

1 引言

近几年来,垃圾邮件在网络上越来越泛滥。据[23]的一份调查和预测报告显示,2003年网络上传送的邮件中有45%是垃圾邮件,这些垃圾邮件以每天130亿封的速度传送;而到2007年,垃圾邮件所占的百分比估计增加到70%,同时每天以540亿封的惊人速度传送。垃圾邮件是极富危害性的,首先它大肆地占用宝贵的网络带宽资源,使邮件用户和企业蒙受经济损失;其次那些传播色情、反动信息的垃圾邮件给社会带来了极大的精神污染。

从技术上解决垃圾邮件问题的方法大致分为两类,一类是基于内容分析的过滤方法,另一类方法则对邮件内容不作任何分析,这类方法我们统称为非内容分析过滤。非内容分析过滤中最著名的是黑名单(Blackhole List)技术,这种方法是由一个可信赖的组织来维护一个垃圾邮件制造者的名单列表,垃圾邮件过滤器根据发送者地址是否在黑名单中来识别垃圾邮件。黑名单技术存在两个明显的缺陷:(1)需要人工维护和更新列表;(2)垃圾邮件通过地址伪装很容易逃避过滤器的检测。相比之下,基于内容的过滤器由于将邮件内容视为最重要的过滤证据,因此要相对安全一些。最简单的内容过滤器只需要简单地设置几个关键词,而不考虑它们出现的上下文环境;复杂的内容过滤器则要智能得多,它们要对邮件的正文和主题进行全面分析,并且常常和机器学习方法结合在一起,以便自动学习各种邮件模式。这种智能的基于内容的邮件过滤器的基本思想是:首先确定一个训练集,训练集中的垃圾邮件和合法邮件已被人为正确地标示了,然后选择一种机器学习算法,在已经标示的语料上训练一个过滤器,最后用训练好的过滤器对新邮件进行甄别。基于内容的垃圾邮件过滤器的优越性在于,它不需要人工创建繁琐的黑名单列表、过滤规则集,用户唯一要做的是基于自己的标准收集一定量的垃圾邮件和合法邮件,过滤器会自动地完成训练,更新自己的模式库。[3,4,5]

本文按如下方式组织:第2节介绍如何从电子邮件中提取特征并计算特征的权值,即邮件的表示问题;第3节讨论基于内容的邮件过滤器是如何利用机器学习方法构造的,并简要对这些机器学习方法进行评价;最后是有关结论。

2 电子邮件的表示

要对邮件的内容进行解释过滤,首先得选择一种适当紧缩的机器可懂的方法来表示邮件内容,也就是说,在过滤之前,首先要解决邮件的表示问题。由于垃圾邮件过滤器实际上是一个特殊的二类文本分类器,因此文本分类中的表示方法对邮件也是适用的。在文本分类中[1],文档dj常被表示为特征向量 j=,其中tk是dj特征项,wjtk为特征项tk在文档dj中的权值。可以看到,采用这种方法表示邮件,要解决3个问题:(1)采用什么样的方式定义特征;(2)如何选择特征;(2)如何计算各特征项在邮件中的权值。

2.1特征定义

特征定义的方法有很多种,最常见的是将单词作为特征项,每个特征项对应训练集中的一个单词,这种表示方法称为“词袋”(bag of words)表示法[1,4,6]。词袋表示法要注意两个问题,第一是要筛选掉那些出现频率极高和极低的单词。这些单词被认为是“中立”的,不倾向于任何类别,对分类没有贡献。频率极高的单词,如英语中的“at”,“the”等,汉语中的“的”,“了”等,这些单词即是所谓的停用词(stop-word),可以事先将它们收集到一个停用表(stop list)中。另外一个问题是要对单词进行简单的词法分析处理。英语中的单词常有形态的变化,如单词“builder”,“building”都是由“build”变化而来的,在词袋表示法中要将它们还原,以避免这些仅仅是形态不同的单词被选择多次,这个过程称为词干化(stemming)。汉语虽不像英语那样有丰富的形态变化,但是汉语中的词与词之间是没有空格的,因此对中文邮件采用词袋表示法,首先就得分词,这是比词干化更困难的问题。去掉停用词和词干化虽然在英语文本分类中常被使用,但是也有人质疑它们的有效性[6,7],认为有些停用词对分类是有贡献的,如“now”,而词干化则会删除一些有用的信息,如“building”被词干化为“build”时,可能也就删除了现在进行时的时态信息。因此构建停用表和运用词干化时要谨慎。

2.2特征选择

如果我们选取训练集中的所有特征(称之为原始特征集)来构建特征向量并以此表示邮件,那么就必须面对两个问题:(1)特征空间的维数很高以及由此导致的数据表示的稀疏性[2];(2)模型推广能力差[4]。因此有必要进行特征选择,特征选择就是从原始特征集中按照某个标准选择一个特征子集,作为最终用来表示邮件的特征。特征选择的算法很多,这里简要地介绍几种典型的特征选择算法:信息增益(IG),互信息(MI),文本频率(DF),x2统计(CHI)。它们的共同特点是依据训练语料的统计信息,计算特征项的某种“分值”(score),然后选择分值大于预先定义的阈值的那部分特征作为邮件的表示特征。

信息增益(IG)计算特征项出现和不出现对预测邮件类别的信息量,也就是当我们知道某个特征项出现和不出现的情况下,文本类别的不确定性(熵)减少了多少。假设{ci} 是目标空间的类别集(在邮件过滤中, 取为2,即只有垃圾邮件spam和合法邮件legit两个类别),则特征项t的信息增益定义为:

互信息(MI)计算特征项 和邮件类别c的互信息:

在特征选择时特征项 的互信息分值可以定义为它与所有类别互信息的最大值 ,也可以定义为平均值

文本频率(DF)表示训练语料中出现特征项 的邮件的数目,这是最简单的特征选择算法,但是它具有线性复杂度,容易扩展到大规模的训练集中,同时效果也很好[2]。

x2统计(CHI)衡量特征项t和邮件类别c的的相关性[13],计算公式为:

其中N是训练集中邮件的数目。特征项t的分值可以取均值

2.3 特征向量权值估计

最简单的权值估计方法是布尔表示法(又称为二值表示法),即如果特征项tk在邮件ej中出现,其权值就为1,否则为0。这种方法无法体现特征项在邮件中的作用程度,现在较常用的权值估计方法是用特征项在邮件中的出现频率作为其权值的估计量。特征项的出现频率有两种:绝对频率(TF)和相对频率(TF-IDF),绝对频率就是特征项在邮件中的出现次数;相对频率是在绝对频率TF的基础上再乘以特征项t的逆文本频ID1得到的。特征项t的逆文本频IDF定义为:,其中N是训练集中邮件的总数目DF(t)是特征项t的文本频率

归一化的TF-IDF为:

3 基于内容的邮件过滤器的构造

当我们把邮件表示为加权特征向量后,接着的工作就是要选择一种学习算法,在熟语料上训练一个学习机,也就是过滤器。构造过滤器常用的机器学习方法有朴素贝叶斯、支持向量机等,近年来,自然语言处理中的最大熵方法也被用到文本分类和邮件过滤中,下面我们简要地介绍和评价这三种机器学习方法构造的邮件过滤器。为了方便,引进以下符号:

而P(tj|C)是容易从训练语料中估计的。令 count(tj,ci)表示特征tj在类别ci中出现的次数, count(ci)表示所有特征在类别ci中出现的次数之和,则:

3.2支持向量机(Support Vector Machine)

支持向量机是近年来非常流行的一种机器学习方法,在文本分类和邮件过滤中都得到了成功的应用[4,17]。支持向量机建立在统计学习理论的基础上,针对2类分类问题,在特征空间中寻找满足结构风险最小化原则的最优超平面作为两类的分类面。设类别ci∈{-1,1},当ci=1时,其对应的样本称为正例样本,即合法邮件;ci=-1时,其对应的样本称为反例样本,即垃圾邮件。如果正例和反例样本是线性可分的,则SVM试图寻找一个超平面H: * +b=0 ,它将正例和反例正确地分开,同时使它们之间的间距(称为分类间隙,Margin)最大,这样的超平面称为最优分类面。其基本思想如图1。

支持向量机找到最优分类面H,将正例样本和反例样本正确地分开,同时使它们的间隙 最大;离分类超平面H的最近的样本是支持向量(用圆圈标志的样本)

图1 支持向量机找到最优分类面

为了找到最优分类面,SVM求解以下的约束优化问题:

其中(9)表示最大化分类间隙,而(10)则要求所有的训练样本都被正确地分类。上面这个优化问题不容易求解,引入Lagrange乘子ai,将其转化为等价的对偶问题:

这是个2次优化问题,[16]中给出了求解该问题的一个高效率的算法。求解的结果就是Lagrange系数的值a *,它们被用来构造最终的分类超平面H:

从(13)是可以看到,最优分类面实际是训练样本的线性组合,并且只有那些Lagrange系数大于0的样本对最终的分类超平面才有真正贡献,这些样本我们称为支持向量,它们离分类超平面最近,在图(1)中这些样本用圆圈标示。为了计算b,可以从正例支持向量和反例支持向量中各任意挑选一个向量 +和 -,按(14)式计算。

上面我们讨论的是在线性可分的情况下,支持向量机如何寻找最优分类面。对于不可分的情况,可以采用两种方法构造支持向量机,一种方法是将线性SVM拓展为软边缘分类器(Soft Margin Classifier),另一种方法是构造非线性的SVM(Nonlinear SVM)。前者通过引入松弛因子,允许分类错误;后者通过核函数(Kernel Function)将一个非线性问题转化为高维特征空间的线性问题。关于软边缘分类器和非线性SVM的详细介绍参看[15],这里不再赘述。

3.3对上述两种机器学习方法的评价

朴素贝叶斯在计算类条件概率密度时引入一个独立性的假设,使得计算变得可行且简单,由于它不需要考虑特征项的各种复杂组合情况来预测类别,因此训练和识别速度都非常快。[3,14]的实验证实,朴素贝叶斯在垃圾邮件过滤和其他的分类问题中,有较好的性能表现。但是,它的独立性假设和实际情况不相符,特征项之间并不是相互独立的。支持向量机是近几年来研究比较热的机器学习方法,它有许多优点,如可以处理高维空间问题,同样不做任何有关特征的独立性假设,容易处理稀疏的向量表示问题等[17],这些优点都是非常有利于文本分类的。但是,支持向量机其训练过程也是耗费时间的。

4 结论

垃圾邮件问题在最近几年来越来越严重,已引起了许多国家、企业和研究者的关注和高度重视。基于内容的垃圾邮件过滤器和机器学习紧密结合,提供了一种高效的解决垃圾邮件问题的技术手段,一方面它不需要人工收集过滤规则、创建黑名单,过滤器可以自动地学习各种垃圾邮件模式,对邮件内容进行全面分析;另一方面它可以提供个性化的服务,捕捉用户的个人兴趣,根据用户的个人兴趣过滤邮件。

参考文献:

[1]Fabrizio Sebastiani. 2002. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1-47, 2002.

[2]Y.Yang and J.O.Pedersen. 1997. A comparative study of feature selection in text categorization. In Proceedings of the 14th Int. Conf. Machine Learning.

[3]M.Sahami, S.Dumai, D.Heckerman, and E.Horvitz. 1998. A Bayesian approach to filtering junk e-mail. In AAAI'98 workshop Learning for Text Categorization, Madison, WI.

[4]H. Drucker, D. Wu, and V. N. Vapnik. Support Vector Machines for Spam Categorization. IEEE Transactions on Neural networks, 10(5), 1999.

友情链接