期刊大全 杂志订阅 SCI期刊 投稿指导 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 个性化推荐系统

个性化推荐系统精品(七篇)

时间:2022-05-27 12:54:20

个性化推荐系统

个性化推荐系统篇(1)

论文关键词:学习风格,Web挖掘,个性化推荐,AprioriAll算法

 

一、引言

基于Internet技术的教育网络化趋势不仅为学生提供了便利的学习方式和广泛的选择,也为学校提供了更加深入地了解学生需求信息和学生行为特征的可能性。但随着Web上信息量的爆炸式增长,网上的资源得到极大丰富的同时也充斥着大量的垃圾信息,当学生们面对这些庞大芜杂的信息海洋时变得无所适从,因而迫切需要能从这些纷繁芜杂的信息海洋中主动过滤并推荐给学生他们所需信息的个性化辅助教学推荐工具,本文就是针对这个问题而提出的。

目前人们利用数据挖掘技术,提出了许多个性化推荐系统。本文提出通过心理学量表对学习风格进行测试,并针对实际收集到数据的稀疏特点,采用项目评分预测的协同过滤算法[1](Item-Based Top-N推荐算法),尽可能准确地测试出学生的学习风格。然后结合Web日志挖掘技术,收集不同风格学生浏览网页的特点,通过AprioriAll算法求解频繁访问序列[2],得到不同风格学生的Web使用习惯,然后依据当前学生浏览页面向学生实时推荐下一步可能会访问的部分网页个性化推荐,提高学习效率。

二、个性化教学系统结构设计

根据WWW体系结构和网络学习系统的特点,需要采用一种新的设计框架来处理挖掘过程。作者采用挖掘学生历史浏览行为(记录在服务器日志中)和分析学生学习风格这两类特征来构建学生模型。

首次登陆系统时需对学生的学习风格进行测试,首先利用项目评分预测协同过滤算法(Item-Based Top-N)对未评分的项目进行评分,然后统计总分即可得到学生的学习风格类型这一特征值;对于己注册的学生则提取MFR路径(最大前引用)对Web服务器中的Web日志进行预处理,可得到学生最大向前向访问的路径,再用AprioriAll算法挖掘学生访问网页的频繁序列,把这一频繁序列作为特征值连同学生风格这一特征值进行数据预处理,即可得到学生个体兴趣模型,然后对其进行访问模式挖掘即可得到学习风格类型相同的学生所具有的访问模式,最后根据这一访问模式利用个性化推荐算法进行学习内容推荐。本文的系统结构设计如图1 所示。

图1个性化挖掘和推荐模块

三、 实现个性化教学推荐系统的关键步骤

1 构建学习风格及兴趣模型

学习风格是学生对学习方法的定向或偏爱,是学习者特有的认知、情感和生理行为,是学生持续一贯带有个性特征的学习方式。因此本文结合学习风格构建能代表学生特征的学生学习风格及兴趣模型。为了更加准确的测试出学生的学习风格类型,本文采用了所罗门风格量表和Kolb风格量表进行测试,由于学生数目的急剧增加和项目众多的风格量表导致学生评分数据的不完善,而产生了数据的稀疏性,这使得计算目标用户的项目评分后不能准确的测试出学生的学习风格。本文来采用基于项目评分预测的协同过滤推荐算法[1]计算项目间的相似性,预测学生对未评分项目的评分,就可以有效地解决数据稀疏情况下的学习风格的测试问题,能更加准确的测试出学生的学的风格毕业论文范文。具体实现如图2所示。

图2学习风格的测试流程

首先可以得到学生学习风格测评数据矩阵,假设用户为User-1,User-2,…,User-n,心理学量表的测量相目为Item-1,Item-2,…,Item-m,这样矩阵的形式如图3所示。

显然当缺少学生对某一些项目的评分时,量表就无法完成对学习风格的评价,在自主学习的环境产生这种现象中是很常见的。为此有必要填补学生未评分的部分,完成对学习风格的评价。作者通过两步来完成对未评分项目的填充:

 

用户\项目

Item-1

Item-2

Item-j

Item-m

User-1

R11

R12

R1j

/

User-2

R21

/

R2j

R2m

/

 

  …

User-i

Ri1

Ri2

/

/

User-n

/

Rn2

Rnj

个性化推荐系统篇(2)

关键词:电子商务;协同过滤;个性化推荐系统

0 引言

随着互联网走进各家各户,电子商务发展越来越快,服务和产品也越来越多,这就造成信息过于冗杂,客户面对海量选择,往往要浪费很多时间来挑选自己需要的商品。为了使消费者避免浪费时间,已更加从容的心态来购买商品,电子商务推荐系统可以精确识别消费者的喜好,模拟销售人员帮助消费者完成购买,给消费者想要的推荐,让挑选变得简单。统计学、人工智能数据挖掘等技术都应用于电子商务推荐系统(Recommendation Systems)中,想要引导消费者完成购买行为,就要先分析消费者的购买意愿,所谓知己知彼百战不殆,分析消费者访问网站的行为,并最后给出令客户满意的推荐结果,来产生丰厚的利润。所以说,推荐系统的核心便是推荐结果是否准确,如果是客户需要的,则会提高顾客的购买意愿;反之如果推荐结果不合顾客的意,那便是端起石头砸自己的脚,客户也会对推荐系统产生怀疑,购买兴趣大大降低。

1 推荐系统介绍

对客户行为信息进行收集的记录模块、对用户喜好进行分析的模型分析模块、推荐系统的核心推荐算法模块以及处理售后服务的反馈处理模块组成了一个完整的推荐系统。将对的商品推荐给对的人就是推荐系统的目标,常见的推荐机制算法有三种,分别是基于关联规则的算法(Association Rule_based Recommendation)、基于内容的推荐算法(Content-based Recommendation)、协同过滤推荐算法(Collaborative Filtering Recommendation)。算法数据的表示不是很复杂,一个二维表或者是一个MXN的矩阵足以。把日志或消费类的数据通过一定的预处理,所有的商品类目用列表示,所有用户用行表示。

把用户的购买需求转化成购买结果,这是一个电子商务推荐系统的终极目标,也是衡量推荐机制好坏的标准。在实际生活中,消费者去实体店购买商品,会有“导购员”进行服务,提高消费者的购买意愿,而在电子商务网站中,推荐系统就是这个“导购员”。一个好的推荐系统就像一个好的“导购员”一样,让消费者了解商品后更加愿意购买商品。主要实现一下功能:①完善用户体验,给出个性化推荐;②更好的向消费者展示商品,提高转换率;③发现消费者潜在需求,挖掘更广的市场。

网站的推荐形式多种多样,经常用到的有三种:①根据会员的历史购买记录,来进行推荐机制的营销;②由购物车或物品收藏来做相似物品推荐;③针对消费者的历史信息来做相关推荐。

个性化推荐系统能够深度挖掘电商消费者的兴趣,增强消费者持续购买的意愿,从而形成信任关系达到维系老客户,减缓以及解决现在电商平台存在消费者持续购买意愿不强的问题。我们假设一下,如果没有了推荐系统的精准推荐,消费者可能将要花更多的时间来找自己中意的商品;如果失去了系统的热门推荐,消费者将很难买到质量好价格低的产品;如果失去了推荐系统的辅助政策,消费者做出的选择往往不是最优的,这样也不会购买到自己感到满意的产品,对网站也不会有好感度,二次购买也不会再有了。这对卖家和买家来说都是损失,因此电商平台是一种双赢的表现。

2 协同过滤推荐

假如两个用户过去有相似的喜好产品,那么他们现在依然有相似的喜好产品,这是基于用户(user-based)的协同过滤;假如有用户过去喜好某产品,那么他现在任然喜好与该产品类似的产品,这是基于项目(item-based)的协同过滤。传统协同过滤算法一般就分为这两种,协同过滤不需要获得产品或用户特征,而是凭借相似性度量方法和评分数据来进行预测,只要评分数据越多,预测也会变得更精准。

协同过滤作为目前最成功的推荐技术之一,已被广泛应用于各类电子商务推荐系统及互联网的相关领域,譬如国外的Amazon, eBay, NetFlix以及国内的淘宝网和当当网等等。伴随电子商务的不断发展,用户数量也飞速增加,用户―项目评分数据的维度急剧增高,可是用户给予的评价却不是很多,使得传统的协同过滤推荐面临严峻的用户评分数据稀疏性问题。同时,用户的需求也在随着时间改变,而传统协同过滤并不能很好的解决这个问题,存在着局限性。所以,如何捕捉移动的用户感兴趣的信息已经变成电子商务亟待解决的问题。

3 典型应用

亚马逊作为电商平台的领头羊,推荐商品占销售总量的百分之四十,同时也是较早使用推荐系统的电子商务平台,当然他们的推荐形式也是别出心裁。例如,一位顾客买了一个相机,系统就会自动的给他推荐能用到的电池产品。但是由于商品多样化的趋势,亚马逊电商平台不断更新后数据分析能力的增强,推荐系统可以推荐购买过该产品的用户还购买的其他产品。

由于使用真实的购买数据,而不是假设消费者会购买什么商品,亚马逊能够提出非常精准的提h。例如提示“购买此商品的用户同时购买”,就是一种很机智的营销手法,可以让消费者横向比较,开阔自己的眼界,更加容易找到自己的需要。

亚马逊使用的是“协同过滤”算法,这种算法把消费者串联起来,有相似兴趣行为的划为一组,参照消费者的购买历史,经常做到事半功倍。任何人的兴趣都不是孤立的,这就是“协同过滤”算法的出发点,应该处于一个群体所感兴趣的产品中,就是如果一群消费者对一个商品的评分很相似,那么他们对另一个商品的评分也不会相差很多。该推荐算法的核心在于采用技术找到于目标消费者有相似兴趣的消费者,然后根据相似消费者对目标商品的评分做出推荐,并且把测试评分最高的多项商品作为该消费者推荐列表。

亚马逊的页面分为非登录用户和登录用户。对于非登录用户,亚马逊会推荐各个类目的畅销品,换言之就是排行榜。查询浏览页面和详细的商品页面则会有关联推荐,比如“购买此物品还可购买”;通过人的相似兴趣来推荐,像“购买此物品的顾客也购买了”,“看过此商品的顾客购买的其他商品”。

而对于登录用户,亚马逊的推荐方式却截然不同,首页的页面会有一个今日推荐的栏目,这个栏目是由用户的历史浏览记录生成出来的,在下面是最近一次购买商品给的记录以及类似商品的推荐,如“根据浏览推荐给我的产品”,“浏览XX商品的用户会买XX的概率”,有意思的是,每个页面的最下方都会根据消费者的浏览内容给出对应的推荐,没有浏览记录的会推荐系统畅销。

4 结论

当然,一个好的推荐系统不可能一挥而就的,想要成功,需要不断的积累经验,收集客户的数据,从算法、计算效率上寻找突破点,在不断的更新中,逐渐的完善系统,并建立稳定的客户群。另外,每个人都是不一样的,推荐系统要想成功,还要做到因人而异,区别对待,让消费者真真切切的感受到贴心的服务,这样也就离成功不远了。

基金项目:本文系天津市大学生创新创业训练计划项目“个性化推荐算法在微课学习系统中的应用研究”(项目编号:201610069094)研究成果之一。

参考文献

[1] 王桂芬.电子商务个性化推荐系统中协同过滤算法的研究与应用[D].南昌:南昌大学,2012.

个性化推荐系统篇(3)

>> 个性化推荐系统在电子商务网站中的应用研究 推荐系统在高校图书馆中的个性化应用研究 学分银行平台的知识汇聚与个性化推荐系统应用研究 基于数据挖掘的个性化智能推荐系统应用研究 网络数据挖掘在图书馆个性化推荐中的应用研究 基于社交网络数据的个性化推荐研究 基于协同过滤在高校学习资源个性化推荐系统中应用研究 关联规则和事务集分组技术在图书馆个性化推荐系统中的应用研究 个性化推荐技术在政府网站中的应用 用户特征协同过滤方法在个性化商品推荐中的应用研究 协同过滤技术在学习资源个性化推荐中的应用研究 个性化推荐系统研究 购物网站个性化推荐系统应用分析 个性化推荐系统的采集模块研究 特征提取技术在个性化网页推荐系统中的应用 浅谈Mahout在个性化推荐系统中的应用 个性化推荐系统在中职教育领域中的应用 文本数据挖掘在电子商务网站个性化推荐中的应用 基于用户浏览行为挖掘的网站个性化推荐系统 个性化授权机制在图书馆文献提供系统中的应用研究 常见问题解答 当前所在位置:l.

[2] 陈敏.个性化推荐系统研究[D].南京邮电大学,2012.

[3] 曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002(10).

[4] 田莹颖.基于社会化标签系统的个性化推荐[J].图书情报工作,2010(1).

个性化推荐系统篇(4)

[关键词]高校图书馆;推荐系统;推荐技术;推荐算法;推荐服务

[DOI]1013939/jcnkizgsc201704221

高校图书馆拥有丰富的藏书资源,是知识和信息的集散地,但是在知识爆炸的时代,移动设备频频更新换代,读者阅读行为已经改变,如果图书馆不能推出新的面向读者的服务方式,高校图书馆将无法很好发挥其资源的优势。在这种环境下,文章提出了在高校图书馆领域构建基于局部数据的图书荐读系统(推荐系统),既能很好地满足广大师生的信息需求,同时也能够通过这种主动推荐的模式帮助更多师生节省查找图书资料的时间,提高工作学习效率。

1推荐系统在国内外的发展现状

近年来,推荐系统在各个领域内逐渐兴起,并得到越来越广泛的应用,1992年12月,美国施乐公司研究所开发了最早的推荐系统Tapestry;[1]1994年,GroupLens系统可以根据用户的兴趣推荐相关的网络新闻的文章;之后又出现了Citeseer等应用于不同领域的推荐系统;近年来,很多网站可以为消费者提供个性化推荐,其中,最著名的是亚马逊电子商务网站,它采用的是条目对条目的协同推荐算法;目前,在图书馆领域应用推荐系统的比比皆是,除了各自采用不同的推荐方式之外,目的都是为读者提供更快、更好的信息推送服务,其中斯坦福大学的Fab推荐系统,它将基于内容和协同过滤算法结合起来,采用混合推荐技术为特定用户进行推荐;加州大学的Melvy推荐系统,它采用了两种生成推荐系统的方法,一种是利用图书馆的流通数据进行推荐,另一种是基于相似性的推荐;美国俄勒冈的SERF推荐系统是一种通过写作过滤的新型搜索引擎;在国内,虽然也有高校图书馆推出了推荐系统,但并不普遍,其中中国人民大学图书馆的推荐系统比较成型,它同样采用了混合的推荐模式为读者推送书目信息。

综上所述,推荐系统在国际上已有成熟范例,而国内图书馆领域仍属于起步阶段,需我们各大高校共同努力,实现图书馆领域的智能图书推荐,并且可以为相似领域提供一定的参考思路。

2高校图书推荐系统的个性化推荐模式探讨

图书推荐系统的主要推荐模式有三种:个性化推荐、智能化检索和社会化推荐。[2]其中智能化推荐需要利用大数据和云计算技术构建一个强大的互动知识分享平台,社会化推荐旨在解决用户在网上书店的社交网络需求,而对于高校图书馆而言,目前,仅仅实现了低级信息化,图书数据的元数据不多,使得图书的全文检索功能受到限制,而且高校图书馆有其自身藏书特点,专业书籍占藏书比例相对要高,由于读者水平及其专业各不相同,使得图书馆中大部分书籍成了摆设,无人问津,为了解决以上问题,本文尝试采用个性化的推荐模式来构建高校图书馆领域的图书推荐系统。[3]

目前,推荐系统在各行各业中应用广泛,其核心算法已经基本成熟,个性化推荐是将协同过滤推荐算法应用于高校图书馆领域,其基本思想是为一个用户找到他真正感兴趣的内容的最好方法是首先找到与此用户有相似喜好的其他用户,然后将他们所喜好的内容推荐给当前用户,该思想类似于现实生活中的“口碑传播”(word-of-mouth)。它是在用户对于一些项目或新闻资讯的评分或可以表达用户喜好的行为的基础上,查找具有相同兴趣爱好或行为的用户,以此来为目标用户推荐一些他们可能会感兴趣的资料的技术。协同过滤推荐算法是目前较常用的推荐技术,它的计算所依赖的原始数据都是用户数据评分矩阵,根据我们的经验,协同过滤算法可以基于相似用户的历史行为获得更多“不知晓”的项目,它的优点是不需要对物品或者用户进行严格的建模,且不要求物品的描述是机器可以理解的,与领域无关的,而且它计算出来的推荐是开放的,可以共用他人的经验,很好地支持用户发现潜在的兴趣偏好,且发现速度更快;这种推荐方法随着时间推移性能会提高,且其推荐个性化、自动化程度都很高,能处理复杂的非结构化对象;但是,这种方法存在稀疏性问题、可扩展问题和新用户问题,其推荐效果取决于历史数据集,且系统刚开始时推荐质量较差。

这种方法不同于其他算法,在国内应用不多。文章将采用个性化推荐模式,主要是根据《中图法》对图书馆中的图书类别按照分类号进行划分,同时根据读者的借阅习惯划分出相似读者群,并为读者找到具有更为相似借阅习惯的近邻读者,对其进行图书推荐服务,这种推荐模式可以为读者提供相同及不同分类号的图书推荐服务,同时还提供近邻读者推荐,一方面,对读者推荐可能感兴趣的作者及其作品,另一方面,对作者推荐相似读者及其图书兴趣。其主要推荐过程为:①数据预处理:将得到的数据按照运算模式进行预处理;②数据处理:通过已经设计好的个性化推荐体系将得到的预处理数据进行数据加工处理,得到备用数据集;③数据测试:将数据集代入个性化协同过滤模式中进行数据测试;④评分:进行计算并得出有意义的评分集合;⑤进行推荐:根据我们得到的评分集合来进行图书推荐。[4]

3推荐方法的创新设计

在采用个性化推荐模式的基础之上,文章创新性地提出了基于局部近邻搜索的思想,即基于局部用户数据(User-Based,CF)的协同过滤推荐算法来构建图书推荐系统,该算法是假设如果某些读者同时喜欢某一专业或某一类别的图书,那么他们对其他专业或类别的图书的喜爱也比较相似,即评分相似。高校由于其按专业进行划分的这种特点,在挑选图书时,相同专业的读者往往会挑选相同或相似类别的图书,因此,我们在进行推荐方法设计时创新性地采用了读者局部数据,即采用相同专业的读者借阅数据来进行图书推荐服务,这种方法区别于以往的利用全校读者的借阅数据来发掘读者潜在兴趣,提供推荐服务的模式。

这种基于创新图书推荐方法的图书推荐服务的实现,需要我们根据读者所属专业的不同将图书馆中读者借还数据进行分类,并计算相同专业不同读者之间的借阅相似度,我们需要根据这种相似度的高低来找到目标读者的K个最近邻居,在这一过程中将采用最近邻方法进行筛选。同时,我们将读者借阅相似度作为权重得出预测评分,这需要计算最近邻居对未评分项目的加权平均值,对得到的预测评分进行排序,将评分较高的项目作为目标进行推荐。这种方式的推荐结果推荐精度高、且具有推荐对象多样化等优点。

4结论

将推荐系统应用于图书馆I域,可以提高图书馆现有资源的利用率,节省读者查找所需图书资料的时间,为高校教学科研提供极大便利。目前,国内很少有成熟的推荐系统应用在高校图书馆领域,由于构建推荐系统的算法多种多样,各具优势,各大高校应该根据自己院校的特点进行选择,适当创新,以促进推荐系统在未来高校图书馆中的发展应用。

参考文献:

[1] Goldberg D,Nichols D,Okibm,et alUsing Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70

[2]张闪闪,黄鹏高校图书馆图书推荐系统中的稀疏性问题实证探析[J].大学图书馆学报,2014(6):47-53

个性化推荐系统篇(5)

关键词:复杂网络;社区检测;个性化推荐;推荐系统

1概述

随着网络技术的飞速发展,推荐技术的研究已经成为很多交叉领域的热点,其理论和应用的价值和意义非常重大。而推荐系统近些年来越来越受人们的关注,呈现出欣欣向荣的发展趋势,包括电影、音乐、新闻、著作、科研论文等都非常普及,逐渐成为我们生活中必不可少的一部分。推荐系统是指根据用户的喜好,来为用户中的成员提供个性化推荐的系统。现实生活中这样的系统比较多,如豆瓣读书中的“豆瓣猜”功能,它就是根据你看过书和读后评价,与整个豆瓣社区其他会员看过的书与评价,就可以给你推荐你没读过但感兴趣的书;淘宝等购物网站通过用户浏览记录、登录信息和购买信息等数据分析用户的偏好、购买能力找到用户感兴趣的东西,提高网络交叉销售能力等。

随着博客、微博、微信、QQ等各种网络社交平台的涌现和发展,学术界对网络结构及其演化的研究有了更广泛的关注,将单一对网络的研究扩展到移动互联网应用、生物医学、科技等商业应用中。个性化推荐技术是在信息检索的基础上发展起来的,它是经过分析用户的行为特征,挖掘每个用户特有的偏好,然后再根据用户的喜好从海量数据中挖掘用户最可能感兴趣的信息,推荐给用户。

基于社区的推荐技术也逐渐成为推荐技术研究的一个热点,研究者们利用网络分析、链路预测等对网络中的个体用户的属性进行分析,记录其个性化偏好,为其进行最合适、最有价值的和最感兴趣的推荐,虽然目前这些技术已经有了很大的关注,也取得了一定的成果,但是这些研究也只是针对静态网络,而网络实际上是动态演化的,因此,个性化推荐系统中社区用户也是动态变化的,不仅如此,社区中用户的偏好也是可能发生变化的,所以,我们需要基于动态演化网络来进行个性化推荐技术的研究,以此来提供更好的服务,更合适的推荐。

2复杂网络

复杂网络的相关研究进入中国已经十年,在过去的十年中,很多研究方向受到来自不同研究领域学者们的广泛关注,并极大地推动了复杂网络和复杂性科学的发展。现代网络科学对我们学习和理解复杂网络有非常重要的作用,复杂网络是研究复杂系统地一个角度和方法,研究和挖掘出了各种各样的具有一定普适性的网络特征,如无标度现象、小世界效应、社团性等。而进行社团结构的研究和分析有助于我们更好的理解复杂网络结构及其演化机制。

复杂网络可用来表示众多的社会、生物和通信系统,其中节点表示个体或者组织,边表示节点之间的交互关系。通过对复杂网络的研究,人们可以对模糊世界进行量化和预测,目前只有基于复杂网络的研究成果,能够在一定的范围内对事物的发展和运行进行简单预测,并且能够对网络崩溃进行一定的预告。

3动态社区检测

网络中的社团就是指一组内部节点联系紧密与网络中其他节点链接稀疏的节点的集合,也就是说社团内部节点的联系是非常紧密的,而社团间的节点联系相对而言联系就比较稀疏,社团也可以被称为“簇”,通常社团中的节点拥有相似性。

近些年来,不同领域的学者们从不同角度使用不同方法对社区结构进行了深入的研究和探讨,提出了许多经典的社区检测算法,如基于模块化的算法,随机游走算法,聚类算法和基于矩阵分解算法,社区检测算法在许多方面与聚类分析很相似,许多聚类算法(k-means、DBSCAN)可以很容易改变成社区检测算法。现有的社团结构的检测方法大多只适用于静态网络,然而大多数复杂网络例如生物网络、社交网络、电力网络等都不是静态的,其拓扑结构随着时间的推移在不断发生变化,因此网络中的社团也不是静态的,是一个消亡,新生,收缩,扩张,分裂和融合的过程,近些年了,研究着相继提出了一些新的动态社区发现算法。

个性化推荐系统篇(6)

关键词:用户浏览行为;电子商务;个性化推荐系统;兴趣度

中图分类号:F713文献标识码:A文章编号:1009-3044(2007)12-21528-02

An E-commerce Recommend System based on User Browse Behavior's Mining

HE Ying1,2,JIANG Wai-wen1

(1.School of Information Science and Engineering,Central South University,Changsha 410008,Cina;2.Hunan Vocational College of Commerce,Changsha 410205)

Abstract:This paper,we introduce the personalized recommend system for E-commerce and propose a new recommend system model based on user's browse behavior to mine his interests and gives its flow chart and mining algorithms in detail.

Key words:browse behavior; E-commerce;personal recommendation system;interest

1 引言

近年来,因特网的规模正以惊人的速度发展。人们越来越希望网页的内容能够从原先的以“网站”为中心转变成以“用户”为中心,尽可能地自动调整以迎合每个用户的浏览兴趣,从而让每个用户能够感觉到他是网站的唯一用户。在日趋激烈的竞争环境下,电子商务网站要想有效保留用户、防止用户流失、提高销售量,就必须实现个性化服务,即对不同用户投其所好,采取不同的服务策略,提供不同的服务内容,这就需要建立电子商务网站的个性化推荐系统。

2 电子商务网站的个性化推荐系统

电子商务中的推荐系统是利用统计学、人工智能、数据挖掘等技术,分析访问者在电子商务网站的访问行为,产生能帮助顾客访问感兴趣的产品信息的推荐结果,引导顾客的购买行为,从而产生可观的利润。推荐系统首先要分析以前顾客行为数据,建立表示顾客行为的模型,并充分利用模型对其它顾客推荐有兴趣购买的产品信息。这就要求推荐系统首先必须知道用户的兴趣、偏好和访问模式等信息。而在电子商务中,用户很多浏览行为都能很好地反映用户的兴趣。基于用户浏览行为的Web挖掘技术就是通过对用户浏览Web时的访问行为、访问频度、访问内容等浏览信息进行挖掘,发现蕴涵的、未知的、有潜在应用价值的非平凡的模式,从而获得用户兴趣,提取出用户的特征,获取用户访问Web的模式,为用户实现主动推荐,提供个性化服务。

3 基于用户浏览行为的挖掘流程

3.1在客户端获取行为数据:输入Web文档,当用户浏览完网页后,输出用户在该文档上的浏览行为,同时记录Web文档的相关信息

3.2数据预处理:对数据进行清洗,滤掉脏数据,保留一些能表示用户对某页面兴趣度的信息。

3.3用户兴趣度计算:根据选取出来的行为数据建立兴趣模型,进而计算出能反映用户兴趣的网页兴趣度。

3.4推荐:主要根据挖掘结果实施推荐,将用户感兴趣的内容的链接添加到用户正在浏览的网页。

3.5结果修正:根据用户浏览行为的反馈对推荐进行修正,如果用户接受推荐,则进行巩固;否则,根据用户的反馈进行重新推荐。

4 基于用户浏览行为的挖掘算法

4.1行为数据的选取

一个用户浏览网页时的行为数据是非常丰富的,大致可以分为以下几类:

(1)表示用户兴趣的显式行为 如利用问卷调查等形式收集用户感兴趣的信息。

(2)表示用户兴趣的标记行为 如执行保存、打印页面等动作。

(3)表示用户兴趣的操作行为 如执行剪切、复制、粘贴、搜索文本等操作行为。

(4)表示用户兴趣的链接行为 指用户在浏览页面时点击某个超链接或没有点击某个超链接等行为。

(5)表示用户兴趣的重复行为 指某个用户在某个页面上点击了 “更多”,就可以认为用户对这个页面有更多的兴趣。

(6)表示用户不感兴趣的行为 如某用户经常访问某网站,但经常只浏览其中某些页面,则认为此用户对该网站其他网页不感兴趣。

4.2网页兴趣度计算

虽然能够揭示用户对网页的兴趣度PageInterest的浏览行为很多,常规使用浏览时长、网页字节数乘积与总浏览时长、总信息数乘积的比值作为网页的兴趣度。定义为:

而经研究表明,不但用户停留在网页的浏览时间PageTotalTime能揭示用户兴趣,另外还有一种关键行为:翻页/拉动滚动条次数Number同样也表达了用户对该网页的关心程度。经仔细的分析和实验,发现PageTotalTime, Number与网页兴趣度PageInterest之间的定量关系为:

PageInterest=0.1123*PageTotalTime+ 0.0711*Number+ 95.8883

因此改进的网页兴趣度计算算法如下:

输入:用户浏览信息矩阵

输出:网页兴趣度矩阵

function PageInterest;

begin for logx=1 to n

//找出该网页的最大允许访问时间

maxtime=find(maxtime,topic);

//找出该网页的最小允许访问时间

mintime=find(mintime,topic);

//如果用户时间小于最小时间或大于最大时间,但进行了保存操作,则将其转化为对等的标准时间。

If browsetime>maxtime or browsetime

if issaved

browsetime=standtime;

endif

endif

//确定该网页的位置,并修改总浏览时长

k=locate(browtime,page_logx);

browtime(k)=browtime(k)+browtime;

endfor;

//以路径为单位计算总浏览时长、翻页/拉动滚动条次数

for j=1 to pagenum

totaltime=totaltime+browtime(j);

totalnumber=totalnumber+number (j);

endfor

for j=1 to pagenum

interest(j)= 0.1123*totaltime+ 0.0711* totalnumber + 95.8883

endfor

end function

时间复杂度分析:每条浏览行为记录计算一次,执行时间与浏览记录数量成正比,时间复杂度为O(n)。

空间复杂度分析:需要的存储空间与网页为数目成正比,最大为网页数,因此空间复杂度为O(n)。

4.3 基于用户浏览行为的挖掘算法

输入:用户浏览行为矩阵

输出:用户浏览模式

function PreferedBrow(browdata as browdatarr);

//计算前缀为path路径数

amount=count(s,path)

for i=1 to amount

interest=browdata(s,path)

if interest>mininterest

addpath(path)

endif

endfor

end function

算法的时间复杂度与用户浏览事务集合元素和浏览的最大路径长度有关,是O(M*N),其中,M表示用户浏览集体的元素数,N表示最大浏览路径长度。另外,由于该算法是一个递归算法,需要的辅助空间栈的深度为最大浏览路径长度数。

5 结束语

随着电子商务、电子政务以及网络远程教育等电子服务的发展,研究 Web环境下的个性化服务具有重要且现实的意义。本文提出的算法使得 Web 信息服务提供者根据用户网络浏览行为可正确把握其兴趣所在并可动态地对其兴趣改变进行跟踪,根据这些个性化信息调整 Web 信息资源的组织方式,最大效率地为用户提供方便快捷且实用的个性化服务。

参考文献:

[1]韩家炜,孟小峰.等. Web挖掘研究[M].计算机研究与发展,2001,38(4)405-413.

[2]Claypool M., Le E, Waseda M., et al. Implicit interest indicators. In: Campbell M,ed.Proceeding of the ACM Intelligent User Interfaces Conference (IUI), New York: ACM Press,2001.14-17.

个性化推荐系统篇(7)

关键词:协同过滤算法;高校选课推荐系统;数据挖掘

中图分类号:TP391.3 文献标识码:A 文章编号:1007-9599 (2012) 20-0000-02

随着教育改革的推进选课制度已在高校普及多年,为了满足学生的个性化需求,根据上课时间、学习兴趣、任课老师以及学习进程等各方面的需求选择适合自己的课程,课程的自选使得学生的自由空间更大且学习效率明显提升。选课制度作为高校教学管理制度改革内容的一部分同时也是学分制的重要内容,选课制度的设计及实施过程都需结合大学生教育理念。改革开放的到来更是为教育吹来了春风,教育体制也突破了传统模式,开始实行选课制和学分制。

1 我国高校选课制度的现状

随着选课制在高校的普及,教育也逐渐走向网络化和信息化,在这样一个计算机网络普及的时代自然选课过程也趋于网络化。受到传统观念及学年制的影响,选课制度在运行过程中还存在一定的缺陷,另外在新教学观念的实施和高素质人才的培养中选课制也没有体现其优势,具体原因有下几个方面:

1.1 目前实施的选课制不利于学生的个性发展

随着社会对人才专业需求的多样化,传统的人才培养模式已无法满足社会发展需求,同时也抑制了学生的个性化发展。选课制的实行使得学生可根据自身的兴趣爱好选择合适的课程、任课教师以及学习时间,各种自由的选择使得的个性特征得到满足,从而提高了学生的学习积极性。

1.2 没有实现真正的选课

尽管有部分学校允许学生选择跨专业、跨年级的课程,但在教师资源、上课时间以及场地资源等影响下,学生仍无法选择自己喜欢的课程,时间及资源上的冲突使得学生在自主选课上受到了一定的限制,对于比较热门的课程,当选课人数较多资源有限时,课程就会被删除,自主选课无法充分发挥其作用。随着高校不断扩招,教师资源越来越匮乏,学生的选择范围有限。

1.3 选课工作实施不到位

选课指导也是一个很重要的环节,特别是新生由于对课程了解不深,因此很容易出现盲目选课现象。部分学生了为了选择简单易学的知识而不顾自身发展,随意性的选课对教学质量造成了很大的影响,同时也脱离了选课制实行的初衷。针对这个问题本文提出了利用数据挖掘技术筛选历史选课数据中隐藏的、有用的知识,作为指导学生选课的依据,该课题的提出对高校教学管理改革有着重要的现实意义。

2 相关技术

2.1 数据挖掘技术

数据挖掘技术是一种从大量的、无规律的、模糊且随机的数据中提取有用信息和知识的一种方法,数据挖掘技术作为一门交叉学科,其中包含了许多运用技术和挖掘工具,其中运用到的技术有数据库技术、统计学、模型识别、机器学习和人工智能等。由于数据挖掘技术具有独特的优势,因而它在多个领域都有应用,特别是在银行、销售、保险、电信和交通等领域的运用已趋于成熟。

2.2 个性化推荐技术

个性化推荐技术是数据挖掘技术中一类,该技术直到20世纪末期才被单独提出来,随着计算机技术的不断发展,直到Web2.0技术成熟后该技术才被运用到实际当中。个性化推荐技术的运用使得用户对信息的获取从被动变为主动。个性化推荐技术在商业领域中的成功运用,使得推荐系统的产品种类大幅度增加,较具代表性的推荐系统有eBay、Amazon和You tube等,这些系统的用户数量相当可观。

2.3 协同过滤系统

在所有个性化推荐系统中协同过滤系统的运用效果和运用情况都是最好的,协同过滤推荐作为一项很受欢迎的信息过滤技术,它可以对过滤内容进行过滤和分析,从而分析出用户的兴趣爱好,提高信息服务质量。根据对象的不同协同过滤推荐算法可分为基于用户和基于项目的两种协同过滤推荐算法。

3 学生个性化选课推荐系统的研究

本文采用的是基于用户的协同过滤算法,在高校选课系统中融入该算法可帮助学生根据自身的兴趣爱好选择与自身发展最为贴近的课程、学习量及任课教师,个性化选课推荐系统的运用使得高校选课机制更为完善。

在推荐系统内建立评价矩阵,对学生在选课过程中的主要因素进行描述,如兴趣爱好、专业、学习程度、选课记录和老师评价等,算法根据学生这些信息对其行为进行分析,并建立相应的学生项,通过与评价矩阵中的项进行对比找出相似度最高的选课记录,并向该学生进行课程推荐。由此可见,个性化高校选课推荐系统模型主要分为评价矩阵、搜索最近邻居和课程推荐三个部分。

3.1 建立评价矩阵

根据专业、爱好、选课记录、学习程度等信息收集历史选课数据,若直接从教务系统中选取,则需对数据进行清洗和转化,从而形成协同过滤算法学生选课评价矩阵。如表1所示为协同过滤算法学生选课评价矩阵:

表1协同过滤算法学生选课评价矩阵

Item1 Item2 … Item′

Student1 3 5 … 4

Student2 5 4 4

… … … Rij …

Student″ 5 4 … 2

Student′ 2 5 … 3

在上述矩阵中Rij中的i代表的是学生,j代表的是项目,R代表的是评价。Rij的取值范围通常在[0,5]这个区间范围内,分值的大小与评价的高低成正比。

3.2 搜索最近邻居

将目标学生与评价举证中所有学生的相似度进行对比,找出相似度最高的一组并建立相应的最近邻居集合,在基于用户的写通过率算法中这步是很难关键的,相似度的具体算法如下所示:

在上述公式中 代表目标学生与矩阵学生的相似度,y代表两者共同评价过的项目, 和 表示a学生和i学生对y项目的评价, 和 表示项目评价平均值。

3.3 产生推荐

根据评价结果和推荐算法产生推荐,具体推荐算法如下所示:

表示相似度, 表示项目评分, 和 表示项目评价平均值。该算法主要是针对用户评价项目较多的情况,对于个别评价,结果可能就没那么准确。

4 结束语

基于协同过滤算法的个性化高校选课推荐系统是根据学生的兴趣爱好、学习程度和专业等信息进行相似度计算,然后再根据相似度的高低推荐相应的课程。高校个性化选课推荐系统的使用可有效提高学生的学习兴趣以及学校的教学质量,帮助学生科学合理的选择合适的课程,为学生的个性化发展提供有效的学习方式。

参考文献:

[1]王博,刘庆刚,张琴.数据挖掘在选课系统中的应用[J].计算机与数字工程,2011,39(5).

[2]陶小红.Web数据挖掘在智能选课系统中的应用研究[J].办公自动化,2010(2).

友情链接