工具之家 > 现代电子技术 > 基于读者个性化特征数据挖掘的图书馆书目推荐

基于读者个性化特征数据挖掘的图书馆书目推荐

发布时间:2019-06-12 02:15:00 文章来源:工具之家    

 推荐工具:金融理财app工具实用工具

谢康

摘 要 传tongtushuguan服务缺乏个xinghua设置无fa充fen利yong资源jinxingzhunqueshumu推jianwei了改善这一问题提出基yuduzhe个性化te征shujuwajuedetushu馆书目推jianxi统根ju读zhe类jute点与shu据guanlian规则设计节目个性化推jian系统并将挖掘出de关联规则应yong到推荐服务dangzhong根据挖掘流程ke得到大量shu据并对多余shu据进行清理不完整shuju进行补充,计suan支持度he置xin度;caiyong基于读zhege性化特征shu据挖掘图书馆书目并进行推荐,由此完cheng图书馆书目推荐。通过实yanfenxi可zhi,该推荐fang法可充分利用图书馆资源,快速、准确完成书目推荐。

关键词 图书馆服务; 个性化特征; 数据关联规则; 数据挖掘; 图书馆书目; 书目推荐

中图分类号: TN911?34; TP311.13 wen献标识码: A 文章编号: 1004?373X2018)06?0034?03

Abstract: The traditional library service lacks personalized setting, and cannot make full use of resources to conduct catalogue recommendation accurately. To resolve this problem, library catalogue recommendation based on readers′ personalized feature data mining is proposed. According to reader clustering characteristics and data association rules, a personalized program recommendation system is designed, and the mined association rules are applied to recommendation service. A large amount of data can be obtained according to the mining process, with redundant data cleaned and incomplete data supplemented, so as to calculate the support degree and confidence coefficient. Readers′ personalized feature data is used to mine and recommend library catalogue so as to complete library catalogue recommendation. The experimental analysis shows that this recommendation method can make full use of library resources and complete catalogue recommendation quickly and accurately.

Keywords: library service; personalized feature; data association rule; data mining; library catalogue; catalogue recommendation

0 引 言

高校图书馆中应用数据kuji术促使系统硬jian与软jian都得到改善,每天都会更新资源,学生和教师等读者对资源也会充分利用,这就使图书馆数据库中积累大量de历史信息。图书馆是面向全校读者所提gong的一个fang便快捷查找资料的场所,但是随着读者对图书馆资料查询要求不断提高,从资源中准确筛选读者xu要的图书信息成wei了当务之急[1]。

传统图书馆服务缺乏个性化设置,无法充分利用资源,为了改善这一问题,提出基于读者个性化特征数据挖掘的图书馆书目推荐。qi利用数据挖掘技术对图书馆数据库中的海量jie阅信息进行挖掘,可找到其中yin藏的关联规则,根据这些规则可帮助图书馆完成个性化信息推荐工zuo,也为读者提供了良好服务。

1 图书馆书目推荐特征数据挖掘算法的实施

根据读者类聚特点与数据关联规则,zai图书馆传统管理系统基chu上,设计基于读者个性化数据挖掘的信息服务系统[2?3],如图1所shi,针对数据与处理模块和数据挖掘模块进行详细分析。

基于读者个性化特征数据挖掘的图书馆书目推荐系统主要能实现以下两个方面能力:一是数据挖掘,首先对图书馆读者进行调查,并根据jie阅数据信息进行聚类群分,根据聚类群体中读者jie阅的数据信息完成数据关联规则挖掘;二是个性化推荐,将挖掘出的关联规则应用到推荐服务当中[4?5],该系统是基于Windows XP上運行的,并采用B/S模式,而前台shiyongVisual Studio 2008集成环境,将Visual C++作为开发工具,后台使用SQL Server 2008数据库来保存用户数据[1]。

2 基于读者个性化特征数据挖掘书目推荐算法

2.1 读者个性化特征数据挖掘

数据挖掘中最常用的方法是对个性化关联规则展开分析,利用该规则对图书馆书目进行推荐,具体算法如下:

书目推荐算法通常采用xiang集合x和y来表示,两个项集合是相互独立的,且不具有重复属性[6],可表示为:[x?y=?]。集合x和y之间的个性化规则需满足如下条jian:两项集合有用并且集合之间个性化规则具有一定普bian性和有趣性。比如:[T=T1,T2,…,Tm]是项的集合,相关数据[D]是数据库信息的集合,其中每条信息d是项的集合[7],使得[d?1]。每条信息具有一个标志符号,称为[d1]。shea是一个项集,信息d所包含的a当且仅当[a∈d]。个性化关联规则具有[a?b]蕴涵式,其中[a?1,b?1],并且[a?b=?]。endprint

2.2 书目推荐算法

如guo个性化关联规则[a?b]zai信息集合[D]zhong成立,具有特征属性支持度s,信息集合[D]中包含[a?b]的百分比也被称为支持度,即为[pa?b]。

如果个性化关联规则[a?b]在信息集合[D]中成立,具有置信度c,信息集合[D]中包含信息a的同时也包含b的全buxin息比,也被称为置信度[8?9],即为[pba]。可具体表示为:

[Supporta?b=pa?bConfidencea?b=pba]

通常情况下,特征数据挖掘是zaiji于读者个性化关联规则基础上实现的,该挖掘主要分成两个部分:一部分是将找到的所有与关联规则有关项集进行统计;另一部分是在上一部分产生项集基础上进行强关联规则分析[10]。在挖掘过程中,中心问题是要进行高效频繁项集搜suo,如果效率较低,那么每次所产生的候选项会导致算法在运行过程中需要进行一次数据库扫描,所耗费工作量较大,为此利用个性化关联规则进行繁琐项集搜索。繁琐项集搜索完成后,会产生强大的关联规则,如果项目集中每一gepin繁项目集为1,那么就会产生1个非空子集;如果项目集为非空子集,且满足大于等于最小置信度的条件,则该子集可输出作为书目推荐。

3 实 yan

3.1 实验参数设置

为了验证基于读者个性化特征数据挖掘的图书馆书目推荐方法合理性,使用科学试验和技qiao与程序的调试方法进行相关数据收集,设计实验并进行验证,分析个性化推荐数据挖掘算法的使用效果与准确度。实验开发环境设置如下:处理器为[Intel?][CoreTM i5-4590CPU @3.30 GHz;]内存为32.0 GB;系统种类为[Windows 10,]64位操作系统,使用64位的处理器。

3.2 实验jie果与分析

选举6位阅读者所借阅5本图书为例,假设学生编号为[PZ],书目借阅信息为[Tx],具体数据如表1所示。

将传统书目推荐方法与本文使用的推荐方法在最小置信度值为70%的情况下,对书目推荐准quelv进行对比,结果如图2所示。

由图2可知,当读者借阅了T1和T5,传统方法推荐书目为T1,而zheng确推荐书目应该为T2;当读者借阅了T2和T5,传统方法推荐书目为T2,而正确推荐书目应该为T1;当读者借阅了T5,传统方法推荐书目为T1和T2,与正确推荐书目一致。由此可知,当最小置信度阈值为70%,传统方法对书目推荐准确率小于本文使用的方法。

将传统书目推荐方法与本文使用的推荐方法在最小置信度阈值为50%的情况下,对书目推荐准确率进行对比,结果如图3所示。

由图3可知,当读者借阅了T1和T2,传统方法推荐书目为T2,而正确推荐书目应该为T3;当读者借阅了T1和T3,传统方法推荐书目为T2,与正确推荐书目一致;当读者借阅了T2和T3,传统方法推荐书目为T3,而正确推荐书目应该为T1。由此可知,当最小置信度阈值为50%,传统方法对书目推荐准确率小于本文使用的方法。

4 结 语

由于图书馆书目推荐工作意义繁重,利用基于读者个性化特征数据挖掘中的关联规则,根据历史记录,可方便为读者推荐感兴趣书目。图书馆可通过数据挖掘将珍藏的图书推荐给阅读者,使读者快速寻找到自ji感兴趣书目,具有省时、高效特征,采用该推荐方法能满足不同借阅者个性化需求,具有一定真实性。

参考文献

[1] 周xin陆康.基于图书馆数字资源访问系统的读者行为数据挖掘研究[J].现代情报,2016,36(1):51?56.

ZHOU Xin, LU Kang. Data mining on reader behaviors based on library digital resource system [J]. Modern information, 2016, 36(1): 51?56.

[2] 何胜,冯新翎,武群辉,等.基于用户行为建模和大数据挖掘的图书馆个性化服务研究[J].图书情报工作,2017,61(1):40?46.

HE Sheng, FENG Xinling, WU Qunhui, et al. Research on personalized services of library based on user behavior modeling and big data mining [J]. Library and information service, 2017, 61(1): 40?46.

[3] 陈臣.基于大数据挖掘与知识发现的智慧图书馆构建[J].现代情报,2017,37(8):85?91.

CHEN Chen. Construction of smart library based on the big data mining and knowledge discovery [J]. Modern information, 2017, 37(8): 85?91.

[4] 韩雪飞,丁玉东,杜瑾.高校毕业季图书馆开展读者数据留存活动调查与建议[J].图书情报工作,2015,59(20):77?82.

HAN Xuefei, DING Yudong, DU Jin. Investigation and suggestion on readers′ date retention activities in the graduation season in university libraries [J]. Library and information service, 2015, 59(20): 77?82.endprint

现代电子技术 2018年6期

现代电子技术的其tawen章 基于Matlab/Simulink的电离层探测系统仿真设计 融合微聚集隐私保护的协同过滤算法研究 基于知识图谱的高铁动车设备jian测系统的本体框架构建与维护 基于ASP.NET的在线运动课程编排系统设计 基于图像增强和复原的图像去雾方法研究 改进D*Lite算法在虚拟士兵路径规划中的应用
转载请注明来源。原文地址:https://www.5420.com.cn/view/2019/0612/17380/
 与本篇相关的热门内容: