大数据环境下基于知识图谱的用户兴趣扩展模型研究.docx
《大数据环境下基于知识图谱的用户兴趣扩展模型研究.docx》由会员分享,可在线阅读,更多相关《大数据环境下基于知识图谱的用户兴趣扩展模型研究.docx(12页珍藏版)》请在第一文库网上搜索。
1、大翔居环境下基于知识图谱的用户兴蟠广展雌研究针对大数据环境下用户兴趣数据稀疏、缺乏关联和描绘不准确等问题,利用知识图谱融合多源兴趣知识,以提高用户兴趣的全面性和准确性。方法/过程从兴趣之间的关联视角出发,进行兴趣建模、知识获取和知识融合,整合兴趣间的语义关联和社交网络关联,构建兴趣知识图谱抡掘兴趣标签节点与上位词节点、百科标签节点、社交网络用户节点的关系,计算兴趣标签的语义关联度和社交网络关联度,生成复合关联权重,重构兴趣之间的衍生关系以实现用户的兴趣扩展。结果/结论该模型能够有效融合扩展不同类型的兴趣关联知识,相对于单一来源数据在用户兴趣的覆盖率和查准率方面均有所提升,提高了用户兴趣描绘的全
2、面性和准确性。用户兴趣挖掘是个性化推荐的关键,兴趣特征描绘的全面性和准确性直接影响推荐系统的性能,兴趣扩展是提高兴趣描绘效果的有效方法之一。大数据时代的数据规模大、来源丰富、类型多样,用户兴趣数据具有多噪声、高维度、稀疏性和多源异构等特点,传统的兴趣挖掘模型在处理大数据时存在的问题限制了其性能的发挥1。如何有效融合多源兴趣数据知识并挖掘兴趣之间的隐含关联,是用户兴趣扩展研究的难点问题。用户兴趣扩展研究借鉴信息检索技术中查询扩展方法的思想,通过增加用户兴趣的关联词来提高用户兴趣特征的描绘效果2-3。根据知识来源的不同,现有研究主要分为利用内部兴趣知识和利用社交网络知识的兴趣扩展。传统的兴趣扩展方
3、法利用推荐系统的内部知识来挖掘用户兴趣。Liu Q等4认为,在传统的兴趣挖掘模型中,潜在的用户兴趣信息并未得到充分开发,提出了一种基于协同过滤的iExpand兴趣扩展模型,把用户潜在兴趣作为用户层和项目层之间的中间层,用以提高兴趣描绘和推荐效果。Bedi P等提出了一种结合上下文因素和领域本体的兴趣扩展方法,利用内容的上下文数据结合领域本体中的概念,通过扩展激活来扩展用户的兴趣。由于推荐系统内部知识资源单一,效果较为有限,部分学者开始利用社交网络知识扩展用户兴趣。MezghaniM等认为,丰富的社交媒体数据使社交网络成为用户兴趣的重要数据源,提出了以用户为中心的方法将用户、标签和资源进行了关联
4、,以检测用户的扩展兴趣。Zhang Z等7认为,传统推荐算法对推荐的准确性更为关注,提出了基于用户兴趣扩展的多样化推荐框架,采用基于社会标签信息的用户兴趣扩展策略来增强用户偏好的多样性。徐建民等网为解决微博用户兴趣提取不准确的问题,把用户个体兴趣和从社交网络挖掘的关联兴趣相结合,作为用户的扩展兴趣,提高了推荐的有效性和准确性。随着数据规模的增长,传统的兴趣扩展方法难以全面覆盖用户兴趣,社交标签存在的歧义性、多义性、攻击性以及噪声等问题也更加突出,对于兴趣扩展影响较为关键的语义关联、社交网络关联等问题尚缺乏深入的研究。近年来,知识图谱技术的出现为大数据环境下的兴趣扩展研究提供了新的思路。知识图谱
5、是一种有向异构信息网络,提供了一种更好地组织、管理和理解大数据中兴趣关联信息的能力9,具有知识结构化、语义关联化、推理智能化等优势10,在兴趣挖掘中引入知识图谱能够把推荐系统的用户、用户兴趣、项目及其属性之间的关系进行语义关联和知识融合11。基于知识图谱的兴趣模型主要关注知识图谱中项目之间的各种关联路径,通谩节点路径的特征来挖掘知识图谱,捕获项目之间的复杂且有意义的关系,较为直观准确地为推荐提供辅助信息。GuoQ等12提出了一个端到端的波纹网络(RippleNet)知识图谱推荐框架,通过知识图谱中的链接自动迭代扩展用户的潜在兴趣,并证明了在各个场景下的显著效果。NoiaTD等13提出了 SPr
6、ank混合推荐算法,利用DBpedia链接开放数据提取基于语义路径的特征,通过Web数据中的开放知识计算前N个推荐。Gupta M等14提出了一种基于元路径的非聚类推荐模型HeteroPRS,该模型融合了异构信息网络中与项目相关的元信息,在不进行用户聚类的情况下,通过考虑网络中任意的元路径来发现用户的内在兴趣。具有异构信息融合能力的知识图谱,在解决推荐的稀疏性和冷启动问题方面取得了较好的效果,为用户兴趣扩展的性能提升奠定了基础。现有基于知识图谱的推荐研究尚不够深入,大多利用开放知识图谱建立用户与项目间的路径联系,丰富的多源异构数据对于兴趣关联的影响尚未得到足够的关注和重视。本文利用知识图谱在用
7、户兴趣挖掘方面的优势,从兴趣之间的关联视角出发,引入用户、兴趣标签、语义关系以及社交网络数据等多源兴趣知识,构建融合语义关系和社交网络数据的兴趣知识图谱;通过计算兴趣标签节点间的上位词关联度和百科标签关联度挖掘兴趣间的语义关联,利用社交网络知识计算用户自标签共现度、用户自标签关联度和用户自标签热度,生成兴趣标签间的复合权重,重构兴趣之间的衍生关系,对用户的原始兴趣进行扩展。1基于知识图谱的用户兴趣扩展模型框架为了解决兴趣扩展研究中兴趣数据稀疏、缺乏语义关联和准确度不高等问题,本文设计了基于知识图谱的用户兴趣扩展模型(Knowledge Graph-based User Interest Exp
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 环境 基于 知识 图谱 用户 兴趣 扩展 模型 研究