毕业设计论文基于Hadoop协同过滤的商品推荐设计.docx
《毕业设计论文基于Hadoop协同过滤的商品推荐设计.docx》由会员分享,可在线阅读,更多相关《毕业设计论文基于Hadoop协同过滤的商品推荐设计.docx(54页珍藏版)》请在第一文库网上搜索。
1、毕业设计说明书基于Hadoop协同过滤的商品推荐2017年05月17日基于Hadoop协同过滤的商品推荐摘要:目前单机推荐系统己经不能计算海量数据和存储等需求,分布式的推荐系统现在已经成为今年来的热点。基于Hadoop的电商的分布式大型推荐系统这一课题,我通过阅读大量的文献和研究,分析了国内外研究现状及面临问题。对电子商务推荐系统常见的推荐算法讨论,还有本文还对Hadoop平台的两大核心技术HDFS和MapReduce的工作流程和原理进行了介绍。对于电子商务传统推荐系统存在的很多问题,我论文基于Hadoop的电商推荐系统,系统有Hadoop的优点能具备良好的可扩展性伸缩性,可以方便快捷的对系统
2、的计算能力和存储能力调大调小根据业务需求进行调整。对数据预处理、基于物品的协同过滤推荐算发还有混合推荐算法的相似性计算等算法设计,使之完美的运行在HadOOP平台上,实现分布式的推荐计算。关键词:电子商务;推荐系统;协同过滤;HadoopProductrecommendationbasedonHadoopco11aborativefi1teringAbstract:Atpresent,thesing1erecommendationsystemhasnotbeenab1etoca1cu1atethemassdataandstoragerequirements,andthedistributedr
3、ecommendationsystemhasbecomeahottopicthisyear.Hadoop-basede-commercerecommendationsystemofthissubject,byreadinga1otof1iterature,ana1ysisThestatusquoandprob1emsathomeandabroad.Thispapera1sointroducestheworkf1owandprincip1esofHDFSandMapReduce,thetwocoretechno1ogiesofHadoopp1atform,whicharethecommonrec
4、ommendationa1gorithmsforE-commercerecommendationsystem.Fortheexistingprob1emsoftraditiona1e-commercerecommendationsystem,wedesignedHadoop-basede-commercerecommendationsystem,thesystemhasgoodsca1abi1ityandsca1abi1ity,youcaneasi1yca1cu1atethesystemandstoragecapacityaccordingtobusinessneedstoadjust.The
5、datapreprocessing,basedontheco11aborativefi1teringofitems,isa1sobasedonthesimi1arityca1cu1ationofthehybridrecommendationa1gorithm,sothatitcanrunperfect1yontheHadoopp1atformtorea1izethedistributedrecommendationca1cu1ationKeyWords:e-commerce;recommendationsystem;co11aborativefi1tering;Hadoop摘要IAbstrac
6、tII1绪论11I研究背景与意义11.1.1信息过载与个性化服务11.2现阶段关于推荐系统的现状21. 3论文的主要工作及结构安排42. Hadoop简介52.1Hadoop简介52.2Hadoop生态简介52.3详细介绍HDFS和MapReduce62 .3.1HDFS63 .3.2MapReduce74 .商品推荐系统的设计85 .具体的算法实现和效果101.1 1数据切分101.2 用户向量114.4 用户矩阵乘以共现矩阵124.5 按商品ID做累加134.6 除去用户已经购买过商品134.7 验证135.实验151 .1数据集的介绍155 .2实验平台简介15附录A17附录B20附录C
7、23附录D26附录E28附录F33参考文献501绪论11研究背景与意义1.1.1信息过载与个性化服务随着计算机和互联网技术的快速发展,互联网上信息和用户的数量呈指数增长,全世界各地的用户提供了越来越丰富的资源,海量信息给用户带来更多选择的同时,也使的用户难以及时地吸收、消化和使用信息,还有是信息的广泛性,也容易使用户常常容易迷失航向,没有办法快速准确地找到特定的信息,形成了“信息过载(InfOnnatiOnOver1oad),和“信息迷失(Infonnation1ost),的现象。在互联网技术日益发达的今天,使越来越多的用户喜欢上网冲浪,在线购物。我们在享受其给我们带来便利的同时也面临着它给我
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 基于 Hadoop 协同 过滤 商品 推荐 设计
