您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版)

• 机器学习与数据挖掘 • 上一篇    下一篇

基于项目层次相似性的推荐算法

孙远帅1,陈垚1,刘向荣1,2,陈珂3,林琛1,2*   

  1. 1. 厦门大学计算机科学系, 福建 厦门 361005; 2.厦门大学深圳研究院, 广东 深圳 518057;
    3. 广东石油化工学院计算机科学与技术系, 广东 茂名 525000
  • 收稿日期:2013-05-28 出版日期:2014-06-20 发布日期:2013-05-28
  • 通讯作者: 林琛(1982- ),女,福建厦门人,助理教授,博士,主要研究方向为数据挖掘和Web社会网络分析.E-mail:chenlin@xmu.edu.cn
  • 作者简介:孙远帅(1989- ),男,河南濮阳人,硕士研究生,主要研究方向为推荐系统和矩阵分解. E-mail:sunyuan-2008@aliyun.com
  • 基金资助:
    国家自然科学基金资助项目(61370010, 61102136);福建省自然科学基金资助项目(2011J05158, 2010J01350);深圳市科技信息基础研究计划资助项目(JC201006030858A, JCYJ20120618155655087)

Recommendation algorithm based on hierarchical item similarity

SUN Yuanshuai1, CHEN Yao1, LIU Xiangrong1,2, CHEN Ke3, LIN Chen1,2*   

  1. 1. School of Information Science & Technology, Xiamen University, Xiamen 361005, Fujian, China;
    2. Shenzhen Research Institute, Xiamen University, Shenzhen 518057, Guangdong, China;
    3. Department of Computer Science and Technology, Guangdong University of Petrochemical Technology,
    Maoming 525000, Guangdong, China
  • Received:2013-05-28 Online:2014-06-20 Published:2013-05-28

摘要: 针对协同过滤算法推荐效果依赖于相似度度量方法的问题,提出了一种基于项目层次结构相似度的推荐算法REHIS(recommendation hierarchical similarity)。首先利用关联规则挖掘和KNN(K nearest neighbor)算法完善项目层次结构,然后利用TopK算法计算项目之间的相似度,最后利用基于项目的协同过滤算法框架预测用户评分。为解决协同过滤算法扩展性差的问题,还把TopK算法推广到余弦距离和皮尔逊相关系数等常见的相似度度量方法。实验结果表明,与传统的协同过滤算法相比,REHIS能够获得更优的均方根误差,TopK算法可以减少最近邻项目的查找时间。

关键词: TopK, 协同过滤, 项目层次, 倒排索引, 推荐系统, 标签

Abstract: To solve the problem that CF(Collaborative Filtering) recommendation highly depends on the accurate similarity measurement, a novel recommendation algorithm based on item hierarchy similarity was proposed, which was named REHIS(Recommendation Hierarchical Similarity). The framework of REHIS was described as follows. First, the mining association rules and KNN (K Nearest Neighbor) algorithm were used to complement the hierarchy structure. Afterwards, the TopK method was employed to compute the similarity between items. Finally, scores were predicted by using the framework of itembased CF algorithm. On the other hand, to solve the CF poor scalability problem, the TopK algorithm were further extended to the cosine distance and Pearson correlation coefficient, both of which were commonly used similarity measurement methods. Experimental results showed that, compared with existing algorithms, REHIS could achieve a better recommendation in term of root mean square error, and TopK could reduce the time cost for searching the most similar items, too.

Key words: recommendation system, tag, TopK, inverted index, collaborative filtering, item hierarchy

[1] 唐杰烽,张佳,龙锦益. 基于全局冗余最小的快速多标签特征选择方法[J]. 山东大学学报 (工学版), 2025, 55(6): 21-34.
[2] 段圣宇,吴伊宁,赛高乐. 一种面向矩阵分解模型的推荐系统训练加速方法[J]. 山东大学学报 (工学版), 2025, 55(1): 24-29.
[3] 索大翔,李波. 基于Gromov-Wasserstein最优传输的输电线路小目标检测方法[J]. 山东大学学报 (工学版), 2024, 54(3): 22-29.
[4] 李璐,张志军,范钰敏,王星,袁卫华. 面向冷启动用户的元学习与图转移学习序列推荐[J]. 山东大学学报 (工学版), 2024, 54(2): 69-79.
[5] 马坤,刘筱云,李乐平,纪科,陈贞翔,杨波. 用于意图识别的自适应多标签信息学习模型[J]. 山东大学学报 (工学版), 2024, 54(1): 45-51.
[6] 郑顺,王绍卿,刘玉芳,李可可,孙福振. 基于动态掩码和多对对比学习的序列推荐模型[J]. 山东大学学报 (工学版), 2023, 53(6): 47-55.
[7] 刘子一,崔超然,孟凡安,林培光. 基于批归一化统计量的无源多领域自适应方法[J]. 山东大学学报 (工学版), 2023, 53(2): 102-108.
[8] 徐芊芊,许倩,徐华畅,赵钰琳,徐凯,朱红. 基于CnViT的胶质瘤IDH1突变状态智能预测方法[J]. 山东大学学报 (工学版), 2023, 53(2): 127-134.
[9] 董璐璐,宋金涛,魏伟波,潘振宽. 多相图像分割变分模型的标签函数提升方法[J]. 山东大学学报 (工学版), 2022, 52(4): 54-68.
[10] 王冰,马文明,武聪,郝昱猛. 融合信任相似度的偏置概率矩阵分解算法[J]. 山东大学学报 (工学版), 2022, 52(4): 110-117.
[11] 龚楷伦,翟婷婷,唐鸿成. 一种面向多标签分类的在线主动学习算法[J]. 山东大学学报 (工学版), 2022, 52(2): 80-88.
[12] 朱恒东, 马盈仓, 代雪珍. 自适应半监督邻域聚类算法[J]. 山东大学学报 (工学版), 2021, 51(4): 24-34.
[13] 朱昌明,岳闻,王盼红,沈震宇,周日贵. 主动三支聚类下的全局和局部多视角多标签学习算法[J]. 山东大学学报 (工学版), 2021, 51(2): 34-46.
[14] 田枫, 李欣, 刘芳, 李闯, 孙小强, 杜睿山. 基于多模态子空间学习的语义标签生成方法[J]. 山东大学学报 (工学版), 2020, 50(3): 31-37.
[15] 张胜男,王雷,常春红,郝本利. 基于三维剪切波变换和BM4D的图像去噪方法[J]. 山东大学学报 (工学版), 2020, 50(2): 83-90.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 王素玉,艾兴,赵军,李作丽,刘增文 . 高速立铣3Cr2Mo模具钢切削力建模及预测[J]. 山东大学学报(工学版), 2006, 36(1): 1 -5 .
[2] 李 侃 . 嵌入式相贯线焊接控制系统开发与实现[J]. 山东大学学报(工学版), 2008, 38(4): 37 -41 .
[3] 孔祥臻,刘延俊,王勇,赵秀华 . 气动比例阀的死区补偿与仿真[J]. 山东大学学报(工学版), 2006, 36(1): 99 -102 .
[4] 来翔 . 用胞映射方法讨论一类MKdV方程[J]. 山东大学学报(工学版), 2006, 36(1): 87 -92 .
[5] 余嘉元1 , 田金亭1 , 朱强忠2 . 计算智能在心理学中的应用[J]. 山东大学学报(工学版), 2009, 39(1): 1 -5 .
[6] 陈瑞,李红伟,田靖. 磁极数对径向磁轴承承载力的影响[J]. 山东大学学报(工学版), 2018, 48(2): 81 -85 .
[7] 王波,王宁生 . 机电装配体拆卸序列的自动生成及组合优化[J]. 山东大学学报(工学版), 2006, 36(2): 52 -57 .
[8] 李可,刘常春,李同磊 . 一种改进的最大互信息医学图像配准算法[J]. 山东大学学报(工学版), 2006, 36(2): 107 -110 .
[9] 季涛,高旭,孙同景,薛永端,徐丙垠 . 铁路10 kV自闭/贯通线路故障行波特征分析[J]. 山东大学学报(工学版), 2006, 36(2): 111 -116 .
[10] 浦剑1 ,张军平1 ,黄华2 . 超分辨率算法研究综述[J]. 山东大学学报(工学版), 2009, 39(1): 27 -32 .