%A 刘洋,刘博,王峰 %T 基于Parameter Server框架的大数据挖掘优化算法 %0 Journal Article %D 2017 %J 山东大学学报 (工学版) %R 10.6040/j.issn.1672-3961.0.2016.339 %P 1-6 %V 47 %N 4 %U {http://gxbwk.njournal.sdu.edu.cn/CN/abstract/article_1608.shtml} %8 2017-08-20 %X 基于大数据挖掘的实时性要求和数据样本的多样性特征,提出一种面向大数据挖掘的机器学习模型训练优化算法。分析当前算法的迭代计算过程,根据模型向量的改变量将迭代过程分为粗调和微调两个阶段,并发现在微调阶段绝大部分样本对计算结果的影响极小,因此可以在微调阶段不计算此类样本的梯度而直接采用上次迭代的计算结果,从而减小计算量,提升计算效率。试验结果表明,算法在分布式集群环境下可以减小模型训练约35%的计算量,且训练得到的模型准确度在正常范围内,可有效提高大数据挖掘的实时性。