您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版)

• 机器学习与数据挖掘 • 上一篇    下一篇

基于递归特征消除法的蛋白质能量热点预测

魏小敏,徐彬,关佶红   

  1. 同济大学计算机科学与技术系, 上海 201804
  • 收稿日期:2013-04-02 出版日期:2014-04-20 发布日期:2013-04-02
  • 通讯作者: 关佶红(1969- ),女,湖北武汉人,教授,博士,主要研究方向为数据库,数据挖掘,生物信息学.E-mail:jhguan@tongji.edu.cn
  • 作者简介:魏小敏(1988- ),女,河南周口人,硕士,主要研究方向为生物信息学.E-mail:wxmnaonao@sina.com
  • 基金资助:
    国家自然科学基金资助项目(61173118);上海市教委曙光计划资助项目(09SG23);中央高校基本科研业务费专项资助项目(0800219157)

Prediction of protein energy hot spots based on recursion feature elimination

WEI Xiaomin, XU Bin, GUAN  Jihong   

  1. Department of Computer Science and Technology, Tongji University, Shanghai 201804, China
  • Received:2013-04-02 Online:2014-04-20 Published:2013-04-02

摘要: 基于蛋白质相互作用能量热点的特性,定义了残基接触数、溶剂可及性面积相对变化量所占比例等18个新特征。分别使用基于支持向量机(support vector machine, SVM)和基于F-Score的递归特征消除法进行特征选择,提出对应的预测模型SVM-RFE和F-Score-RFE用于蛋白质能量热点的预测。实验结果显示,在独立测试中F-Score-RFE模型的F1比当前预测性能最好的方法提高6.25%,表明所定义的新特征对蛋白质能量热点的识别具有较大的贡献。

关键词: 特征选择, 能量热点, 递归消除, 蛋白质相互作用, 预测

Abstract: 18 new features such as residue contact number and the proportion of relative change of accessible surface area et al. were derived based on the analysis of protein-protein interaction energy hot spots. Two recursion feature elimination methods were used to select discriminative feature subsets and two corresponding prediction models were proposed, noted as SVM- RFE and F-Score-RFE. The experimental  results showed that the prediction model F-Score-RFE could improve 6.25% in the value of F1 compared with the best existing method on the same independent test dataset, which  indicated that new features defined were significant to improve the performance of prediction.

Key words: prediction, recursion eliminate, protein-protein interaction, energy hot spots, feature selection

中图分类号: 

  • TP391
[1] 牟廉明. 自适应特征选择加权k子凸包分类[J]. 山东大学学报(工学版), 2018, 48(5): 32-37.
[2] 吴红岩,冀俊忠. 基于花授粉算法的蛋白质网络功能模块检测方法[J]. 山东大学学报(工学版), 2018, 48(1): 21-30.
[3] 刘哲,宋锐,邹涛. 基于模型预测控制的磨削机器人末端力跟踪控制算法[J]. 山东大学学报(工学版), 2018, 48(1): 42-49.
[4] 谢国辉,樊昊. 太阳能光热发电技术成熟度预测模型[J]. 山东大学学报(工学版), 2017, 47(6): 83-88.
[5] 韩学山,王俊雄,孙东磊,李文博,张心怡,韦志清. 计及空间关联冗余的节点负荷预测方法[J]. 山东大学学报(工学版), 2017, 47(6): 7-12.
[6] 李笋,王超,张桂林,徐志根,程涛,王义元,王瑞琪. 基于支持向量回归的短期负荷预测[J]. 山东大学学报(工学版), 2017, 47(6): 52-56.
[7] 车长明,张华栋,李建祥,袁弘,刘海波. 需求侧规模化电动汽车的充电负荷优化调控策略[J]. 山东大学学报(工学版), 2017, 47(6): 108-114.
[8] 周志杰,赵福均,胡昌华,王力,冯志超,刘涛源. 基于证据推理的航天继电器故障预测方法[J]. 山东大学学报(工学版), 2017, 47(5): 22-29.
[9] 周福娜,高育林,王佳瑜,文成林. 基于深度学习的缓变故障早期诊断及寿命预测[J]. 山东大学学报(工学版), 2017, 47(5): 30-37.
[10] 路昌海. 基于Markov链的锅炉热负荷预测方法[J]. 山东大学学报(工学版), 2017, 47(3): 151-158.
[11] 李素姝,王士同,李滔. 基于LS-SVM与模糊补准则的特征选择方法[J]. 山东大学学报(工学版), 2017, 47(3): 34-42.
[12] 方昊,李云. 基于多次随机欠采样和POSS方法的软件缺陷检测[J]. 山东大学学报(工学版), 2017, 47(1): 15-21.
[13] 何正义,曾宪华,曲省卫,吴治龙. 基于集成深度学习的时间序列预测模型[J]. 山东大学学报(工学版), 2016, 46(6): 40-47.
[14] 包建业,王静. 基于离散裂隙网络模型的隧道涌水量预测[J]. 山东大学学报(工学版), 2016, 46(6): 127-134.
[15] 王志强,文益民,李芳. 基于多方面评分的景点协同推荐算法[J]. 山东大学学报(工学版), 2016, 46(6): 54-61.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!