您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版)

• 机器学习与数据挖掘 • 上一篇    下一篇

基于递归特征消除法的蛋白质能量热点预测

魏小敏,徐彬,关佶红   

  1. 同济大学计算机科学与技术系, 上海 201804
  • 收稿日期:2013-04-02 出版日期:2014-04-20 发布日期:2013-04-02
  • 通讯作者: 关佶红(1969- ),女,湖北武汉人,教授,博士,主要研究方向为数据库,数据挖掘,生物信息学.E-mail:jhguan@tongji.edu.cn
  • 作者简介:魏小敏(1988- ),女,河南周口人,硕士,主要研究方向为生物信息学.E-mail:wxmnaonao@sina.com
  • 基金资助:
    国家自然科学基金资助项目(61173118);上海市教委曙光计划资助项目(09SG23);中央高校基本科研业务费专项资助项目(0800219157)

Prediction of protein energy hot spots based on recursion feature elimination

WEI Xiaomin, XU Bin, GUAN  Jihong   

  1. Department of Computer Science and Technology, Tongji University, Shanghai 201804, China
  • Received:2013-04-02 Online:2014-04-20 Published:2013-04-02

摘要: 基于蛋白质相互作用能量热点的特性,定义了残基接触数、溶剂可及性面积相对变化量所占比例等18个新特征。分别使用基于支持向量机(support vector machine, SVM)和基于F-Score的递归特征消除法进行特征选择,提出对应的预测模型SVM-RFE和F-Score-RFE用于蛋白质能量热点的预测。实验结果显示,在独立测试中F-Score-RFE模型的F1比当前预测性能最好的方法提高6.25%,表明所定义的新特征对蛋白质能量热点的识别具有较大的贡献。

关键词: 特征选择, 能量热点, 递归消除, 蛋白质相互作用, 预测

Abstract: 18 new features such as residue contact number and the proportion of relative change of accessible surface area et al. were derived based on the analysis of protein-protein interaction energy hot spots. Two recursion feature elimination methods were used to select discriminative feature subsets and two corresponding prediction models were proposed, noted as SVM- RFE and F-Score-RFE. The experimental  results showed that the prediction model F-Score-RFE could improve 6.25% in the value of F1 compared with the best existing method on the same independent test dataset, which  indicated that new features defined were significant to improve the performance of prediction.

Key words: prediction, recursion eliminate, protein-protein interaction, energy hot spots, feature selection

中图分类号: 

  • TP391
[1] 唐杰烽,张佳,龙锦益. 基于全局冗余最小的快速多标签特征选择方法[J]. 山东大学学报 (工学版), 2025, 55(6): 21-34.
[2] 邓彬, 张宗包, 赵文猛, 罗新航, 吴秋伟. 基于云边协同和图神经网络的电动汽车充电站负荷预测方法[J]. 山东大学学报 (工学版), 2025, 55(5): 62-69.
[3] 周群颖,隋家成,张继,王洪元. 基于自监督卷积和无参数注意力机制的工业品表面缺陷检测[J]. 山东大学学报 (工学版), 2025, 55(4): 40-47.
[4] 赵红专,张鑫,张蓓聆,展新,李文勇,袁泉,王涛,周旦. 基于改进人工势场的智能车动态安全椭圆路径规划方法[J]. 山东大学学报 (工学版), 2025, 55(3): 46-57.
[5] 薛冰冰,王勇,杨维浩,王川,于迪,王旭. 基于ETC收费数据的高速公路交通流数据修复及实时预测[J]. 山东大学学报 (工学版), 2025, 55(3): 58-71.
[6] 耿麒,李晓斌,黄雨枫,汪学斌,杨沐霖,郭惠川,章慧健. 基于小尺度滚刀直线切割试验的岩石强度预测[J]. 山东大学学报 (工学版), 2025, 55(3): 111-120.
[7] 祝明,石承龙,吕潘,刘现荣,孙驰,陈建城,范宏运. 基于优化长短时记忆网络的深基坑变形预测方法及其工程应用[J]. 山东大学学报 (工学版), 2025, 55(3): 141-148.
[8] 王士柏,孙树敏,程艳,周光奇,关逸飞,刘奕元,张志谦,张祯滨. 计及SOC安全边界的光储联合系统协同控制策略[J]. 山东大学学报 (工学版), 2025, 55(2): 37-44.
[9] 银英姿,魏景涛,泽里罗布,董伟. 基于Wiener退化过程的纤维混凝土抗冻性[J]. 山东大学学报 (工学版), 2025, 55(2): 106-113.
[10] 吴正健,吾尔尼沙·买买提,杨耀威,阿力木江·艾沙,库尔班·吾布力. 基于DRCoALTP的印刷体文档图像多文种识别方法[J]. 山东大学学报 (工学版), 2025, 55(1): 51-57.
[11] 邹正标,刘毅志,廖祝华,赵肄江. 动态交通流量预测的时空注意力图卷积网络[J]. 山东大学学报 (工学版), 2024, 54(5): 50-61.
[12] 刘冬兰,刘新,刘家乐,赵鹏,常英贤,王睿,姚洪磊,罗昕. 基于分解式Transformer的联邦长期时间序列预测算法[J]. 山东大学学报 (工学版), 2024, 54(5): 101-110.
[13] 王凤娟,王语睿,卫兰,范存群,徐晓斌. 基于自适应线性模型的环境数据预测算法[J]. 山东大学学报 (工学版), 2024, 54(4): 86-94.
[14] 刘真光,朱玉佳,王勇,傅湘玲,赵一姣,陈晋鹏. 基于点云处理网络的三维颜面正中矢状面预测模型[J]. 山东大学学报 (工学版), 2024, 54(3): 30-35.
[15] 刘新,刘冬兰,付婷,王勇,常英贤,姚洪磊,罗昕,王睿,张昊. 基于联邦学习的时间序列预测算法[J]. 山东大学学报 (工学版), 2024, 54(3): 55-63.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 王素玉,艾兴,赵军,李作丽,刘增文 . 高速立铣3Cr2Mo模具钢切削力建模及预测[J]. 山东大学学报(工学版), 2006, 36(1): 1 -5 .
[2] 李 侃 . 嵌入式相贯线焊接控制系统开发与实现[J]. 山东大学学报(工学版), 2008, 38(4): 37 -41 .
[3] 孔祥臻,刘延俊,王勇,赵秀华 . 气动比例阀的死区补偿与仿真[J]. 山东大学学报(工学版), 2006, 36(1): 99 -102 .
[4] 来翔 . 用胞映射方法讨论一类MKdV方程[J]. 山东大学学报(工学版), 2006, 36(1): 87 -92 .
[5] 余嘉元1 , 田金亭1 , 朱强忠2 . 计算智能在心理学中的应用[J]. 山东大学学报(工学版), 2009, 39(1): 1 -5 .
[6] 李梁,罗奇鸣,陈恩红. 对象级搜索中基于图的对象排序模型(英文)[J]. 山东大学学报(工学版), 2009, 39(1): 15 -21 .
[7] 陈瑞,李红伟,田靖. 磁极数对径向磁轴承承载力的影响[J]. 山东大学学报(工学版), 2018, 48(2): 81 -85 .
[8] 王波,王宁生 . 机电装配体拆卸序列的自动生成及组合优化[J]. 山东大学学报(工学版), 2006, 36(2): 52 -57 .
[9] 李可,刘常春,李同磊 . 一种改进的最大互信息医学图像配准算法[J]. 山东大学学报(工学版), 2006, 36(2): 107 -110 .
[10] 季涛,高旭,孙同景,薛永端,徐丙垠 . 铁路10 kV自闭/贯通线路故障行波特征分析[J]. 山东大学学报(工学版), 2006, 36(2): 111 -116 .