Journal of Systems Engineering and Electronics ›› 2010, Vol. 32 ›› Issue (6): 1318-1324.doi: 10.3969/j.issn.1001-506X.2010.06.043
杨炳儒,周谆,侯伟
YANG Bing-ru, ZHOU Zhun, HOU Wei
摘要:
蛋白质二级结构预测是公认的生物信息学领域的国际性难题。以基于内在认知机理的知识发现理论(knowledge discovery theory based on inner cognitive mechanism, KDTICM)理论的扩展性研究与数据库中的知识发现(knowledge discovery in database*, KDD*)模型为基础,提出一种基于结构序列的多分类算法——SAC(structural association classification),可以有效地解决蛋白质二级结构预测问题。该算法借助设定支持度阈值的精化知识库的方法,其预测准确率能够超过85%。以该算法为核心,构建了一个蛋白质二级预测模型——复合金字塔模型。实验证明,在RS126、CB513、ILP数据集上的预测准确率均超过80%,超过目前已知的国际主流水平。