摘要

提出一种基于隐马尔可夫模型的转录因子文本挖掘算法(HMM-TFM),该方法通过建立转录因子名称的词库,利用谓语筛选策略判断句子是否描述转录因子,使用隐马尔可夫模型预测单词词性,并根据前后文单词词性识别转录因子的名称.实验结果表明,HMM-TFM在英文文献中抽取转录因子名称的查全率和查准率分别可达74.2%和77.9%.

全文