期刊首页 优先出版 当期阅读 过刊浏览 作者中心 关于期刊 English

《信息与电子工程前沿(英文)》 >> 2019年 第20卷 第6期 doi: 10.1631/FITEE.1800520

一种基于特征模板和CNN-BiLSTM-CRF的网络安全实体识别方法

1. College of Computer Science and Technology, Guizhou University, Guiyang 550025, China
2. Guizhou Provincial Key Laboratory of Public Big Data, Guiyang 550025, China
3. Institute of Information Engineering, Chinese Academy of Sciences, Beijing 100093, China
4. National Computer Network Emergency Response Technical Team/Coordination Center of China, Beijing 100029, China

发布日期: 2019-08-01

下一篇 上一篇

摘要

利用海量网络安全威胁情报数据,构建网络安全知识图谱实施深度关联分析和挖掘,可帮助识别安全威胁并提出相应防御措施。这已成为网络安全领域研究热点。本文针对网络安全文本数据,研究实体识别算法,为构建网络安全知识图谱奠定基础。传统方法难以识别网络安全领域的新实体、中英文混合安全实体等,且提取的特征不够充分。本文在神经网络模型基础上,提出基于特征模板的CNN-BiLSTM-CRF网络安全实体识别算法。首先构建人工特征模板,提取局部上下文特征。再利用CNN提取字符特征,与局部上下文特征结合,传入BiLSTM模型提取语义特征。最后利用CRF对安全实体进行标注。结果表明,在大规模网络安全数据集上,该方法优于其它算法,F值达到86%。

相关研究