互联网是一把双刃剑,既满足了人们的信息需求,又引发了越加严重的网络安全问题。本文所研究的社会安全事件属于在网络上传播的信息内容安全事件,是网络空间安全的一部分。社会安全事件快速传播所引发的网络舆情,可能会引起社会负面影响和破坏党政机关形象,影响社会稳定。知识图谱通过整合实体、概念以及它们之间的关系为数据的关联分析奠定基础,帮助研究人员通过实体或概念之间的关系实现对事件之间关系的研究。构建社会安全事件知识图谱,对于以事件信息为基础,挖掘社会安全事件内部以及事件之间的多元化关系,具有十分重要的意义。本文开展了面向社会安全事件的知识图谱构建方法研究,研究内容包括以下五个方面:(1)社会安全事件的结构化数据资源建设方法研究完成了基于百度百科的数据资源库建设。提出了百度百科词条的数据获取、解析、存储方法,实现了Neo4j图数据库的节点、关系、属性等信息存储。提出了社会安全事件数据资源库的层次设计,完成了词向量库、Json格式资源库和Neo4j数据库的构建。(2)命名实体识别方法研究研究基于深度学习模型的命名实体识别,提出了两种基于双向LSTM模型的命名实体识别优化模型——强化中心字模型和强化逆向序列模型。强化中心字模型通过并列添加一个输入序列为中心字的神经网络模型,实现对当前序列窗口核心字的优化,F1值达到了97.16%。强化逆向序列模型通过强化逆向序列对神经网络模型的贡献作用,实现对逆向序列的优化,F1值达到了97.27%。实验结果表明,两种优化模型都能提升命名实体识别的效果。(3)实体关系抽取方法研究提出了基于命名实体词性的关系抽取优化模型——词向量优化模型和并列结构优化模型,实现了基于依存句法分析的开放式关系抽取。基于命名实体词性的关系抽取优化模型,解决了传统深度学习模型无法学习词性特征的问题。词向量优化模型是在词向量的基础上添加词性向量,并列结构优化模型是通过并列结构学习句子中实体对的词性。基于并列结构的实体词性优化模型,在CNN、LSTM、GRU模型方面取得了很好的效果,F1值分别提升了12%、6.96%、6.07%。基于依存句法分析的关系抽取能够实现基于定中关系的名词短语识别和基于主谓宾成分的实体关系抽取。实验结果表明,开放式关系抽取取得了不错的效果。生成方法研究研究基于TextRank算法的摘要自动生成,提出了基于TextRank和句子综合相似度的摘要生成模型。句子综合相似度整合词形相似度、统计相似度、语义相似度,解决了句子摘要冗余问题,提升了摘要抽取的效果。(5)事件知识图谱系统的设计与实现设计了系统的总体框架和子模块的功能架构,实现了事件知识图谱系统。基于Webcollector爬虫框架、依存句法分析、TextRank算法、Neo4j图数据库等技术,设计和实现了系统功能,完成了事件知识图谱的构建。