当前位置: 首页
>要闻动态>应急动态

市安科院:构建风险-隐患-事故知识图谱推进城市安全一体化主动防控体系建设

发布日期:2020-07-15 10:00
【字体:

风险、隐患、事故是反映企业安全生产状况的关键三要素,三者之间存在密不可分的共性和隐性联系。然而,目前风险评估、隐患排查、事故调查在业务和信息系统层面均处于相对割裂的状态,风险源清单、隐患分类方法、事故调查起因物分类标准也未能建立有效对应关系,不利于安全风险分级管控和隐患排查治理双重预防机制的智能化推进。为深入挖掘风险-隐患-事故之间的内在联系,推动大数据、人工智能技术在安全应急管理辅助决策中的应用,市安科院与北京邮电大学联合开展《基于风险-隐患-事故知识图谱的城市安全风险主动防控体系研究》课题攻关,近期,组织了阶段性研讨会。

课题从风险—隐患—事故的关系视角出发,引入知识图谱、自然语言处理等前沿人工智能方法,从大量非结构化风险评估报告、隐患描述文本、事故调查报告中,构建安全专用语料库,研究针对文本数据进行半自动抽取风险、隐患、事故要素的解析及标注技术,开展其内在关联关系挖掘,形成城市环境下的风险-隐患-事故知识图谱,进而构建城市安全主动防控体系。课题共4项研究任务:(1)城市运行安全专用语料库构建,形成城市运行安全“基础”文本词典和知识库;(2)基于深度学习方法的风险、隐患、事故非结构化文本数据解析及标注,提取知识图谱的“实体”。(3)风险-隐患-事故知识图谱构建,实现三者“关系”的建立和可视化;(4)城市运行环境下风险-隐患-事故一体化主动防控体系构建,推进知识图谱的“应用”。

截至目前,基础数据采集方面,采集事故数据记录1194条,整理事故调查报告700余份;北京市专职安全员隐患排查记录64万余条,某自治区隐患排查记录61万余条,某电厂隐患排查记录3794条;风险评估数据7万余条。语料库及中文图谱采集方面,采集并整理开源中文语料库12个、安全应急类语料库2个、开源中文知识图谱6个,初步实现城市运行安全专用语料库的构建。非结构化文本数据解析及标注方面,针对隐患文本数据,通过中文分词、词性标注,解析出常见的7种隐患描述结构,初步完成文本标注、实体抽取等算法建模;基于依存句法分析,实现实体及实体状态的识别和提取,如实体灭火器,状态常为不合格、被遮挡或未设置,通过不同实体间的关联规则挖掘,即可构建隐患的关联网络;针对事故报告数据,建立“起因物→致害物→伤害性质”的描述链路,如一起建筑事故可结构化描述为“建筑物及构筑物→粘土、砂、石→骨折”,通过模式匹配可实现事故报告结构的提取和出现频数的统计,多条链路通过起因物或致害物交织在一起,即可构成事故的系统图景。风险-隐患-事故知识图谱构建方面,未来拟通过隐患实体、事故起因物/致害物、风险源实体的关联,实现三者一体化知识图谱的构建和可视化。

下一步,市安科院课题研发团队将继续推进城市安全语料库数据共指消解、基于BERT+CRF的实体识别和关系抽取方法优化、已提取实体的规范化处理、知识图谱构建和模型完善等各项任务研发。在夯实非结构化风险、隐患、事故数据解析标注及关联关系挖掘的基础上,推进隐患分类的精细化,现有隐患描述的结构化、规范化,风险-隐患-事故一体化,辅助隐患排查、城市安全风险动态评估、事故管理、执法检查等业务的精准化,为防范化解重大风险、及时消除安全隐患、有效遏制生产安全事故提供数据支撑。


扫一扫在手机打开当前页
关闭 打印