睿企科技助力NLP技术实战赋能安全生产专项整治三年行动
2021-04-30 18:41 睿企科技

2020年4月,国 务院安委会印发了《全国安全生产专项整治三年行动计划》,主要聚焦在风险高隐患多、事故易发多发的的煤矿、非煤矿山、危险化学品、消防、道路运输、民航铁路等交通运输、工业园区、城市建设、危险废物等9个行业领域,组织开展安全整治。全国安全生产专项整治三年行动于2020年4月1日启动,至2022年12月结束,分为动员部署、排查整治、集中攻坚和巩固提升四个阶段,明确了2个专题实施方案、9个专项整治实施方案。

这次专项整治行动有两个特点:时间长、领域广,这也体现了国家对安全生产工作的高度重视,通过三年整治进一步把安全生产基础打牢,使人民群众的幸福感、获得感、安全感更加持续、更有保障。各地区各有关部门也先后成立了相应的工作领导机构来推动专项整治工作各项措施的落实。

在过去的一年时间里,睿企科技通过自然语言处理(NLP)技术,协助政府有关部门,以警情、政务热线等数据为切入点,充分发挥这些数据源作为感知风向标的指示作用,探索并落地符合业务场景和实战需求的安全监管风险预警模型,让人工智能技术对基层基础工作的支撑作用落到实处。

01 知识体系建立

通过对过去十年国家应急管理部发布的特别重大事故调查报告的研读和梳理,睿企科技从数十份报告中建立道路交通车辆、道路交通要素、消防隐患、危险品、危险管理等若干知识体系,从理论上结合安全生产监管和风险管理理论以及其他相关学科理论,通过分析安全生产监管的复杂特征,对海量警情文本进行语义分析。结合命名实体识别、关系识别与关键词识别模型前沿技术,针对警情文本研判要素识别的安全监管场景加以调整和改进,重新开发实现了公安安全监管场景的命名实体识别、精准关系分类和业务关键词挖掘模型,端到端完成了对警情文本的处理,具体来说有以下三个步骤:

一是数据治理,对接入的文本数据进行清洗,过滤重复、无效信息与脏数据,输出高质量的文本数据内容;

二是语义理解,构建安全生产数据命名实体识别、精准关系分类和业务关键词挖掘三个模型,解析文本中可供研判的命名实体、实体关系和业务关键词,为安全监管提供更充分的研判要素,扩展文本数据价值密度,提高数据治理与文本数据的整合度;

三是构建知识词库,按照使用场景对识别研判要素进行自底向上进行分层组织,形成安全监管、执法监督、服务民生等条线的要素知识库,挖掘不为政府机关所掌握的隐患特征,以数据服务的方式为安全监管部门各应用系统提供知识服务支撑,充分释放文本数据的应用效能,加深条线应用深度,进一步拓宽数据赋能场景。

02 隐患识别与业务落地

睿企科技以“定位相关信息源”,“归类潜在风险”,“落实具体地址、人、车”为目标,对数据文本内容进行语言理解,从数据中的“群租房”、“消防隐患”和“道路交通”三个场景入手,进行安全监管方面的潜藏隐患识别。以地级市为例,平均100万起警情中可发现安全监管相关的警情数量约占2万起,由此获得的相关地址、车辆和人员的有效信息5000起左右,这极大填补了过去政务工作中通文本内容对安全隐患进行感知和识别的空白。

以“群租房“为例,围绕治安管理中的群租房问题,基于NLP技术对相关警情进行挖

从中分析潜在的群租房信息,通过“一址多人、多次噪音、以人括址”等方向,对群租房问题进行定位,并通过系统从以下三个维度开展分析,报警地址本身为群租房地址、警情内容中某门牌号或楼上(楼下)某门牌号为群租房地址、警情内容中仅提及相对位置,示例结果如下表:

今年是《全国安全生产专项整治三年行动计划》实施的第二个年头,睿企科技通过一年的技术探索与应用落地,充分利用自然语言理解等前沿科技,帮助政府基层管理者构建起安全监管预警系统,及时发现群租房、消防,道路安全等隐患,助力推进安全生产专项整治三年行动,为预防、保障公民人身财产安全尽一份睿企力量!

Rich AI睿企科技是一家专注于自然语言处理与决策引擎的认知智能高科技公司,以持续为客户创造价值为使命,以创新自然语言处理、知识图谱等AI认知智能技术为宗旨,为客户提供基于大数据驱动的认知决策系统和服务。

公司专注大规模文本数据分析与价值挖掘,通过技术与业务的深度融合,为政府提供决策支持,为企业提供商机信息。