• 华通晟云智能语义分析系统

  •  

    现如今各行各业集体组团跳入大数据浪潮,在大数据时代和大数据技术的牵引下我们反观这两年所遇到的大数据处理的内容,其中80%的数据存储和数据结构其实是非结构化数据。抛开视频图像处理,我们面临着巨大量的文本数据还未进入价值挖掘期。智能语义识别是将文本从一个无结构的原始文本转化为结构化的计算机可以识别处理的信息,即对文本进行科学的抽象,建立它的数学模型,用以描述和代替文本。使计算机能够通过对这种模型的计算和操作来实现对文本的识别。由于文本是非结构化的数据,要想从大量的文本中挖掘有用的信息就必须首先将文本转化为可处理的结构化形式。目前通常做法是采用向量空间模型来描述文本向量,但是如果直接用分词算法和词频统计方法得到的特征项来表示文本向量中的各个维,那么这个向量的维度将是非常的大。这种未经处理的文本矢量不仅给后续工作带来巨大的计算开销,使整个处理过程的效率非常低下,而且会损害分类、聚类算法的精确性,从而使所得到的结果很难令人满意。因此,华通晟云科技有限公司结合多年大数据和机器学习技术对文本向量做进一步处理,实现文本分类,文本关键词标签提取及文本结构化。

    针对行业的分析和行业需求力强度,我们的产品首先切入政府行业特定领域的文本分析-笔录文本分析。  

                            华通晟云智能语义分析系统

    笔录先期是传统国家在没有具备监控型国家所具备的证据生成机制情况下,侦查阶段所形成的对嫌疑人的审讯笔录和对证人的问话调查笔录(本文统称笔录)。尤其是作为口供的审讯笔录仍是法庭上最为主要的证据的核心原因。笔录从产生到当前已经经过很长时间的积淀,之前由于技术原因大量笔录文本都无法有效利用和分析。 传统的语篇分析基本上局限在对单个语篇的句法和字面意义的语义分析上,这种传统的语义分析法无法解决语篇背后的语境和语篇的真实含义以及各相关语篇组合起来的完整意义。

                           华通晟云智能语义分析系统

     

    面对执法部门每天产生的海量笔录文本数据,如何将这些笔录都串并起来一起分析,使这些文本数据发挥最大的价值,产生1+1>2的效果,是当前需要仔细思考的问题。串并案首先需要做的是提取笔录的关键信息。现阶段主要通过人工研读的方式提取笔录的关键信息。基层分析人员工作压力大,任务重,难免在分析的时候出错。由此,迫切需要寻找到一种切实有效的语义分析方法。

     

    华通晟云智能笔录分析管理系统

     华通晟云笔录文本分析系统基于我们自主研发的智能语义分析算法,加上华通晟云在大数据和机器学习中语义分析领域长期的技术积累,历时半年开发出一套针对笔录的自动化文本分析系统—华通晟云智能笔录分析管理系统。

                     华通晟云智能语义分析系统

     系统通过机器自动研判笔录,自动提取如案件性质、电话、身份证、车牌号、车型、案发地、案发时间、作案手段等笔录关键信息。系统已经在某市公安部门进入了实战应用,大大减轻基层干警的工作压力,提升工作效率。同时,为下一步的串并案提供数据支撑。

     

                         华通晟云智能语义分析系统

           

                        华通晟云智能语义分析系统

     

友情链接:
江苏华通晟云科技有限公司 ©华通晟云 HTDATACLOUD 2015~2018  苏ICP备16001695号