CCL/NLP-NABD 2018系统展示


编号 系统 单位
1 DCFEE:基于自动标注数据的篇章级中文金融事件抽取系统 中国科学院自动化研究所
2 DeepBrain平台 义语智能科技(上海)有限公司
3 DUTIR应用系统 大连理工大学
4 KmustNMT机器翻译 昆明理工大学
5 THU对话系统技术平台 清华大学计算机系人工智能所交互式人工智能课题组
6 面向金融事件的知识问答系统 中国科学院自动化研究所
7 模块化的自然语言处理工具FastNLP统 复旦大学
8 数据酷客 博雅大数据学院
9 小牛翻译开放平台 沈阳雅译网络技术有限公司
10 讯飞法律咨询系统 哈工大讯飞联合实验室、科大讯飞AI研究院
11 语文作文自动评阅系统 哈工大讯飞联合实验室、科大讯飞AI研究院
12 智慧识屏;机器人互聊斗图 三角兽(北京)科技有限公司
13 自然语言语义解析平台 中国科学院软件研究所
14 语言知识获取与汉语语义分析 北京语言大学
15 司法大数据系列产品 国双科技

系统介绍

1 DCFEE:基于自动标注数据的篇章级中文金融事件抽取系统(中国科学院自动化研究所)

        金融事件可以帮助用户快速获取交易行情、股市信息,进而做出正确的决策。公司通常通过公告的形式发布公司的重大事件,但公告内容大部分是冗余的、篇章级的,如何从里面抽取出重要的事件信息,具有重要价值和现实意义。目前有监督的事件抽取模型大多依赖于公开的标注语料,但在一些特殊领域(例:金融领域),并没有足够的标注数据支撑高质量模型的训练。该工作主要研究如何从自动生成大规模的标注语料,并从篇章级公司公告文本中抽取出用户感兴趣的事件内容。


2 DeepBrain平台(义语智能科技(上海)有限公司)

        DeepBrain致力于解决传统儿童硬件产品的缺陷,专注于在儿童领域打造完美的语音交互体验,服务于5亿全球儿童。它包含了3个核心组成部分,分别是DeepBrain智能语音交互平台、DeepBrain芯片模组、DeepBrain技能商店。


3 DUTIR应用系统(大连理工大学)

        中文医学知识图谱中的每个节点表示一个医学实体,每条边为实体与实体之间的关系。医学知识图谱把不同种类的医学信息联系在一起而形成一个大型医学知识网络。用户可以通过知识图谱,快速精确的获取相关知识以及知识之间的逻辑关系,从知识关系的角度去分析问题,也能通过可视化的方式将抽象的内容变为用户可理解的形式展示出来。


4 KmustNMT机器翻译(昆明理工大学)

        KmustNMT机器翻译以昆明理工大学智能信息处理重点实验室的人才与平台为支撑,采用当今主流的神经机器翻译技术,通过增量式训练,可以不断学习新的翻译知识、扩大模型规模,以此提高翻译效果。能提供基于HTTP协议的翻译API接口,用户可以很便捷的集成嵌入到自己的业务平台或其他应用中。


5 THU对话系统技术平台(清华大学计算机系人工智能所交互式人工智能课题组)

        “THU对话系统技术平台”是为用户提供对话系统技术支持的服务平台。该平台集成了清华大学计算机系交互式人工智能(CoAI)研究团队多年的技术成果,旨在为用户提供具有灵活定制能力的对话关键技术工具与接口,使得开发者快速地搭建定制化的对话系统,赋予产品对话交互的能力。平台提供提供了任务导向对话系统、问答系统、闲聊对话系统的定制工具或开发接口,开放了意图理解、对话管理、对话生成的多个关键算法源代码,并共享了问答与对话相关的多个数据集;此外,平台还通过原型系统展示这些算法与技术的有效性。THU对话系统技术平台致力于推动和促进对话系统核心技术的前沿研究和应用发展,为人工智能的行业落地提供示范应用。


6 面向金融事件的知识问答系统(中国科学院自动化研究所)

        金融事件知识问答系统:基于所构建的金融知识图谱,通过问句解析,能够回答与人、企业、事件相关的问题,比如回答“万科的老板是谁”、“民生银行相关的质押事件有哪些”等问题。


7 模块化的自然语言处理工具FastNLP(复旦大学)

        fastNLP是一个基于PyTorch的模块化自然语言处理工具,用于快速开发NLP系统。 它将基于深度学习的NLP模型划分为不同的模块。 这些模块分为4类:encoder(编码),interactor(交互), aggregrator(聚合) and decoder(解码), 而每个类别包含不同的实现模块。大多数当前的NLP模型可以构建在这些模块上,这极大地简化了开发NLP模型的过程。


8 数据酷客(博雅大数据学院)

        博雅大数据学院是由北京大数据研究院成立的专注于教学产品研发与服务、大数据教育培训的机构。博雅大数据学院通过聚焦数据科学、大数据和人工智能等最新前沿技术,建立了国内首个完整、专业的本科、高职课程体系及综合实训体系,自主研发了理实结合实训教育云平台——数据酷客。提供结合真实案例的学习、练习、考试、竞赛等几大模块,通过在线教学实训、大数据竞赛、大数据人才评测及就业推荐等方式,为大数据人才培养提供一站式服务。


9 小牛翻译开放平台(沈阳雅译网络技术有限公司)

        小牛翻译开放平台采用了小牛翻译团队拥有近40年的机器翻译沉淀技术,利用主流的神经机器翻译理论和技术,基于自主研发的NiuTrans平台研发而成,目前已经支持包括主流语种(英日韩俄法西泰等)的110+语种到汉语的双向翻译,其中也是业内唯一支持7大少数民族语言(维藏蒙哈朝彝壮)到汉语的双向翻译平台。


10 讯飞法律咨询系统(哈工大讯飞联合实验室、科大讯飞AI研究院)

        本系统由哈工大讯飞联合实验室研发,旨在构建一个面向大众的法律咨询机器人,可以针对大众工作生活中出现的各种法律问题进行自动解答,具体功能又分为三个子模块,分别为法律咨询、法条查询、律师推荐。


11 语文作文自动评阅系统(哈工大讯飞联合实验室、科大讯飞AI研究院)

        本系统参考高考作文评分指南,从字迹工整度、词汇丰富性、句子通顺度、文采、篇章结构、立意等多个维度综合评价中学生作文,通过自动学习人类专家的评分标准对作文进行自动评阅。本系统支持作文评分、眉批、分项评阅、评语生成等功能。


12 智慧识屏:机器人互聊斗图(三角兽(北京)科技有限公司)

        用户通过手势触发,基于语义理解技术,针对手机、APP内所有文本信息,智能识别意图并关联相关信息、服务等资源,提供智能的手机交互体验。智慧识屏方案解决了用户在手机上操作文本流程复杂繁琐的痛点,用户只需长按手机中任何一段文本,就会触发智慧识屏的自然语言理解的能力,并自动分析文本的意图,识别其中有价值的实体。目前,智慧识屏能够覆盖30多个领域的实体,相关信息会以卡片的形式弹出,点击卡片即可完成一步的操作。这个技术已经应用在oppo、vivo、魅族、中兴、锤子等13个安卓系统品牌手机。根据预测,2018年底将会有超过1.5亿台智能手机搭载此功能,平均每一个用户每天将会有10次以上的交互数量。


13 自然语言语义解析平台(中国科学院软件研究所)

        语义解析是实现理解用户口语所表述的指令,转换为特定的格式。本平台采用语义解析技术主要有两类,一类是基于词典和组合文法的语义解析,这类方法的特点是利用自定义的词典和组合文法以自底向上的方式对自然语言句子进行解析;另一类是基于Sequence-to-action的语义解析,这类方法是把语义解析转换为语义图构建的过程,同时用动作序列来编码语义图的构建,从而将语义解析形式化为句子到action序列的翻译过程,并可利用RNN模型来建模,这类方法的特点是端到端的,无需定义词典和组合文法,也不需要定义特征。两类方法在特定领域的句子解析任务中都能够取得80%-90%的准确率。相关研究工作主要有基于CCG的语义解析,基于DCS的语义解析,基于语义图的语义解析和基于Seq2Seq的语义解析。本平台所使用的基于词典和组合文法的语义解析主要与前两类方法类似,不同的是需要设计特定的组合文法;本平台所使用的基于Sequence-to-action是综合利用了基于语义图的语义解析方法和基于Seq2Seq的语义解析方法的优势,也是首次提出Sequence-to-Action的语义解析方法。


14 语言知识获取与汉语语义分析(北京语言大学)

        句法语义分析是语言智能的核心技术。长期以来,汉语句法语义分析方法主要借鉴英语的短语分析树、语义依存理论。如何针对汉语特点,提出句法语义分析框架,对语言学和计算语言学都有极其重要的研究意义。北语团队致力于研制汉语句法语义分析工具,为汉语教学、汉语研究、深度汉语信息处理提供服务。 目前团队已收集语料两万亿字,结合语义模式和句法模式进行成分关系关联,关系属性填槽等人机互助的资源建设和知识挖掘工作。我们组建了文理交叉团队进行大规模数据标注和知识抽取。从而在命名实体识别、意合图构建和构式抽取等方面取得良好效果。 我们将主要展示和介绍以下四方面的工作:
(1)句法语义分析的新理念和工作平台建设;
(2)融合深度神经网络的句法语义计算模型;
(3)意合图、构式库、语块库等语义资源建设;
(4)标注与计算工具平台。


15 司法大数据系列产品(国双科技)

1、检察智库(法信)
主要运用技术:基于词频统计 (td-idf算法) 语义解析(意图识别、实体识别、实体链接、关系映射) 简要介绍:法信平台是中国第一家法律知识服务和案例大数据服务深度融合的法律平台,通过独有的法律知识导航体系(中国Westlaw钥匙码系统)、裁判剖析与同案智推大数据引擎,对海量法律条文、案例要旨、法律观点、裁判等法律知识资源进行深度加工、分类聚合、串联推送,进而为用户提供高效、精准的一站式法律解决方案和案例大数据智推服务的互联网平台。
2、定罪量刑
主要运用技术:运用自有规则在卷宗中提取案件要素、量刑情节,采用机器学习进行文本解析 简要介绍:定罪量刑辅助系统集成人民法院出版社的“法信”应用,加之对各地量刑实施细则的梳理,并结合司法大数据的类案识别,实现了对案件进行针对性知识推送和案情分析,为检察官办案提供高效解决方案。
3、法智
主要运用技术:语义解析(意图识别、实体识别、实体链接、关系映射)和语义检索(基于深度学习的相似度计算、基于知识图谱的语义扩展匹配) 简要介绍:法智产品旨在为用户提供一个法律专业问答系统,主要为用户提供法律专业难点问题的权威解答,同时提供高效精准的知识查询和推送等,可有效提高用户的工作效率。