Stanford Natural Language Inference (SNLI)和Multi-Genre NLI Corpus(MultiNLI) 数据集_CopperDong的博客-程序员信息网

技术标签: NLP  

Stanford Natural Language Inference (SNLI)和Multi-Genre NLI Corpus(MultiNLI) 数据集

https://nlp.stanford.edu/projects/snli/
https://www.nyu.edu/projects/bowman/multinli/
MultiNLI是SNLI的升级版,格式一样,规模相当,但是前者变化更多,也包含了一个辅助测试集用于cross-genre transfer 评估

SNLI1.0包含570,000的人工手写英文句子对,人工标注了平衡的分类标签:蕴含entailment,矛盾,中性
支持NLI(natural language inference)任务,也被视为RTE( recognizing textual entailment )任务

详细介绍:
Samuel R. Bowman, Gabor Angeli, Christopher Potts, and Christopher D. Manning. 2015. A large annotated corpus for learning natural language inference. In Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP). [pdf] [bib]

除了gold label,还包含了5个标注人的评估结果,另外句子以两种解析表示:

gold_label sentence1_binary_parse sentence2_binary_parse sentence1_parse sentence2_parse sentence1 sentence2 captionID pairID label1 label2 label3 label4 label5
neutral ( ( ( A person ) ( on ( a horse ) ) ) ( ( jumps ( over ( a ( broken ( down airplane ) ) ) ) ) . ) ) ( ( A person ) ( ( is ( ( training ( his horse ) ) ( for ( a competition ) ) ) ) . ) ) (ROOT (S (NP (NP (DT A) (NN person)) (PP (IN on) (NP (DT a) (NN horse)))) (VP (VBZ jumps) (PP (IN over) (NP (DT a) (JJ broken) (JJ down) (NN airplane)))) (. .))) (ROOT (S (NP (DT A) (NN person)) (VP (VBZ is) (VP (VBG training) (NP (PRP$ his) (NN horse)) (PP (IN for) (NP (DT a) (NN competition))))) (. .))) A person on a horse jumps over a broken down airplane. A person is training his horse for a competition. 3416050480.jpg#4 3416050480.jpg#4r1n neutral 


版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/QFire/article/details/79529844

智能推荐

Oracle清理alert、trace、listener.log、aud审计文件_普通网友的博客-程序员信息网

Oracle清理数据库以各种日志文件1. (optional)可以创建备份目录,提前备份需要清理日志mkdir/log_bak_date2. 数据库各项日志文件路径sqlplus/[email protected]>showparameterdump_dest;NAMET...

opencv3_java 提取图像的RGB三原色分割图像Split Core.split_橘子派的博客-程序员信息网

提取图像的RGB三原色分割图像Split Core.splitpackage opencv_java_demo;import java.util.List;import org.opencv.core.*;import org.opencv.imgcodecs.*;public class Split { public static void main(String[

连接LDAP服务器用户,使用 LDAP 服务器进行连接_Reinhardt Jin的博客-程序员信息网

使用 LDAP 服务器进行连接如果使用的是 Windows(Windows Mobile 除外)或 Unix 平台,则可以指定一个中央 LDAP 服务器来跟踪企业中的所有数据库服务器。如果数据库服务器在 LDAP 服务器中自行注册,客户端便可以查询 LDAP 服务器,找到其要查找的数据库服务器,无论这些服务器是在WAN、LAN 上还是位于防火墙的后面。客户端不需要指定 IP 地址 (HOST=)。...

知识图谱入门视频(二)_追赶早晨的博客-程序员信息网_dbpedia怎么读

学习内容小象学院 b站 第二章第二部 典型知识库项目简介CYC(读音: 赛克)CYC: 1984年由Douglas Lenat开始创建,最初的目标是建立人类最大的常识知识库。该知识库主要由术语Terms和断言Assertions组成。Cyc的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。但过于形式化也导致知识库的扩展性和应用的灵活性不够。Cyc提供开放版本的OpenCycWordnetWordNet是最著名的词典(lexical)知识库,

Oracle发布Oracle数据库的官方Node.js驱动node-oracledb_weixin_34362875的博客-程序员信息网

node-oracledb是一个Oracle数据库的Node.js驱动,由Oracle官方基于Apache License V2.0开源协议发布和维护,其代码托管在GitHub上。Oracle官方声称能够支持高性能的Node.js应用。目前该驱动的最新版本是0.2预览版。目前,开发团队还在不断完善相关功能。\\Node-oracledb 0.2预览版已实现了所支持的基本和高级的Oracle特性,具...

Mybatis in 条件传参三种实现方法(直接$,List,[])_wh445306的博客-程序员信息网_mybatis中in传参数

第一种方法:in 条件为拼接好的字符串 如果直接传入拼接好的where in 条件, 比如('111','222','333'),则需要使用${idlist}传参,即绝对引用,而不能使用# 如果使用#传参会被mybatis当成字符串再添加一层''引号,导致错误,优点:简单方便,高效,缺点:不能防止SQL注入第二种方法:in 条件为List对象 in条件直接传入List对象,让mybatis再去拼接生成in条件,这个很麻烦,但是可以防止SQL注入第三种方法:in 条件为Strin...

随便推点

Android中CursorAdapter的使用详解_双刃剑客的博客-程序员信息网

转:http://blog.csdn.net/dmk877/article/details/44983491一、CursorAdapter介绍CursorAdapter这个类是继承于BaseAdapter的它是一个虚类它为Cursor和ListView连接提供了桥梁二、CursorAdapter详解1.CursorAd

soj1000a-b(高精度)_lzy333221的博客-程序员信息网

开始soj了第一题1000与众不同的居然是a-b

int,int32_t,int64_t_ガッシュ·ベル的博客-程序员信息网

转载自https://www.cnblogs.com/Free-Thinker/p/7058773.html区别这些是跨平台编程导致的; 一、数据类型特别是int相关的类型在不同位数机器的平台下长度不同。C99标准并不规定具体数据类型的长度大小,只规定级别。作下比较:16位平台数据类型字节char1个字节8位short2个字节16位int2个字节16位...

定制docker镜像的两种方式&Tomcat镜像制作_zhangwenjiang001的博客-程序员信息网

参考:https://www.cnblogs.com/hanyifeng/p/6116067.html两种方式:一种是修改已有的镜像然后commit,一种是利用Docker-file文件。第一种、commit方式对于已经运行的镜像,进入容器修改相关配置文件或脚本之后,执行:docker commit 容器名 镜像名:标签例如:docker commit test nginx:...

PHP利用Java+JasperReport生成PDF快递单_Lazy_Sleep的博客-程序员信息网

文章目录一、前言二、方案选择三、开发需要的四、.....一、前言系统主要使用PHP作为开发语言,有一个需求是实时生成快递面单并且以PDF格式保存。多种方案的实现都不理想,最后选择使用Java生成PDF,然后PHP再调用Java得到PDF。记录解决方案二、方案选择  一开始使用Html编写快递面单样式,运行时修改为实际数据后再转为PDF。但是写Html过于麻烦,生成的PDF与网页显示的有偏差...

推荐文章

热门文章

相关标签