2KB项目,专业的源码交易网站 帮助 收藏 每日签到

谷歌发布自然问答数据集 Natural Questions

  • 时间:2019-01-26 21:57 编辑:2KB 来源:2KB.COM 阅读:503
  • 扫一扫,手机访问
  • 分享
摘要: Google 发布用于训练和评估开放领域(Open-domain)问答系统的大型语料库 Natural Questions(NQ)。该数据集包含了 30 万个自然产生的问题和对应的回答注释,每个回答都是人工从维基百科页面找到的答案。另外,Googl

Google 发布用于训练和评估开放领域(Open-domain)问答系统的大型语料库 Natural Questions(NQ)。该数据集包含了 30 万个自然产生的问题和对应的回答注释,每个回答都是人工从维基百科页面找到的答案。另外,Google 还举办了挑战活动,以 NQ 数据集训练的模型性能来生成挑战者的排行榜

开放式域名问答(QA)是自然语言理解(NLU)中的一项基准任务,旨在模仿人们如何查找信息,通过对问题的阅读和理解找到问题的答案。例如,用自然语言表达的问题(“为什么天是蓝色的?”),QA 系统应该能够阅读网页(比如这个维基百科页面 Diffuse sky radiation)并返回正确的答案,虽然答案有点复杂和冗长。

然而,目前并没有大量公开可用的自然产生问题(即寻求信息的人提出的问题)和可用于训练评估 QA 模型的答案。原因是汇集用于问答的高质量数据集,需要大量的实际问题来源以及寻找问题答案的大量人力。

而现在谷歌发布的自然问答数据集 Natural Questions 可以说是填补了这部分资料的空白。简单来说,就是 Google 收集自家搜寻引擎真实的问题查询,搭配维基百科的资料,为问答系统提供训练资料集。这个过程中,进行匿名查询的注释者需要阅读整个维基百科页面,来寻找答案并提供两种答案注释,包括涵盖所有资讯的长答案和简洁的短答案。


目前,该数据集收集了 30 万个自然产生的问题与答案,注释的品质精准度达 90%,另外,Natural Questions 还包括 1.6 万个范例,每个问题的答案由 5 个不同的注释者提供。Google表示,这种资料可以用来评估问答系统的性能。


2KB项目(www.2kb.com,源码交易平台),提供担保交易、源码交易、虚拟商品、在家创业、在线创业、任务交易、网站设计、软件设计、网络兼职、站长交易、域名交易、链接买卖、网站交易、广告买卖、站长培训、建站美工等服务

  • 全部评论(0)
资讯详情页最新发布上方横幅
最新发布的资讯信息
【计算机/互联网|】Nginx出现502错误(2020-01-20 21:02)
【计算机/互联网|】网站运营全智能软手V0.1版发布(2020-01-20 12:16)
【计算机/互联网|】淘宝这是怎么了?(2020-01-19 19:15)
【行业动态|】谷歌关闭小米智能摄像头,因为窃听器显示了陌生人家中的照片(2020-01-15 09:42)
【行业动态|】据报道谷歌新闻终止了数字杂志,退还主动订阅(2020-01-15 09:39)
【行业动态|】康佳将OLED电视带到美国与LG和索尼竞争(2020-01-15 09:38)
【行业动态|】2020年最佳AV接收机(2020-01-15 09:35)
【行业动态|】2020年最佳流媒体设备:Roku,Apple TV,Firebar,Chromecast等(2020-01-15 09:31)
【行业动态|】CES 2020预览:更多的流媒体服务和订阅即将到来(2020-01-08 21:41)
【行业动态|】从埃隆·马斯克到杰夫·贝佐斯,这30位人物定义了2010年代(2020-01-01 15:14)
联系我们

Q Q: 7090832

电话:400-0011-990

邮箱:7090832@qq.com

时间:9:00-23:00

联系客服
商家入住 服务咨询 投拆建议 联系客服
0577-67068160
手机版

扫一扫进手机版
返回顶部