搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
凡人多烦事01
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
鸿蒙应用开发 闹钟实现_鸿蒙开发实现倒计时
2
yum安装python3_centos 安装python3详细指南
3
CSS 详解grid布局(网格布局)与应用
4
吴恩达机器学习-可选实验室:简单神经网络(Simple Neural Network)
5
Android N Audio: Audio Track play_audio_port_type_t
6
AI帮忙做论文笔记——高端Prompt技巧——chatGPT时代背景下文献阅读新范式_阅读论文的prompt
7
平时多看看---前端中小厂一二线城市薪资水平报告_中厂初级前端月薪多少
8
H3C-Cloud Lab实验-静态路由配置实验_h3c cloud lab
9
php添加图片水印类,PHP图片水印类的封装
10
ft232 mac usb串口驱动_【电路“芯”说】聊聊你知道的串口
当前位置:
article
> 正文
Spider数据集arxiv1809.08887论文研读
作者:凡人多烦事01 | 2024-04-02 00:19:21
赞
踩
spider数据集
1. Introduction
过去一些优秀的模型例如seq2seq架构已经能够实现80%以上的匹配精确度在SQL查询上,但是这些工作实际上是在做语义匹配而非语义解析。现有的语义解析数据集存在两个问题,一个是数据集规模太小,无法训练一个更加现代化的模型,同时单一数据库同时用于训练和测试当中,那任务难度肯定简单很多;二是逻辑形式的SQL标签规模很小,并且每个program中都多多少少存在一些在数据集规模变大时查询有误的问题。
有人测试了尝试分开训练集和测试集上的数据库以后,发现模型无法推广到没看到过的数据库中,也就是泛化能力较差,另外数据集类似WikiSQL,SQL查询难度过于简单,无法很好的测试模型在复杂问题上的表现,因此亟需一个包含大量复杂程序和多表数据库的SP数据集。
创建此类的SP数据集有以下难度:在线平台上很难找到那么多的数据库同时有很多表;另外标注的人也必须要理解复杂数据库的模式从而创建出一系列的查询问题并且包含了所有SQL的查询类型。并且还需要对问题和SQL进行审查和质量检查,这些都需要非常充足的数据库知识。
Spider的好处在于可以在SQL查询上实现训练集和测试集在database上的区分,克服了之前数据集的两个缺点。并且定义了一个新的任务模式,模型不仅需要推广到新的程式,也就是查询组合方式,同时还需要推广到新的数据库。测试发现目前最先进的模型仅实现了12.4%的精确匹配精度。表明提升空间还很大。
2. Related Work and Existing Datasets
具有不同查询的语义解析数据集已经有很多了,但是都是针对于特定的domain,并且
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/凡人多烦事01/article/detail/350508
推荐阅读
article
PyTorch
学习笔记(八)
--------------
多
模态
融合
_
pytorch
多
模态
融合
...
多
模态
指的是由不同信息源提供的
多
种信息表示方式。这些信息表示方式可以是文本、图像、声音、视频等。
多
模态
信息的处理是许
多
人...
赞
踩
article
Linux端部署Stable Diffusion报错解决_
import
error:
cannot
i...
实际部署stable diffusion中遇到如下bug,主要是在运行启动脚本的时候。_
import
error: can...
赞
踩
article
自然语言
处理
综论 第二
版
中文_如何
处理
分子生物学
文章
的
图
版
(第二
版
)III. 蛋白
荧光
与GUS染色...
3.1调整GFP
图
版
明暗和对比度
的
原则:在两种背景下比较GFP
荧光
强度时,必须拼合一个整体,一起调整图10中,在使用GF...
赞
踩
article
Neo4j
/
ONgDB
图
数据库
快速处理
Excel
文件_
apoc
-3.4.0.10-all...
使用过
Neo4j
/
ONgDB
图
数据库
的朋友应该对 CSV 文件的处理很熟悉,但是对于
Excel
文件的处理可能并不...
赞
踩
article
模型
部署
|
ResNet50
基于
TensorRT
FP16
生成Engnie文件的C++工程_resne...
ResNet50
基于
TensorRT
FP16
生成Engnie文件的C++工程,ubuntu运行,可自行修改为win下使...
赞
踩
article
自然语言
处理
入门——
文本
预
处理
_
文本
的预
处理
...
自然语言
处理
入门内容大纲:
文本
预
处理
经典序列模型RNN及其变体Transformer迁移学习
文本
预
处理
认识
文本
预
处理
作用...
赞
踩
article
自然语言
处理
之文本预
处理
...
文本预
处理
_文本预
处理
文本预
处理
1. 引言 现在我们将学习文本预
处理
。通常情况下,语言数据是带...
赞
踩
article
ECNU
自然语言
处理作业2:
文本处理
_
nltk
中文
分词
...
1. 利用
nltk
库进行文本切分、标准化(去除标点、大小写转换、去除停用词)、词干提取、词形还原、词频统计2. 基于
中文
...
赞
踩
article
Elasticsearch
从
0
到
1保姆级教学附带代码(适合小白白们学习)
_
elasticsearch
...
注意:执行以上搜索时,会自动对关键字进行分词,例如,关键是“套装”时,“散装”也会出现在结果中,因为会对“套装”进行分词...
赞
踩
article
android
想用
adb
查看
数据库
被告知
inaccessible
or
not
found
怎么办_...
通常,我们在进行
数据库
操作的时候,都想要查看
数据库
结果是否正确,这时候我们会用到
adb
。首先我们将
adb
加入环境变量vi...
赞
踩
article
【文本
分类
】多
意图
分类
评估
指标
_
意图
识别
评价
指标
...
nlp文本
分类
多
意图
分类
中常见的
评估
指标
_
意图
识别
评价
指标
意图
识别
评价
指标
...
赞
踩
article
Py
torch
模型
部署
开发板
所遇到的坑
....._
torch
模型
部署
到
开发板
...
工作原因,需要将py
torch
模型
部署
到rk3399。现一步步记录下这些bug哈(晕)----希望最后能把这项目完成吧 ...
赞
踩
article
利用
GPT
来
学习
数据分析
_
数据分析
gpt
...
Pandas提供了多种方法来处理这些问题,例如,我们可以使用fillna函数来填充缺失值,使用dropna函数来删除包含...
赞
踩
article
Stable
Diffusion
模型下载:
Animagine
XL(漫画、二次元)_animagi...
Animagine
XL 3.1是
Animagine
XL V3 系列的更新,增强了之前的版本
Animagine
X...
赞
踩
article
iOS OSS
t
a
t
us 报错信息_
a
required
en
t
i
t
lemen
t
isn'
t
pre...
CF_ENUM(OSS
t
a
t
us){ errSecSuccess = 0, /* No error. */...
赞
踩
article
基本概念
:什么
是
ChatGPT
和
AIGC
...
1.背景介绍1. 背景介绍自2012年的AlphaGo胜利以来,人工智能(AI)技术的进步速度逐年加快,尤其
是
自然语言处...
赞
踩
article
多
模态
多标签
情感
分析_
multi
-
label
情感
分析...
Multi-modal Multi-
label
Emotion Detection with Modality and ...
赞
踩
article
thinkphp5.1使用
Route
路由
_
tp5.1
route
...
一、开启
路由
thinkphp的
路由
一般默认都是开启的,如果没有开启,可以在config.php里添加如下配置:'url_...
赞
踩
article
手把手教学-本地
部署
minigpt
-
4
_本地
部署
gpt
4
...
minigpt
-
4
的本地
部署
_本地
部署
gpt
4
本地
部署
gpt
4
虽然最新版本的
minigpt
-
4
...
赞
踩
article
天池医疗AI大赛[第一季]
Rank8
解决方案
[附
TensorFlow
/
PyTorch
/
Caffe
实...
团队成员:北京邮电大学 模式识别实验室硕士研究生今年5月,参加了天池医疗AI大赛,这次比赛是第一次参加此类的比赛,经过接...
赞
踩
相关标签
pytorch
人工智能
多分类
python
linux
stable diffusion
自然语言处理综论 第二版 中文
neo4j
数据库
excel
ongdb
图数据库
量化部署
模型部署
模型压缩
模型加速
机器翻译模型
自然语言处理
机器学习
nlp
中文分词
elasticsearch
学习
大数据
java