赞
踩
论文:https://arxiv.org/pdf/2106.08087v5.pdf
链接:https://github.com/alibaba-research/ChineseBLUE
需要注意的是,中文生物医学文本在语言上与英文不同,具有其领域特性,这需要专门为中文设计的评估BioNLP基准测试。
在本研究中,我们专注于中文,旨在填补这一空白并开发第一个中文生物医学语言理解基准测试。
我们收集了真实世界的生物医学数据,并提出了第一个中文生物医学语言理解评估(CBLUE)基准:包括命名实体识别、信息抽取、临床诊断标准化、单句/句对分类等自然语言理解任务的集合,以及一个用于模型评估、比较和分析的在线平台。
为了在这些任务上建立评估标准,我们报告了当前11个预训练中文模型的实验结果,实验结果显示,最先进的神经模型的性能远远低于人类的上限。
使用当前最先进的人工智能(AI)技术开发的神经网络模型的性能,比人类的最佳表现要差很多。
NER(命名实体识别):
PI(释义识别):
QNLI(问题自然语言推论):
QA(问题解答):
cMedQA,其中包括问题及其答案。
IR(Information Retrieval):
IC(意图分类):
TC(文本分类):
Symptom Diagnosis症状诊断:
比如:
dev.json 是原始数据,dev.txt 是清洗后的数据。
disease(疾病):口腔溃疡、感冒、癫痫、鼻炎、三叉神经痛
symptom(症状):红肿、腰酸、神经痛、疼痛、出血
body(部位):嘴、胃肠道、关节、神经、血管
treatment(治疗方法):手术、中医、平肝泻火、降压药物、活血化瘀、消炎药
drug(药物):感冒灵颗粒、络活喜、洛汀新、阿莫西林
test(检查项):胃镜、超声、CT、抽血化验、血压
crowd(人群):小孩、儿童、女性、中老年、宝宝、婴儿
time(时间):昨天、三个月、上周三、今年5月份、三个月
physiology(生理机能):怀孕、血压、血糖、脂肪、消化
feature(特征):严重、局部、轻度、剧烈、部分
department(科室):消化科、神经外科、儿科、五官科、骨科
再比如:
比如 CMDD 意图识别:
中文医学命名实体识别数据集(CMeEE):
注释人员:
时间与费用:
中文医学信息提取数据集(CMeIE):
注释人员:
时间与费用:
临床诊断标准化数据集(CHIP-CDN):
注释人员:
时间与费用:
临床试验标准数据集(CHIP-CTC):
注释人员:
时间:
语义文本相似性数据集(CHIP-STS)
KUAKE-查询意图分类数据集(KUAKE-QIC)
KUAKE-查询标题相关性数据集(KUAKE-QTR)
KUAKE-查询查询相关性数据集(KUAKE-QQR)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。