赞
踩
input_ids是把词根据词表转换为数字,长度没有达到max_seq_len使用0填充。 input_mask 填充的为0,真实数据长度为1. segment_ids 这个是因为BERT有的是可以使用句子的下一个句子来一起训练,所以是来分别句子类别的,第一个句子全为0,第二个句子则为1. label_ids就是你需要的label这个自己设置。