SemEval-2022 Task 6 有意讽刺检测_semeval比赛 task6

作者：AllinToyou | 2024-04-05 23:21:40

踩

semeval比赛 task6

YNU-HPCC at SemEval-2022 Task 6: Transformer-based Model for Intended Sarcasm Detection in English and Arabic

本篇随便讲下论文，这是我们在SemEval-2022 Task6的相关工作，本篇论文在Task6榜单上取得了 12/43 (21/32), 11/22, and 3/16 (8/13) 的排名。

官方的排行榜

论文

Github

任务介绍

官方的主页：semeval2022-isarcasmeval

其实就是三个在英语、阿拉伯语数据集下的分类任务：

Task A：很简单的二分类任务，给定句子，判断是否具有讽刺意义
Task B：与A类似，不过是多标签分类任务，且只有英语数据
Task C：给定两个句子，一个是有讽刺的句子，一个是同义但无讽刺的转述，判断讽刺句子的位置。是个句子对分类任务。

模型介绍

没做多大的创新，正如主办方所言,
在这里插入图片描述

我们使用的和其他参赛者并无多大区别，都是BERT及其变种，预训练+Fine-tuning的两段式，差异主要在数据处理上。结构如下图所示，
在这里插入图片描述

在这里插入图片描述

主要难点及解决方案

难点：

数据高度不平衡，体现在Task B中，Task B的标签数据分布如下所示：
在这里插入图片描述

标签数量差异十分巨大，且除此之外还有大量的非讽刺标签存在。

解决方案：

当时考虑过独立训练每个标签，缺点是丧失了标签之间的关联性（虽然我也不知道他们之间的关联性是啥），相对来说在训练每个独立二分类器的时候，还是比较容易选取相对平衡的训练集。然而这个方案对于标签太少的（如understatement）依旧没啥办法。

也考虑过数据增强，然而数据增强可能会损失句子的讽刺意义，担心引入太多脏数据，所以没有采用。

最后效果比较好的，还是采用了Label-Power（就是一个分类器来输出多个标签）方案。训练数据选取上只用了一小部分非讽刺标签，避免模型过度关注非讽刺标签。另外就是在损失函数上使用了WBCE(带有权重的BCE)，来增大模型对数量少的标签的关注度。WBCE以及权重计算方法如下所示：
在这里插入图片描述