题目:《学习’ O ‘更有助于学习:处理Class - Incremental NER的未标记实体问题》
代码地址:https://github.com/rtmaww/O_CILNER
总体概述
在这项工作中,作者对"未标记实体问题"进行了实证研究,发现它导致了" O “和实体之间的严重混淆,降低了旧类的类区分度,并降低了模型学习新类的能力。为了解决未标注实体问题,作者提出了一种新颖的表示学习方法来学习实体类和” O “的判别性表示。具体来说,作者提出了一种实体感知的对比学习方法,自适应地检测’ O ‘中的实体簇。此外,为了更好地学习旧类,作者提出了两种有效的基于距离的重标记策略。我们为类别增量NER引入了一个更加真实和具有挑战性的基准测试集,所提出的方法在基准测试集上取得了高达10.62 %的提升
主要方法
使用Supcon Loss(一种对比损失的变体)来学习面向实体的特征空间。对比损失通常用于通过在特征空间中将相似的实体拉近、不同的实体推远来学习表示;非线性映射和阈值计算:实体被映射到一个非线性的特征空间,在这个空间中,计算一个新的实体阈值用于选择锚点(参考点)和正样本(相似点)。通过这样的方法来学习实体类和“O”类以判别同一实体类型内的变化中区分不同的实体