文本Embedding技术#

学习资料#

benchmark#

论文#

基于Transformer架构#

训练技术#

1. 目标函数#

  • 对比损失(Contrastive Loss)
  • 三重损失(Triplet Loss)
  • 余弦相似度损失

2. 数据增强#

3. 训练技巧#

  • 层归一化策略
  • 温度系数调节
  • 输出维度

评估指标#

指标名称 说明 典型数据集
Spearman相关性 排名相关性 STS-B
Recall@K 检索召回率 MS-MARCO
聚类纯度 聚类效果评估 AG News