SFT的问题:标注者和LLM的知识不一致

识别幻象:

  1. 对比学习【加入候选】会变差;

多模态的:

指令微调的问题;

让 LLM感知到自己的知识边界 ;