SFT的问题:标注者和LLM的知识不一致
识别幻象:
对比学习【加入候选】会变差;
多模态的:
指令微调的问题;
让 LLM感知到自己的知识边界 ;