(1)个体认知画像: ⭐
微博用户数据 → Graph Pre-training 得到用户emb, emb→text 得到用户的画像(ChatGPT辅助标注)
(2)观点推断 和 群体画像
基于个体的text画像,和目标议题经过微调LLM得到观点;
prompt 微调 得到群体画像;
先尝试在引文网络上走通图上预训练 + E2T;
如何跨图预训练?因为我们希望在微博上训练出来的模型可以用到twitter上;
一个比较关键的问题:
关联关系(也就是图的拓扑结构有多大用处???)即结构+LLM >> LLM.