1.目标:认知测绘

(1)个体认知画像: ⭐

微博用户数据 → Graph Pre-training 得到用户emb, emb→text 得到用户的画像(ChatGPT辅助标注)

(2)观点推断 和 群体画像

基于个体的text画像,和目标议题经过微调LLM得到观点;

prompt 微调 得到群体画像;

先尝试在引文网络上走通图上预训练 + E2T;

截屏2023-05-05 下午8.15.14.png

如何跨图预训练?因为我们希望在微博上训练出来的模型可以用到twitter上;

  1. 只用结构
  2. 不同特征空间 → 相同特征空间(如一个linear)
  3. 先把Graph转成文本,再在文本上做迁移;
  4. 跨域的mapping

一个比较关键的问题:

关联关系(也就是图的拓扑结构有多大用处???)即结构+LLM >> LLM.