• 首页
  • nlp
  • BERT
  • 知识图谱
  • Ray
  • 机器学习
  • 前沿科学文献快览
  • About
  • Contact

LLM

论文解读——BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models

介绍了BLIP-2这一多模态的模型; 其利用Q-Former来抽取图像特征,并结合BERT,对其图像特征到文本空间。

0
阅读
Joshua 发布于 1周前
著作权 © 2023 白丁集. 保留一切权利。 Theme : Mynote. 皖ICP备19019879号