本文提出的框架能够横跨2D灰度图、3D灰度图与RGB图进行统一训练,并得到一个统一的表征,而无需依赖于多种对不同模态的专门设计。另外,还将训练好的模型在以图搜图(可跨模态)的任务中进行了评测。
2025-09-05发布于论文随笔