长按识别二维码,一键预约TALK! 在大语言模型时代,对齐3D的物理世界和自然语言是实现通用具身智能十分重要的一步。本次讲座我们聚焦于3D视觉语言领域,介绍3D视觉语言的相关任务,以及我们的最新工作3D-VisTA是如何设计通用统一的视觉语言模型,用简洁的方式来解决这些任务的。 Talk大纲Talk·预习资料 论文链接: https://arxiv.org/pdf/2308.04352.pdf 论文链接: https://arxiv.org/pdf/2108.07258.pdf 项目代码: https://language3dscenes.github.io Talk·提问交流 |