2025.11.7组会
本周我系统学习了VLN,核心收获如下: 学习范式:模仿学习(IL)快速入门但性能有限,强化学习(RL)能超越专家但效率低,两者结合(IL+RL)成为主流。 预训练模型:通过自监督学习(如MLM、ITM)让模型掌握跨模态理解,典型模型有PREVA
记录 UAV / 具身智能 / VLN 的学习与实践。
🎓 南方科技大学(SUSTech)电子信息硕士在读,就读于国家卓越工程师学院(NGCE),研究方向:视觉语言导航 VLN(Vision-Language Navigation,室内/地面无人机)。
🔬 探索 RL 与 LLM,熟悉无人机系统与行业级无人机研制(含油电混动无人机)、ArduPilot/PX4 生态与无人机管控平台开发。
🤖 本科阶段在华南师范大学(SCNU)RoboMaster 战队 VANGUARD 任副队长 / 视觉组长,也参与智能车、机器人等竞赛实践。
📫 联系:codealan@qq.com | QQ: 2546379375 | GitHub | B站
本周我系统学习了VLN,核心收获如下: 学习范式:模仿学习(IL)快速入门但性能有限,强化学习(RL)能超越专家但效率低,两者结合(IL+RL)成为主流。 预训练模型:通过自监督学习(如MLM、ITM)让模型掌握跨模态理解,典型模型有PREVA
REVERIE数据集和DUET模型 现在都是还在前期的学习和探索阶段。 读这篇论文: REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments (CVPR 2020) REVERlE 发音 [ˈrevəri] DUET(Dual-scale Graph Transformer) REVERIE 是 REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments (CVPR 2020) 中引入的大规模远程

📘 Reference Information Title: AerialVLN: Vision-and-Language Navigation for UAVs Authors: Liu, Shubo; Zhang, Hongsheng; Qi, Yuankai; Wang, Peng; Zhang, Yanning; Wu, Qi Publication: (2023) Citekey: liuAerialVLNVisionandLanguageNavigation2023 DOI: 10.1109/ICCV51070.2023.01411 Links: Online | PDF 🧾 Metadata Start date: 2025-10-01 End date: …