Skip to content

CVPR2026 论文整理

关键词:object detection, remote sensing


object-detection

1. Portable Active Learning for Object Detection

  • 作者: Rashi Sharma、Justin Timothy C. Bersamin、Karthikk Subramanian
  • 推荐度: 📖可浏览
  • 推荐理由: 主动学习降低标注成本

主动学习选样方法。设计检测器无关的样本选择策略,仅基于检测器推理输出的边界框和置信度挑选高信息量样本,无需修改检测器结构或训练流程。


2. Thermal-Det: Language-Guided Cross-Modal Distillation for Open-Vocabulary Thermal Object Detection

  • 作者: Yasiru Ranasinghe、Elim Schenck、Florence Yellin、Shuowen Hu
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放词汇检测,CVPR热点方向

开放词汇热红外检测方法。利用大语言模型生成合成热红外训练数据,通过跨模态蒸馏从RGB教师迁移开放词汇检测能力到热红外学生网络,无需热红外人工标注。


3. CrossVL: Complexity-Aware Feature Routing and Paired Curriculum for Cross-View Vision-Language Detection

  • 作者: Zhipeng Liu、Chunbo Luo
  • 推荐度: 📖可浏览
  • 推荐理由: 跨视角视觉语言检测

跨视角视觉语言检测方法。解决地面与航拍视角间尺度、空间布局差异对VLM检测性能的影响,提出复杂度感知特征路由和配对课程学习。


4. Physical Adversarial Clothing Evades Visible-Thermal Detectors via Non-Overlapping RGB-T Pattern

  • 作者: Xiaopei Zhu、Guanning Zeng、Zhanhao Hu、Jun Zhu
  • 推荐度: 📖可浏览
  • 推荐理由: 物理对抗攻击鲁棒性

可见光-热红外双模对抗攻击方法。设计非重叠RGB-T图案的对抗服装,通过离散-连续联合优化同时欺骗可见光和热红外检测器。


5. Bridge: Basis-Driven Causal Inference Marries VFMs for Domain Generalization

  • 作者: Mingbo Hong、Feng Liu、Caroline Gevaert、George Vosselman
  • 推荐度: 📖可浏览
  • 推荐理由: 域泛化检测方法

域泛化检测方法。引入因果推断前门调整,通过低秩基学习阻断混淆因子虚假相关,可集成DINOv2/SAM等视觉基础模型。


6. Tri-Modal Fusion Transformers for UAV-based Object Detection

  • 作者: Craig Iaboni、Pramod Abichandani
  • 推荐度: 📖可浏览
  • 推荐理由: UAV多模态融合检测

面向无人机平台的三模态融合检测方法。融合RGB、热红外和事件相机三种模态,利用Transformer编码多模态特征应对光照变化和运动模糊。


7. Parameter-Efficient Semantic Augmentation for Enhancing Open-Vocabulary Object Detection

  • 作者: Weihao Cao、Runqi Wang、Xiaoyue Duan、Jinchao Zhang
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放词汇检测,CVPR热点方向

开放词汇检测参数高效语义增强方法。在不显著增加参数量的前提下,通过语义增强策略提升检测器对未见类别的泛化能力。


8. Visual Prototype Conditioned Focal Region Generation for UAV-Based Object Detection

  • 作者: Wenhao Li、Zimeng Wu、Yu Wu、Zehua Fu
  • 推荐度: 📖可浏览
  • 推荐理由: UAV数据增强方法

无人机目标检测方法。利用布局到图像生成范式,以视觉原型为条件生成聚焦区域的高质量训练数据,缓解动态场景标注数据稀缺的问题。


9. PET-DINO: Unifying Visual Cues into Grounding DINO with Prompt-Enriched Training

  • 作者: Weifu Fu、Jinyang Li、Bin-Bin Gao、Jialin Li
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放集检测改进

开放集目标检测方法。在Grounding DINO基础上引入提示增强训练,统一视觉线索与文本表示的对齐,解决复杂视觉概念匹配困难。


10. Detecting Unknown Objects via Energy-based Separation for Open World Object Detection

  • 作者: Jun-Woo Heo、Keonhee Park、Gyeong-Moon Park
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放世界检测,自主发现未知目标

开放世界目标检测方法。利用基于能量的未知目标分离策略,在增量学习新类的同时保持旧类精度,自动识别区分已知和未知目标。


11. A Closer Look at Cross-Domain Few-Shot Object Detection: Fine-Tuning Matters and Parallel Decoder Helps

  • 作者: Xuanlong Yu、Youyang Sha、Longfei Liu、Xi Shen
  • 推荐度: 📖可浏览
  • 推荐理由: 少样本跨域检测

跨域少样本目标检测方法。分析发现微调策略是关键,提出并行解码器辅助的混合集成方法,解决少样本优化不稳定和泛化受限问题。


12. Consistency Beyond Contrast: Enhancing Open-Vocabulary Object Detection Robustness via Contextual Consistency Learning

  • 作者: Bozhao Li、Shaocong Wu、Tong Shao、Senqiao Yang
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放词汇/开放世界检测

开放词汇检测方法。


13. CD-Buffer: Complementary Dual-Buffer Framework for Test-Time Adaptation in Adverse Weather Object Detection

  • 作者: Youngjun Song、Hyeongyu Kim、Dosik Hwang
  • 推荐度: 📖可浏览
  • 推荐理由: 域自适应检测

域自适应检测方法。


14. Heuristic-inspired Reasoning Priors Facilitate Data-Efficient Referring Object Detection

  • 作者: Xu Zhang、Zhe Chen、Jing Zhang、Dacheng Tao
  • 推荐度: 📖可浏览
  • 推荐理由: DETR改进

DETR检测方法。


15. NoOVD: Novel Category Discovery and Embedding for Open-Vocabulary Object Detection

  • 作者: Yupeng Zhang、Ruize Han、Zhiwei Chen、Wei Feng
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放词汇/开放世界检测

开放词汇检测方法。


16. DA-Mamba: Learning Domain-Aware State Space Model for Global-Local Alignment in Domain Adaptive Object Detection

  • 作者: Haochen Li、Rui Zhang、Hantao Yao、Xin Zhang
  • 推荐度: 📖可浏览
  • 推荐理由: 域自适应检测

域自适应检测方法。


17. EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection

  • 作者: Shuo Jiang、Gaojia Zhang、Min Tan、Yufei Yin
  • 推荐度: 📖可浏览
  • 推荐理由: 多模态融合检测

多模态检测方法。


18. PaQ-DETR: Learning Pattern and Quality-Aware Dynamic Queries for Object Detection

  • 作者: Zhengjian Kang、Jun Zhuang、Kangtong Mo、Qi Chen
  • 推荐度: 📖可浏览
  • 推荐理由: DETR改进

DETR检测方法。


19. Beyond Prompt Degradation: Prototype-guided Dual-pool Prompting for Incremental Object Detection

  • 作者: Yaoteng Zhang、Qing Zhou、Junyu Gao、Qi Wang
  • 推荐度: 📖可浏览
  • 推荐理由: 通用检测方法

通用检测方法。


20. Fourier Angle Alignment for Oriented Object Detection in Remote Sensing

  • 作者: Changyu Gu、Linwei Chen、Lin Gu、Ying Fu
  • 推荐度: 📖可浏览
  • 推荐理由: 多模态融合检测

多模态检测方法。


21. EW-DETR: Evolving World Object Detection via Incremental Low-Rank DEtection TRansformer

  • 作者: Munish Monga、Vishal Chudasama、Pankaj Wasnik、C.V. Jawahar
  • 推荐度: 📖可浏览
  • 推荐理由: DETR改进

DETR检测方法。


22. Balanced Hierarchical Contrastive Learning with Decoupled Queries for Fine-grained Object Detection in Remote Sensing Images

  • 作者: Jingzhou Chen、Dexin Chen、Fengchao Xiong、Yuntao Qian
  • 推荐度: 📖可浏览
  • 推荐理由: DETR改进

DETR检测方法。


23. Foundation Model Priors Enhance Object Focus in Feature Space for Source-Free Object Detection

  • 作者: Sairam VCR、Rishabh Lalla、Aveen Dayal、Tejal Kulkarni
  • 推荐度: 📖可浏览
  • 推荐理由: 域自适应检测

域自适应检测方法。


24. VGent: Visual Grounding via Modular Design for Disentangling Reasoning and Prediction

  • 作者: Weitai Kang、Jason Kuen、Mengwei Ren、Zijun Wei
  • 推荐度: 📖可浏览
  • 推荐理由: 视觉定位

视觉定位方法。


25. MRD: Multi-resolution Retrieval-Detection Fusion for High-Resolution Image Understanding

  • 作者: Fan Yang、Xingping Dong、Xin Yu、Wenhan Luo
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放词汇/开放世界检测

开放词汇检测方法。


26. GeoDiT: A Diffusion-based Vision-Language Model for Geospatial Understanding

  • 作者: Jiaqi Liu、Ronghao Fu、Haoran Liu、Lang Sun
  • 推荐度: 📖可浏览
  • 推荐理由: 地理空间视觉语言模型

地理空间视觉语言理解方法。利用扩散模型替代自回归架构,解决地理空间场景理解中序列化描述与并行空间结构不匹配的问题。


27. Med-CMR: A Fine-Grained Benchmark Integrating Visual Evidence and Clinical Logic for Medical Complex Multimodal Reasoning

  • 作者: Haozhen Gong、Xiaozhong Ji、Yuansen Liu、Wenbin Wu
  • 推荐度: 📖可浏览
  • 推荐理由: 小目标检测

小目标检测方法。


28. OVOD-Agent: A Markov-Bandit Framework for Proactive Visual Reasoning and Self-Evolving Detection

  • 作者: Chujie Wang、Jianyu Lu、Zhiyuan Luo、Xi Chen
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放词汇/开放世界检测

开放词汇检测方法。


29. 3M-TI: High-Quality Mobile Thermal Imaging via Calibration-free Multi-Camera Cross-Modal Diffusion

  • 作者: Minchong Chen、Xiaoyun Yuan、Junzhe Wan、Jianing Zhang
  • 推荐度: 📖可浏览
  • 推荐理由: 热红外/多模态检测

热红外检测方法。


30. Online Data Curation for Object Detection via Marginal Contributions to Dataset-level Average Precision

  • 作者: Zitang Sun、Masakazu Yoshimura、Junji Otsuka、Atsushi Irie
  • 推荐度: 📖可浏览
  • 推荐理由: 知识蒸馏

知识蒸馏方法。


31. PhaseWin Search Framework Enable Efficient Object-Level Interpretation

  • 作者: Zihan Gu、Ruoyu Chen、Junchi Zhang、Yue Hu
  • 推荐度: 📖可浏览
  • 推荐理由: 视觉定位

视觉定位方法。


32. Parameterized Prompt for Incremental Object Detection

  • 作者: Zijia An、Boyu Diao、Ruiqi Liu、Libo Huang
  • 推荐度: 📖可浏览
  • 推荐理由: 多模态融合检测

多模态检测方法。


33. Explaining Object Detectors via Collective Contribution of Pixels

  • 作者: Toshinori Yamauchi、Hiroshi Kera、Kazuhiko Kawamoto
  • 推荐度: 📖可浏览
  • 推荐理由: 通用检测方法

通用检测方法。


34. SDDF: Specificity-Driven Dynamic Focusing for Open-Vocabulary Camouflaged Object Detection

  • 作者: Jiaming Liang、Yifeng Zhan、Chunlin Liu、Weihua Zheng
  • 推荐度: ⭐值得深入
  • 推荐理由: 开放词汇/开放世界检测

开放词汇检测方法。


35. Remedying Target-Domain Astigmatism for Cross-Domain Few-Shot Object Detection

  • 作者: Yongwei Jiang、Yixiong Zou、Yuhua Li、Ruixuan Li
  • 推荐度: 📖可浏览
  • 推荐理由: 域自适应检测

域自适应检测方法。


36. Does YOLO Really Need to See Every Training Image in Every Epoch?

  • 作者: Xingxing Xie、Jiahua Dong、Junwei Han、Gong Cheng
  • 推荐度: 📖可浏览
  • 推荐理由: YOLO改进

YOLO检测方法。


37. Prompt-Free Universal Region Proposal Network

  • 作者: Qihong Tang、Changhan Liu、Shaofeng Zhang、Wenbin Li
  • 推荐度: 📖可浏览
  • 推荐理由: 域自适应检测

域自适应检测方法。


38. SpiralDiff: Spiral Diffusion with LoRA for RGB-to-RAW Conversion Across Cameras

  • 作者: Huanjing Yue、Shangbin Xie、Cong Cao、Qian Wu
  • 推荐度: 📖可浏览
  • 推荐理由: RGB-RAW转换增强检测

面向RAW图像的目标检测方法。利用扩散模型将RGB转为RAW,保留更丰富的场景信息用于下游检测任务。


39. YOLO-Master: MOE-Accelerated with Specialized Transformers for Enhanced Real-time Detection

  • 作者: Xu Lin、Jinlong Peng、Zhenye Gan、Jiawen Zhu
  • 推荐度: 📖可浏览
  • 推荐理由: YOLO改进

YOLO检测方法。


40. WeDetect: Fast Open-Vocabulary Object Detection as Retrieval

  • 作者: Shenghao Fu、Yukun Su、Fengyun Rao、Jing Lyu
  • 推荐度: ⭐值得深入
  • 推荐理由: 快速开放词汇检测

快速开放词汇检测方法。将开放词汇检测建模为检索任务,无需跨模态融合层,通过检索实现任意类别的快速检测。


41. TraceGen: World Modeling in 3D Trace Space Enables Learning from Cross-Embodiment Videos

  • 作者: Seungjae Lee、Yoonkyo Jung、Inkook Chun、Yao-Chih Lee
  • 推荐度: 📖可浏览
  • 推荐理由: 小目标检测

小目标检测方法。


42. Detect Anything via Next Point Prediction

  • 作者: Qing Jiang、Junan Huo、Xingyu Chen、Yuda Xiong
  • 推荐度: ⭐值得深入
  • 推荐理由: MLLM检测,下一点预测范式

基于多模态大语言模型的检测方法。将检测建模为下一点预测任务,通过量化坐标token和GRPO强化训练,实现与回归模型相当的零样本检测性能。CVPR 2026。


43. [SOS: Synthetic Object Segments Improve Detection, Segmentation, and

Grounding](https://arxiv.org/abs/2510.09110)

  • 作者: Weikai Huang、Jieyu Zhang、Taoyang Jia、Chenhao Zheng
  • 推荐度: 📖可浏览
  • 推荐理由: 合成数据增强检测

合成数据增强方法。通过目标中心合成策略将高质量合成物体片段粘贴到新图像中,训练的模型在LVIS检测上超越更大规模真实数据集。


44. Task-Aware Image Signal Processor for Advanced Visual Perception

  • 作者: Kai Chen、Jin Xiao、Leheng Zhang、Kexuan Shi
  • 推荐度: 📖可浏览
  • 推荐理由: 面向检测的RAW-ISP优化

面向视觉任务的RAW图像信号处理器。设计紧凑的RAW到RGB框架,通过多尺度调制算子重塑图像统计特征,提升RAW域检测和分割的准确性。


remote-sensing

1. Fourier Angle Alignment for Oriented Object Detection in Remote Sensing

  • 作者: Changyu Gu、Linwei Chen、Lin Gu、Ying Fu
  • 推荐度: ⭐值得深入
  • 推荐理由: 旋转目标检测,CVPR 2026

遥感图像旋转目标检测方法。利用傅里叶旋转等变性质解决检测颈部的方向不一致和检测头的任务冲突问题,在DOTA-v1.0上达到78.72% mAP。


2. Balanced Hierarchical Contrastive Learning with Decoupled Queries for Fine-grained Object Detection in Remote Sensing Images

  • 作者: Jingzhou Chen、Dexin Chen、Fengchao Xiong、Yuntao Qian
  • 推荐度: 📖可浏览
  • 推荐理由: 遥感细粒度检测

遥感图像细粒度目标检测方法。利用层次标签结构设计平衡对比学习和解耦检测查询,区分粗粒度到细粒度的多个类别层级。


3. Does YOLO Really Need to See Every Training Image in Every Epoch?

  • 作者: Xingxing Xie、Jiahua Dong、Junwei Han、Gong Cheng
  • 推荐度: 📖可浏览
  • 推荐理由: YOLO训练效率优化

YOLO训练效率优化方法。提出反遗忘采样策略动态判断学习充分度,跳过冗余训练样本,在遥感数据集上也验证了有效性。


4. Prompt-Free Universal Region Proposal Network

  • 作者: Qihong Tang、Changhan Liu、Shaofeng Zhang、Wenbin Li
  • 推荐度: 📖可浏览
  • 推荐理由: 通用区域提议网络

无需提示的通用区域提议网络。不依赖任何示例或文本提示直接定位潜在目标区域,在遥感图像等多样化场景中可直接应用。