Cs-Cv

VIRAL: Visual In-Context Reasoning via Analogy in Diffusion Transformers

Computer Vision 3 JAN, 2026

VIRAL: Visual In-Context Reasoning via Analogy in Diffusion Transformers

By Zhiwen Li

Spectral Evolution Search: Efficient Inference-Time Scaling for Reward-Aligned Image Generation

Machine Learning 3 JAN, 2026

Spectral Evolution Search: Efficient Inference-Time Scaling for Reward-Aligned Image Generation

By Jinyan Ye

WebSplatter: Enabling Cross-Device Efficient Gaussian Splatting in Web Browsers via WebGPU

Graphics 3 JAN, 2026

WebSplatter: Enabling Cross-Device Efficient Gaussian Splatting in Web Browsers via WebGPU

By Yudong Han

Hand3R: Online 4D Hand-Scene Reconstruction in the Wild

Artificial Intelligence 3 JAN, 2026

Hand3R: Online 4D Hand-Scene Reconstruction in the Wild

By Wendi Hu

BinaryDemoire: Moiré-Aware Binarization for Image Demoiréing

Computer Vision 3 JAN, 2026

BinaryDemoire: Moiré-Aware Binarization for Image Demoiréing

By Zheng Chen

LSGQuant: Layer-Sensitivity Guided Quantization for One-Step Diffusion Real-World Video Super-Resolution

Computer Vision 3 JAN, 2026

LSGQuant: Layer-Sensitivity Guided Quantization for One-Step Diffusion Real-World Video Super-Resolution

By Tianxing Wu

FSOD-VFM: Few-Shot Object Detection with Vision Foundation Models and Graph Diffusion

Computer Vision 3 JAN, 2026

FSOD-VFM: Few-Shot Object Detection with Vision Foundation Models and Graph Diffusion

By Chen-Bin Feng

Spiral RoPE: Rotate Your Rotary Positional Embeddings in the 2D Plane

Computer Vision 3 JAN, 2026

Spiral RoPE: Rotate Your Rotary Positional Embeddings in the 2D Plane

By Haoyu Liu

EventFlash: Towards Efficient MLLMs for Event-Based Vision

Computer Vision 3 JAN, 2026

EventFlash: Towards Efficient MLLMs for Event-Based Vision

By Shaoyu Liu

From Single Scan to Sequential Consistency: A New Paradigm for LIDAR Relocalization

Computer Vision 3 JAN, 2026

From Single Scan to Sequential Consistency: A New Paradigm for LIDAR Relocalization

By Minghang Zhu

InstaDrive: Instance-Aware Driving World Models for Realistic and Consistent Video Generation

Computer Vision 3 JAN, 2026

InstaDrive: Instance-Aware Driving World Models for Realistic and Consistent Video Generation

By Zhuoran Yang

LaVPR: Benchmarking Language and Vision for Place Recognition

Computer Vision 3 JAN, 2026

LaVPR: Benchmarking Language and Vision for Place Recognition

By Ofer Idan

PISA: Piecewise Sparse Attention Is Wiser for Efficient Diffusion Transformers

Computer Vision 3 JAN, 2026

PISA: Piecewise Sparse Attention Is Wiser for Efficient Diffusion Transformers

By Haopeng Li

CountZES: Counting via Zero-Shot Exemplar Selection

Computer Vision 3 JAN, 2026

CountZES: Counting via Zero-Shot Exemplar Selection

By Muhammad Ibraheem Siddiqui

DeepUrban: Interaction-Aware Trajectory Prediction and Planning for Automated Driving by Aerial Imagery

Computer Vision 3 JAN, 2026

DeepUrban: Interaction-Aware Trajectory Prediction and Planning for Automated Driving by Aerial Imagery

By Constantin Selzer

Model Optimization for Multi-Camera 3D Detection and Tracking

Computer Vision 3 JAN, 2026

Model Optimization for Multi-Camera 3D Detection and Tracking

By Ethan Anderson

MapDream: Task-Driven Map Learning for Vision-Language Navigation

Artificial Intelligence 3 JAN, 2026

MapDream: Task-Driven Map Learning for Vision-Language Navigation

By Guoxin Lian

Happy Young Women, Grumpy Old Men? Emotion-Driven Demographic Biases in Synthetic Face Generation

Artificial Intelligence 3 JAN, 2026

Happy Young Women, Grumpy Old Men? Emotion-Driven Demographic Biases in Synthetic Face Generation

By Mengting Wei

Towards Sustainable Universal Deepfake Detection with Frequency-Domain Masking

Computer Vision 3 JAN, 2026

Towards Sustainable Universal Deepfake Detection with Frequency-Domain Masking

By Ch

Alignment of Diffusion Models: Fundamentals, Challenges, and Future

Machine Learning 5 JAN, 2026

Alignment of Diffusion Models: Fundamentals, Challenges, and Future

By Buhua Liu

Driving on Registers

Artificial Intelligence 3 JAN, 2026

Driving on Registers

By Ellington Kirby

Comprehensive Machine Learning Benchmarking for Fringe Projection Profilometry with Photorealistic Synthetic Data

Eess Iv 3 JAN, 2026

Comprehensive Machine Learning Benchmarking for Fringe Projection Profilometry with Photorealistic Synthetic Data

By Anush Lakshman S

Rethinking Efficient Mixture-of-Experts for Remote Sensing Modality-Missing Classification

Computer Vision 3 JAN, 2026

Rethinking Efficient Mixture-of-Experts for Remote Sensing Modality-Missing Classification

By Qinghao Gao

VLS: Steering Pretrained Robot Policies via Vision-Language Models

Robotics 3 JAN, 2026

VLS: Steering Pretrained Robot Policies via Vision-Language Models

By Shuo Liu