Image processing Books, bestsellers and new releases

15 in stock

£80.99

Springer Computer Vision ECCV 2024

15 in stock

Book SynopsisHowToCaption: Prompting LLMs to Transform Video Annotations at Scale.- LabelDistill: Label-guided Cross-modal Knowledge Distillation for Camera-based 3D Object Detection.- Beyond the Data Imbalance: Employing the Heterogeneous Datasets for Vehicle Maneuver Prediction.- On Pretraining Data Diversity for Self-Supervised Learning.- Look Around and Learn: Self-Training Object Detection by Exploration.- Bayesian Self-Training for Semi-Supervised 3D Segmentation.- Motion and Structure from Event-based Normal Flow.- ParCo: Part-Coordinating Text-to-Motion Synthesis.- Learning to Complement and to Defer to Multiple Users.- Tiny Models are the Computational Saver for Large Models.- DragVideo: Interactive Drag-style Video Editing.- Multi-Sentence Grounding for Long-term Instructional Video.- Do Generalised Classifiers really work on Human Drawn Sketches?.- KMTalk: Speech-Driven 3D Facial Animation with Key Motion Embedding.- Head360: Learning a Parametric 3D Full-Head for Free-View Synthesis in 360.- MotionDirector: Motion Customization of Text-to-Video Diffusion Models.- Text2LiDAR: Text-guided LiDAR Point Clouds Generation via Equirectangular Transformer.- Enhanced Motion Forecasting with Visual Relation Reasoning.- Rate-Distortion-Cognition Controllable Versatile Neural Image Compression.- Temporal As a Plugin: Unsupervised Video Denoising with Pre-Trained Image Denoisers.- LiDAR-based All-weather 3D Object Detection via Prompting and Distilling 4D Radar.- MM-SafetyBench: A Benchmark for Safety Evaluation of Multimodal Large Language Models.- Post-training Quantization with Progressive Calibration and Activation Relaxing for Text-to-Image Diffusion Models.- Scene Coordinate Reconstruction: Posing of Image Collections via Incremental Learning of a Relocalizer.- Diffusion Models are Geometry Critics: Single Image 3D Editing Using Pre-Trained Diffusion Priors.- Weakly Supervised Co-training with Swapping Assignments for Semantic Segmentation.- StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion.

Read more less

15 in stock

Book SynopsisSmartControl: Enhancing ControlNet for Handling Rough Visual Conditions.- InterFusion: Text-Driven Generation of 3D Human-Object Interaction.- GLARE: Low Light Image Enhancement via Generative Latent Feature based Codebook Retrieval.- DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving.- Flow-Assisted Motion Learning Network for Weakly-Supervised Group Activity Recognition.- NeRF-XL: NeRF at Any Scale with Multi-GPU.- CoSIGN: Few-Step Guidance of ConSIstency Model to Solve General INverse Problems.- The First to Know: How Token Distributions Reveal Hidden Knowledge in Large Vision-Language Models?.- Compositional Substitutivity of Visual Reasoning for Visual Question Answering.- LightenDiffusion: Unsupervised Low-Light Image Enhancement with Latent-Retinex Diffusion Models.- DNI: Dilutional Noise Initialization for Diffusion Video Editing.- Two-Stage Video Shadow Detection via Temporal-Spatial Adaption.- Towards Physical World Backdoor Attacks against Skeleton Action Recognition.- SAM-guided Graph Cut for 3D Instance Segmentation.- Fully Authentic Visual Question Answering Dataset from Online Communities.- Active Generation for Image Classification.- FuseTeacher: Modality-fused Encoders are Strong Vision Supervisors.- Learning Local Pattern Modularization for Point Cloud Reconstruction from Unseen Classes.- Understanding Multi-compositional learning in Vision and Language models via Category Theory.- FedRA: A Random Allocation Strategy for Federated Tuning to Unleash the Power of Heterogeneous Clients.- Panel-Specific Degradation Representation for Raw Under-Display Camera Image Restoration.- Unlocking Textual and Visual Wisdom: Open-Vocabulary 3D Object Detection Enhanced by Comprehensive Guidance from Text and Image.- Diffusion-Guided Weakly Supervised Semantic Segmentation.- Weakly-Supervised Spatio-Temporal Video Grounding with Variational Cross-Modal Alignment.- When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset.- NVS-Adapter: Plug-and-Play Novel View Synthesis from a Single Image.- Segment and Recognize Anything at Any Granularity.

Read more less

15 in stock

£64.99

446 products

Springer Medical Image Computing and Computer Assisted Intervention MICCAI 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024