Image processing Books, bestsellers and new releases

15 in stock

£80.99

Springer Computer Vision ECCV 2024

15 in stock

Book SynopsisHowToCaption: Prompting LLMs to Transform Video Annotations at Scale.- LabelDistill: Label-guided Cross-modal Knowledge Distillation for Camera-based 3D Object Detection.- Beyond the Data Imbalance: Employing the Heterogeneous Datasets for Vehicle Maneuver Prediction.- On Pretraining Data Diversity for Self-Supervised Learning.- Look Around and Learn: Self-Training Object Detection by Exploration.- Bayesian Self-Training for Semi-Supervised 3D Segmentation.- Motion and Structure from Event-based Normal Flow.- ParCo: Part-Coordinating Text-to-Motion Synthesis.- Learning to Complement and to Defer to Multiple Users.- Tiny Models are the Computational Saver for Large Models.- DragVideo: Interactive Drag-style Video Editing.- Multi-Sentence Grounding for Long-term Instructional Video.- Do Generalised Classifiers really work on Human Drawn Sketches?.- KMTalk: Speech-Driven 3D Facial Animation with Key Motion Embedding.- Head360: Learning a Parametric 3D Full-Head for Free-View Synthesis in 360.- MotionDirector: Motion Customization of Text-to-Video Diffusion Models.- Text2LiDAR: Text-guided LiDAR Point Clouds Generation via Equirectangular Transformer.- Enhanced Motion Forecasting with Visual Relation Reasoning.- Rate-Distortion-Cognition Controllable Versatile Neural Image Compression.- Temporal As a Plugin: Unsupervised Video Denoising with Pre-Trained Image Denoisers.- LiDAR-based All-weather 3D Object Detection via Prompting and Distilling 4D Radar.- MM-SafetyBench: A Benchmark for Safety Evaluation of Multimodal Large Language Models.- Post-training Quantization with Progressive Calibration and Activation Relaxing for Text-to-Image Diffusion Models.- Scene Coordinate Reconstruction: Posing of Image Collections via Incremental Learning of a Relocalizer.- Diffusion Models are Geometry Critics: Single Image 3D Editing Using Pre-Trained Diffusion Priors.- Weakly Supervised Co-training with Swapping Assignments for Semantic Segmentation.- StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion.

Read more less

15 in stock

Book SynopsisWalker: Self-supervised Multiple Object Tracking by Walking on Temporal Object Appearance Graphs.- Spatio-Temporal Proximity-Aware Dual-Path Model for Panoramic Activity Recognition.- DiffiT: Diffusion Vision Transformers for Image Generation.- WebRPG: Automatic Web Rendering Parameters Generation for Visual Presentation.- GPSFormer: A Global Perception and Local Structure Fitting-based Transformer for Point Cloud Understanding.- FreeMotion: A Unified Framework for Number-free Text-to-Motion Synthesis.- FSD-BEV: Foreground Self-Distillation for Multi-view 3D Object Detection.- SceneGraphLoc: Cross-Modal Coarse Visual Localization on 3D Scene Graphs.- ScanReason: Empowering 3D Visual Grounding with Reasoning Capabilities.- MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?.- See and Think: Embodied Agent in Virtual Environment.- PISR: Polarimetric Neural Implicit Surface Reconstruction for Textureless and Specular Objects.- Bridging the Gap Between Human Motion and Action Semantics via Kinematics Phrases.- VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding.- Masked Angle-Aware Autoencoder for Remote Sensing Images.- Infinite-ID: Identity-preserved Personalization via ID-semantics Decoupling Paradigm.- MultiGen: Zero-shot Image Generation from Multi-modal Prompts.- GazeXplain: Learning to Predict Natural Language Explanations of Visual Scanpaths.- Learning Chain of Counterfactual Thought for Bias-Robust Vision-Language Reasoning.- SegGen: Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis.- Sync from the Sea: Retrieving Alignable Videos from Large-Scale Datasets.- FinePseudo: Improving Pseudo-Labelling through Temporal-Alignablity for Semi-Supervised Fine-Grained Action Recognition.- Elegantly Written: Disentangling Writer and Character Styles for Enhancing Online Chinese Handwriting.- UniCode : Learning a Unified Codebook for Multimodal Large Language Models.- When Do We Not Need Larger Vision Models?.- GVGEN: Text-to-3D Generation with Volumetric Representation.- Bidirectional Stereo Image Compression with Cross-Dimensional Entropy Model.

Read more less

15 in stock

£66.49

Springer Computer Vision ECCV 2024

15 in stock

Book SynopsisCoLeaF: A Contrastive-Collaborative Learning Framework for Weakly Supervised Audio-Visual Video Parsing.- Noise-assisted Prompt Learning for Image Forgery Detection and Localization.- Data Collection-free Masked Video Modeling.- Protecting NeRFs' Copyright via Plug-And-Play Watermarking Base Model.- Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization.- AnyControl: Create Your Artwork with Versatile Control on Text-to-Image Generation.- SEED: A Simple and Effective 3D DETR in Point Clouds.- AEDNet: Adaptive Embedding and Multiview-Aware Disentanglement for Point Cloud Completion.- Synergy of Sight and Semantics: Visual Intention Understanding with CLIP.- Intrinsic Single-Image HDR Reconstruction.- T-MAE: Temporal Masked Autoencoders for Point Cloud Representation Learning.- Pathology-knowledge Enhanced Multi-instance Prompt Learning for Few-shot Whole Slide Image Classification.- Towards Natural Language-Guided Drones: GeoText-1652 Benchmark with Spatial Relation Matching.- BEAF: Observing BEfore-AFter Changes to Evaluate Hallucination in Vision-language Models.- Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene.- DATENeRF: Depth-Aware Text-based Editing of NeRFs.- XPSR: Cross-modal Priors for Diffusion-based Image Super-Resolution.- ABC Easy as 123: A Blind Counter for Exemplar-Free Multi-Class Class-agnostic Counting.- Category Adaptation Meets Projected Distillation in Generalized Continual Category Discovery.- LaRa: Efficient Large-Baseline Radiance Fields.- Bi-TTA: Bidirectional Test-Time Adapter for Remote Physiological Measurement.- MAGR: Manifold-Aligned Graph Regularization for Continual Action Quality Assessment.- Grounding Language Models for Visual Entity Recognition.- ELSE: Efficient Deep Neural Network Inference through Line-based Sparsity Exploration.- DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation.- DC-Solver: Improving Predictor-Corrector Diffusion Sampler via Dynamic Compensation.- TRAM: Global Trajectory and Motion of 3D Humans from in-the-wild Videos.

Read more less

15 in stock

£71.99

428 products

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024

Springer Computer Vision ECCV 2024