海洋科研 - 国际顶刊文献统计平台

Audio-Visual Intelligence in Large Foundation 模型 (Model)s

Audio-Visual Intelligence in Large Foundation Models

作者
Authors: You Qin | Kai Liu | Shengqiong Wu | Kai Wang | Shi... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 184 📚 5

AlbumFill: Album-Guided Reasoning and Retrieval for Personalized Image Completion

作者
Authors: Yu-Ju Tsai | Brian Price | Qing Liu | Luis Figuero... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 109 📚 14

Posterior Augmented Flow Matching

作者
Authors: George Stoica | Sayak Paul | Matthew Wallingford |... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 157 📚 29

Generalizable Sparse-View 3D Reconstruction from Unconstrained Images

作者
Authors: Vinayak Gupta | Chih-Hao Lin | Shenlong Wang | Ana... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 175 📚 29

OmniRobotHome: A Multi-Camera Platform for Real-Time Multiadic Human-Robot Interaction

作者
Authors: Junyoung Lee | Sookwan Han | Jeonghwan Kim | Inhee... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 87 📚 23

HERMES++: Toward a Unified Driving World 模型 (Model) for 3D Scene Understanding and Generation

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

作者
Authors: Xin Zhou | Dingkang Liang | Xiwu Chen | Feiyang Ta... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 164 📚 13

Three-Step Nav: A Hierarchical Global-Local Planner for Zero-Shot Vision-and-Language Navigation

作者
Authors: Wanrong Zheng | Yunhao Ge | Laurent Itti 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 152 📚 15

强力深假探测:通过校准的补充组合减缓空间注意力漂移

Robust Deepfake Detection: Mitigating Spatial Attention Drift via Calibrated Complementary Ensembles

作者
Authors: Minh-Khoa Le-Phan | Minh-Hoang Le | Trong-Le Do | ... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 173 📚 28

世界R1:加强文本到视频生成的三维限制

World-R1: Reinforcing 3D Constraints for Text-to-Video Generation

作者
Authors: Weijie Wang | Xiaoxuan He | Youping Gu | Yifan Yan... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 81 📚 29

互通:对话互通的多式公司

Inter-Stance: A Dyadic Multimodal Corpus for Conversational Stance Analysis

作者
Authors: Xiang Zhang | Xiaotian Li | Taoyue Wang | Nan Bi |... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 77 📚 29

在 Omni 模型中打开上下文

Context Unrolling in Omni Models

作者
Authors: Ceyuan Yang | Zhijie Lin | Yang Zhao | Fei Xiao | ... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 164 📚 22

无眼之所见:4D 从可穿戴的IMU中了解人与场景

Seeing Without Eyes: 4D Human-Scene Understanding from Wearable IMUs

作者
Authors: Hao-Yu Hsu | Tianhang Cheng | Jing Wen | Alexander... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 120 📚 27

见快见慢:学习视频中的时间流

Seeing Fast and Slow: Learning the Flow of Time in Videos

作者
Authors: Yen-Siang Wu | Rundong Luo | Jingsen Zhu | Tao Tu ... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 167 📚 19

DeVI:基于物理的 Dexterous 人与对象通过合成视频仿真相互作用

DeVI: Physics-based Dexterous Human-Object Interaction via Synthetic Video Imitation

作者
Authors: Hyeonwoo Kim | Jeonghwan Kim | Kyungwon Cho | Hanb... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 169 📚 15

Tstars-Tryon 1.0: 不同时尚项目的强健与现实虚拟尝试

Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items

作者
Authors: Mengting Chen | Zhengrui Chen | Yongchao Du | Zuan... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 187 📚 24

MUA:移动超详细Animatable Avatars

MUA: Mobile Ultra-detailed Animatable Avatars

作者
Authors: Heming Zhu | Guoxing Sun | Marc Habermann 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 71 📚 16

重用自递式布局生成的三维基因模型

Repurposing 3D Generative Model for Autoregressive Layout Generation

作者
Authors: Haoran Feng | Yifan Niu | Zehuan Huang | Yang-Tian... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 61 📚 13

TokenLight: 使用属性托肯进行图像中的精密照明控制

TokenLight: Precise Lighting Control in Images using Attribute Tokens

作者
Authors: Sumit Chaturvedi | Yannick Hold-Geoffroy | Mengwei... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 154 📚 20

LeapAlign:通过构建双相轨迹,在任何一代人的步骤下进行后培训的流相匹配模式

LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step Trajectori...

作者
Authors: Zhanhao Liang | Tao Yang | Jie Wu | Chengjian Feng... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 175 📚 14

事件的双向跨模式提示-对称性立体

Bidirectional Cross-Modal Prompting for Event-Frame Asymmetric Stereo

作者
Authors: Ninghui Xu | Fabio Tosi | Lihui Wang | Jiawei Han ... 期刊
Journal: arXiv 年份
Year: 2026 分类
Category: 计算机视觉
Computer Vision

👁 99 📚 27

📚 文献库Literature Library

📚 文献库
Literature Library