视觉
-
北大具身智能新成果:无需训练,听指令就能灵活走位
机器人靠的是主动与大模型构成的“专家团队”沟通完成指令分析、视觉感知、完成估计和决策测试等一系列视觉语言导航关键任务。
-
NeRF是什么?基于NeRF的三维重建是基于体素吗?
NeRF是一种生成模型,以图像和精确姿势为条件,生成给定图像的3D场景的新视图,这一过程通常被称为“新视图合成”。
-
涉水视觉:从关键技术到智能装备
涉水视觉是基于光与水的物质相互作用及跨介质传播机理,通过构建专用光学硬件与视觉算法的技术体系,解决涉水环境下视觉影像信号智能处理与分析,及先进智能涉水视觉装备研制相关的工程问题,探索机器视觉技术在涉水环境中应用的科学。
-
22个关于指令的专业术语解释,你学会了吗?
或者在咖啡店,听到“拿铁”、“美式”和“摩卡”,了解这些术语意味着你能更准确地点选你喜欢的咖啡,专业术语都如同一把钥匙,帮助我们更准确、更高效地实现我们的需求和愿望,今天分享22个使用AIGC时常用的22个专业术语。
-
UniOcc:将以视觉为中心的占用预测与几何和语义渲染大一统!
在这份技术报告中,本文提出了本文的解决方案,命名为UniOCC,用于在CVPR 2023 nuScenes Open Dataset Challenge中以视觉为中心的3D占用预测轨道。
-
激光雷达or视觉感知,谁能顶峰相见?
本次我们将着重说说感知层,因为感知作为智能驾驶的先决条件,其探测精度、广度与速度直接影响自动驾驶的行驶安全。
-
如何评价3D点云的前景?
本篇从3D视觉与3D图像的联系开始,继续深入探索3D视觉,了解其中的3D点云。
-
一文读懂自动驾驶多目视觉感知
在深度学习取得成功之前,通常的做法是根据目标的先验大小以及目标处于地平面上等假设来推断目标的深度(距离),或者采用运动信息进行深度估计(Motion Stereo)。
-
视觉转交互的一点体验
运用需求分析方法来拆解问题,为我的设计过程带来了革命性的改变。将复杂项目拆解为简单任务,使我能逐步解决问题,不被整体复杂性所困扰。这种系统化思考方式不仅提高了工作效率,还让我在设计中注重细节和完整性。
-
万字了解自动驾驶机器视觉四大基本任务
本文旨在直观系统地梳理深度学习各领域常见概念与基本思想,使读者对深度学习的重要概念与思想有一直观理解,做到“知其然,又知其所以然”,从而降低后续理解论文及实际应用的难度。
-
南洋理工大学最新视觉语言模型综述:预训练、迁移学习和知识蒸馏啥都有
本综述中,来自新加坡南洋理工大学的几位研究者全面研究了针对视觉识别任务的大型视觉语言模型,总结了最近的发展。
-
Nature发AIGC禁令!投稿中视觉内容使用AI的概不接收
ChatGPT爆火,一举推动AIGC强势“出圈”,各行各业都在争相探索其潜力。然而,在科学、艺术、出版等领域,对于是否允许在视觉内容中使用AIGC的争议从未停歇。
-
计算机视觉改变了比利简金杯的网球教练
国际网球联合会与微软合作,开发了一个基于人工智能的平台。通过该平台提供的比赛中的观察视角,帮助调整球员在世界上最大的年度团体女子体育比赛中的表现。
-
轨迹预测的视觉方法综述
基于物理的模型构成了动力学方程,为不同类别的智体建模人工设计的运动。
-
从技术层面聊聊双目自动驾驶系统为何难以普及?
双目视觉系统估计视差没那么容易,立体匹配是计算机视觉典型的难题,基线宽得到远目标测距准,而基线短得到近目标测距结果好,这里是存在折衷的。