分享好友 资讯首页 频道列表

从视频片段中推断楼层平面图 新AI研究令人大开眼界

2021-01-12 12:016480

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。

研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。

反对 0
举报 0
收藏 0
打赏 0
评论 0
2025美国社交广告:AI效率与社区信任双轨并行,分化格局渐显
2025美国社交广告:AI效率与社区信任双轨并行,分化格局渐显

0评论2025-11-081945

2025世界互联网大会乌镇峰会:12项精品案例共绘网络空间合作新蓝图
2025世界互联网大会乌镇峰会:12项精品案例共绘网络空间合作新蓝图

0评论2025-11-081693

2025世界互联网大会:阿里CEO吴泳铭畅谈AI发展三阶段 加大投入打造超级AI云
2025世界互联网大会:阿里CEO吴泳铭畅谈AI发展三阶段 加大投入打造超级AI云

0评论2025-11-081005

高德打车及顺风车全面接入“鹰眼守护” 17种场景为出行安全护航
高德打车及顺风车全面接入“鹰眼守护” 17种场景为出行安全护航

0评论2025-11-082017

AI六巨头同台论道:回溯四十年AI征程,共探泡沫与AGI未来走向
AI六巨头同台论道:回溯四十年AI征程,共探泡沫与AGI未来走向

0评论2025-11-081485

群核科技黄晓煌:AI新阶段聚焦空间智能,瞄准机器市场“掘金”
群核科技黄晓煌:AI新阶段聚焦空间智能,瞄准机器市场“掘金”

0评论2025-11-082086

AI掀起广告圈变革:可口可乐圣诞广告逆袭,创意人饭碗受冲击?
AI掀起广告圈变革:可口可乐圣诞广告逆袭,创意人饭碗受冲击?

0评论2025-11-08904

2025世界互联网大会:吴泳铭谈AI三阶段,阿里加大投入打造超级AI云促普惠
2025世界互联网大会:吴泳铭谈AI三阶段,阿里加大投入打造超级AI云促普惠

0评论2025-11-08805