分享好友 资讯首页 频道列表

从视频片段中推断楼层平面图 新AI研究令人大开眼界

2021-01-12 12:017440

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。

研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。

反对 0
举报 0
收藏 0
打赏 0
评论 0
OpenAI关停Sora:放弃视频业务,转向企业级市场为上市铺路
OpenAI关停Sora:放弃视频业务,转向企业级市场为上市铺路

0评论2026-03-252760

全球最大主权财富基金拟让AI参与投资决策
全球最大主权财富基金拟让AI参与投资决策

0评论2026-03-251799

吉利银河战舰700定名!AI全地形硬核SUV开启全场景高品质出行新篇
吉利银河战舰700定名!AI全地形硬核SUV开启全场景高品质出行新篇

0评论2026-03-251146

iOS 26.4系统更新来袭:AI歌单、失窃保护等多项升级齐登场
iOS 26.4系统更新来袭:AI歌单、失窃保护等多项升级齐登场

0评论2026-03-252633

OpenAI关停Sora:业务重心转移,为新模型腾算力与冲刺IPO铺路
OpenAI关停Sora:业务重心转移,为新模型腾算力与冲刺IPO铺路

0评论2026-03-251087

深圳推进AI服务器产业链发展 打造光伏海上风电储能绿电直连零碳标杆
深圳推进AI服务器产业链发展 打造光伏海上风电储能绿电直连零碳标杆

0评论2026-03-252128

中关村论坛“人工智能主题日”:多领域将发布开源成果与前沿科技新品
中关村论坛“人工智能主题日”:多领域将发布开源成果与前沿科技新品

0评论2026-03-25600

机器人自由出招对打,宇树王兴兴预计未来六个月左右落地
机器人自由出招对打,宇树王兴兴预计未来六个月左右落地

0评论2026-03-25769

AI热潮引爆存储芯片需求,废旧安卓机变身“电子金矿”成新宠
AI热潮引爆存储芯片需求,废旧安卓机变身“电子金矿”成新宠

0评论2026-03-251474

宇树科技王兴兴:未来半年机器人或实现自由出招对打 动作丰富度飙升
宇树科技王兴兴:未来半年机器人或实现自由出招对打 动作丰富度飙升

0评论2026-03-251769