分享好友 资讯首页 频道列表

从视频片段中推断楼层平面图 新AI研究令人大开眼界

2021-01-12 12:017850

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。

研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。

反对 0
举报 0
收藏 0
打赏 0
评论 0
两部门启动“模数共振”行动,京东AI采购管家打造政企采购领域产业样本
该行动提出深挖高价值细分场景,用行业特色知识打造专用模型或自主智能体,将通用能力转化为解决实际问题的落地应用。

0评论2026-05-082536

清理违规视频11000余条,4月「AI魔改」视频治理成果公布
清理违规视频11000余条,4月「AI魔改」视频治理成果公布

0评论2026-05-011194

GPT-5.5“哥布林”成谜?OpenAI公告揭秘模型行为“跑偏”真相
GPT-5.5“哥布林”成谜?OpenAI公告揭秘模型行为“跑偏”真相

0评论2026-05-01717

中国电信柯瑞文:构建智能云体系 推动Token经营赋能AI服务新未来
中国电信柯瑞文:构建智能云体系 推动Token经营赋能AI服务新未来

0评论2026-05-01973

中国电信柯瑞文:依托智能云体系 推进Token经营 赋能数智化转型
中国电信柯瑞文:依托智能云体系 推进Token经营 赋能数智化转型

0评论2026-05-012261

巨日禄宣布与火山引擎达成深度合作 AI短剧进入“工业化”时代
巨日禄宣布与火山引擎达成深度合作 AI短剧进入“工业化”时代

0评论2026-05-012214

OpenAI拟推GPT-5.5-Cyber网络安全模型,首批定向开放给专业防护人员
OpenAI拟推GPT-5.5-Cyber网络安全模型,首批定向开放给专业防护人员

0评论2026-05-012194

2.69万元起!宇树科技双臂人形机器人发布,多元场景适配能力拉满
2.69万元起!宇树科技双臂人形机器人发布,多元场景适配能力拉满

0评论2026-05-011806

钉钉发布 AI 录音硬件 DingTalk A1Pro:售价1299元,支持手机反向充电
钉钉发布 AI 录音硬件 DingTalk A1Pro:售价1299元,支持手机反向充电

0评论2026-05-012139

国云国芯国模协同发力 共筑智能云新生态 开启Token产业新征程
国云国芯国模协同发力 共筑智能云新生态 开启Token产业新征程

0评论2026-05-01579