2024-05-07

【技术科普】什么是自动框人像(Auto Framing)

功能简介

参加视频会议时,会议室中难免有参会者走动、加入或离开。若摄像头固定无法调整,难以保障全体参会成员都出现在视频画面中,影响视觉体验;而低效地手动调整摄像头,会增加操作负担。

AF手动控制.gif

自动框人像(Auto Framing)功能应运而生。使镜头能跟根据参会人员数量自动调整角度与放大倍数,输出包含会议室所有人且比例大小合适、布局合理的画面。

自动框人像(Auto Framing)如何实现?

自动框人像(Auto Framing)搭载了人体检测算法,基于算法识别出的人头数量,外扩合适的宽高比例,从而作为自动框选区域的范围。而当人数增加/减少,算法也将计算出新的框选区域,并自适应调整画面比例。可变焦镜头将继续基于该结果进行追踪。

AF二动图1.gif

如此循环往复,自动框人像(Auto Framing)在整场会议中实时保障着全体参会人员完整、比例恰当地出现在视频画面中。

AF二动图2.gif

自动框人像(Auto Framing)技术优势

自动框人像(Auto Framing)功能已经是一项在会议摄像头或者会议一体机上十分普及的技术。亿联在近些年不断突破技术阈值,迭代出其各方面的更佳体验。

规避漏检误检

亿联的人体检测算法能够调整躯干置信度 (对头部、颈部、 肩部、 胸部、 腰部等检测结果准确性的度量),当算法检测到躯干置信度较低时,会进一步进行物体检测以排除误检的躯干,规避了漏检、误检的风险。亿联实验团队建立包含数百种误检、漏检模型库,涵盖多种人物穿着、姿态,干扰物品、环境等。亿联各设备的平均识别准确度高达约96%。

未标sasdad题1.png

保障平滑性

亿联的算法采用复杂的数学函数保证移动的平滑性。当人数变化时,能保证在1秒内框选合适的画面,并实时跟踪移动。

AF三动图.gif

应对极端场景

为不断突破算法性能的上限,算法所采用的策略能够使其在不增加运算耗时的基础上提升运算性能,使自动框人像(Auto Framing)更加自如地应对各类极端场景。当会议室内人数 >=30人、在长时间的会议通话中持续开启自动框人像(Auto Framing)等情况下,防抖性能保持在2.8毫秒以内,保障了极端场景下画面的流畅不卡顿。

自动框人像(Auto Framing)如何发挥更佳水准?

由于算法基于人像识别,身为参会者的我们,可以通过排除会议室中的干扰因素,来使算法发挥更佳水准。

  • 使用功能前需进行镜头校准,确保定焦镜头近处无物体遮挡;在移动摄像机后需要重新校准。

  • 避免会议室中出现玻璃/白板中的人像倒影、假人、卡通人物等。

  • 避免参会者处于高曝光区域,导致漏检。


分類


返回