- 文献综述(或调研报告):
有许多工作集中在跟踪和预测未来的行为和考虑相互反应的人类的运动,包括了:采用深度神经网络对拥挤环境下行人群体间的社会行为进行建模、智能驾驶模型、概率图模型与将对抗学习与行为克隆或强化学习相结合的研究等等。
1、人群交互深层神经网络框架(CIDNN)
1)、核心理念
行人轨迹预测旨在基于行人的历史路径来预测行人将来的连续位置的坐标集,这是计算机视觉中的一项重要任务,由于行人的复杂性,这仍然是一个具有挑战性的问题。在实践中,为了使问题更易于处理,一些工作仅通过考虑与行人轨迹相关的一些因素来对任务进行建模,包括个人的决策过程,不同行人之间的互动和历史动作作为每个行人的统计数据。
人群交互深层神经网络框架(CIDNN),以顺序预测每个行人在两帧之间的坐标位移。该框架假设目标行人的运动取决于其运动信息(速度,加速度),其他行人运动信息,以及目标行人与所有其他行人之间的空间亲和力,其中空间亲和力衡量了行人的影响程度将行人休息到目标行人。
为了模拟每个行人的运动,该框架下采用了LSTM模型,其输入是行人在不同时刻的坐标序列。为了测量给定时刻每个行人与目标行人的空间亲和力,将行人的坐标输入到多层感知器中,并使用行人的坐标特征与目标的坐标特征之间的内积来测量空间亲和力。然后,将目标与所有行人之间的相互作用(包括自身)作为其空间亲和力和相应行人的运动特征之间的乘积,并将相互作用特征馈入另一个多层感知器中,以在下一帧中预测目标的坐标位移(图1)。
图1 人群交互深度神经网络(CIDNN)的体系结构
2)、应用背景
此框架不仅可以用于轨迹预测,也可以应用于其他应用,例如视频中的面部关键点检测和视频中的人体姿势估计(身体关键点检测)。基于外观的关键点检测通常很耗时。通过将此框架与关键帧中基于外观的关键点检测相结合,可以避免每帧的关键点检测,从而可以在不降低准确性的情况下提高效率。
3)、参考专利及文献
以上是文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。