数字人动作生成系统(ICCV 2025)

字节跳动、阶跃星辰(大模型独角兽)联合发布业内最大的数字人视频运动生成数据集,包含16万+视频,共计1000万帧
功能:动作驱动角色立绘,实现高质量数字人视频生成
难点:虚拟角色立绘风格多样,形状复杂,画面场景一致性生成困难

语音驱动数字人生成系统(阿里巴巴联合/ICCV25)

功能:根据语音内容与韵律自动生成与之匹配的人体动作,使虚拟人或机器人在说话时表现出自然、协调的手势和表情,从而提升交流的真实感与表现力。
难点:语音-动作时序与语义对齐复杂,物理合理与自然流畅要求高,少样本下兼顾多样性与风格化的动作生成困难。


跌倒检测系统

功能:实时检测识别“人员跌到”行为,覆盖多场景、多视角,泛化性强
难点:场景多、视角多、干扰多,人体骨架姿态变化大、细粒行为难捕捉
应用:国家能源集团

工装检测系统

功能:低延迟、高吞吐地识别监控场景中工作人员的着装,及时发现着装不规范行为并预警,保护工作人员人身安全
难点:环境复杂、监控场景边缘畸变、人体部位划分困难且着装风格差异大
应用:国家能源集团

高空抛物监控检测系统

功能:准确的、实时的高空抛物检测和追踪
难点:目标尺度小、运动速度快、场景复杂、特征难提取等
祝贺:该高空抛物系统在“深圳湾超级总部基地”成功试点

离岗办公督察系统

功能:准确的、实时的识别岗位工作人员的动作,实现对岗位人员工作状况的监督,及时发现离岗及非正常动作行为并预警
难点:摄像头性能低、视频质量差、光照条件差、视角差、目标多、目标小

3D手势估计与重建(IEEE TPAMI 2023)

功能:无需标注数据即可从单目视频/图像中准确重建3D手部关节、形状和纹理,并保持视频中的动作连续性和纹理一致性。
难点:手势姿态复杂多变且常有遮挡,仅凭低质量单目视频实现高精度3D重建困难,同时需兼顾时序平滑与纹理一致性。

低照度行为识别-安全治理系统

功能:实现低照度场景复原与超分,提升画面辨识度与视觉效果。
难点:极低照度区域复原易生伪影,部分区域复原后易过曝。
应用:中华人民共和国XXX部、湖北省XXX厅

智慧水务

功能:实时检测路面是否有积水;预判积水大概的深度等
难点:视频质量低,参照物多变,气候光照多变,环境极其复杂
祝贺:该城市生命线-智慧水务系统在厦门、南京成功应用,被央视报道

视频大数据智能分析系统PolCam 2.0

1.主导开发新加坡警察局资助的视频大数据智能分析系统PolCam 2.0中异常事件检测子系统
2.被全球最大的技术服务供应商500强埃森哲(Accenture)和新加坡政府所采用,用于新加坡平安城市、智慧城市建设
3.被新加坡最权威的《海峡时报》关注与报道


公共服务窗口政务人员动作行为分析系统

功能:准确的、实时的识别政务工作人员的动作,实现对政务人员工作状况的监督
难点:目标多、场景复杂、摄像头视角差等


综合性视频结构化系统

功能:综合利用基于深度学习的各种视觉任务算法,开发基于视频大数据的多功能结构化系统
难点:目前市面上已有了数10种视频结构化分析系统,但对视频人体动作、行为进行结构化的产品极少。本团队利用在视频人体动作行为分析方面的优势,弥补了当前的不足。

©鄂ICP备18021072号
联系地址: 中国·武汉市珞瑜路129号 邮编: 430079 E-mail:liesmars@whu.edu.cn