智源研究院宣布开源超长视频理解模型Video-XL-2
6月3日消息,智源研究院宣布,已联合上海交通大学等机构发布新一代超长视频理解模型:Video-XL-2。据介绍,新模型显著扩展了可处理视频的时长,支持在单张显卡上高效处理长达万帧的视频输入。目前,Video-XL-2的模型权重已全面向社区开放。
[本文作者佚名,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]