• 当前,基于强化学习提升多模态模型的推理能力已经取得一定的进展。但大多研究者们选择 7B+ 的模型作为基座,这对于许多资源有限的科研人员而言仍存在显著的门槛。同时,在视频推理领域,由于高质量强推理性数据较为稀少,通用问答数据较难激发模型的深层
    admin4小时前
    30