3个Agent多模态感知秘诀，让AI真正具备“思考+执行”能力！