这项由清华大学、上海人工智能实验室、香港中文大学、上海交通大学等多家知名研究机构联合开展的研究,于2025年7月发表在计算机视觉顶级会议CVPR上。研究的核心成果是开发出了名为Mono-InternVL-1.5的多模态大语言模型,该模型能够在大幅降低训练成本的同时 ...