
图:基于CaricHarmony模型生成的研究团队成员Dongyu Wang(左), Professor Yi-Zhe Song(中), Dar-Yen Chen(右)人像图片
来自萨里大学以人为本人工智能研究中心的研究团队,在 2026 年国际计算机视觉与模式识别大会(CVPR)上,斩获首届算力金星奖(Compute Gold Star)。CVPR 是全球人工智能与计算机视觉领域最具影响力的顶会之一,本届大会累计收到超16000份投稿,全球仅有18支团队获此奖项,萨里大学团队位列其中。
本次获奖成果为团队自主研发的AI框架 CaricHarmony。当下绝大多数主流AI模型在学习全新概念时都要消耗海量算力资源,还需耗费高额的成本与大量时间完成精调训练;而CaricHarmony模型则无需额外的数据集预训练,仅依靠一块消费级RTX 4090独立显卡即可运行,16秒内就能生成复杂图像,大幅降低这类模型对算力资源的消耗。
为直观验证该框架的高效性能,研究团队选择了计算机视觉领域难度极高的任务开展测试:由简易草图生成高质量的肖像漫画——传统AI模型在同步识别人物身份、绘制夸张轮廓时,普遍存在研究人员所说的 “信号干扰” 问题,最终生成的画面或人物平淡、无辨识度,或形象扭曲失真。CaricHarmony通过两条并行通道拆分两类生成指令,在不依赖高算力训练的前提下,同时兼顾还原人物相貌与描摹夸张造型两大生成需求。

图:CaricHarmony模型生成的高质量人物肖像漫画图片
图片来源:https://dongyuuw.github.io/CaricHarmony/
当前主流AI模型仅学习单一的新概念,就要投入巨量算力、花费高额成本反复训练。我们希望证明,依靠极低能耗同样能完成高度复杂、高度创意的图像生成。通过解决底层框架存在的核心冲突,我们从根源上摆脱了高强度算力依赖。
—— Dongyu Wang, 萨里大学博士研究生

图:CaricHarmony模型通过三条并行路径优化图像生成过程
图片来源:https://dongyuuw.github.io/CaricHarmony/
本次研究的难点不只是提升漫画生成的画质,更在于实现轻量化高效运算。我们将相互干扰的图像信号拆分成独立并行的通道,省去其他模型必需的大量循环优化步骤,既提升了运行速度,也降低算力带来的环境消耗。
随着AI研究对算力资源的需求持续攀升,高校实验室想要在国际顶会中取得亮眼成果的难度不断加大。这份奖项充分印证了基础的算法研究依旧具备极高的行业价值。
——Dar-Yen Chen,萨里大学博士研究生
CVPR组委会专门设立了一个奖项来表彰算力能效方面的创新,这是十分鼓舞人心的举措,也证明算法创新本身仍有清晰的发展路径。我们的成果证实,仅依靠普通的消费级显卡、不需要额外的训练数据,就能实现世界级的AI技术突破,这为更普惠、低碳可持续的人工智能发展提供了可行方案。
——Yi-Zhe Song,萨里大学教授、人工智能研究院联席主任、人工智能课程负责人

萨里大学在计算机与人工智能等领域拥有卓越的国际声誉:科研实力扎实、紧跟前沿方向,持续产出顶尖的研究成果。为进一步适配行业多元化人才需求,学校今年全新开设面向转专业背景的人工智能硕士课程,兼具技术深度、伦理规范与产业视野。
点击阅读原文,了解萨里大学计算机与人工智能更多课程与科研机会。

微信公众号:
英国萨里大学
中文官网:
surreyuniversity.cn/

.png)
