手把手教你微调大模型

发布时间:2026-05-22浏览次数:11

你是否也想开展大模型微调相关的研究或项目,却不知从何入手?本讲座将面向对大语言模型微调感兴趣的同学,系统介绍大模型微调的基本思路与实践流程,从数据构造、SFT监督微调讲起,延伸至LoRA、模型蒸馏与GRPO强化学习微调,并结合ms-swiftverlTRL等主流框架,帮助你理解微调技术路线,建立开展LLM微调的基础能力。

时间:2026527日星期三(下午)3:00-4:00

地点:图书馆302报告厅

线上参与:腾讯会议(会议ID:134 627 949 参会密码见校内邮件通知)

主讲人:洪沐天,信息学院2022级本科生

 

讲座大纲:

·       大模型微调的基本概念与适用场景

·       SFT监督微调:常用技巧

·       LoRA, QLoRA, 与全量微调

·       GRPO的原理与实践流程

·       ms-swiftverltrl 等微调框架介绍