你是否也想开展大模型微调相关的研究或项目,却不知从何入手?本讲座将面向对大语言模型微调感兴趣的同学,系统介绍大模型微调的基本思路与实践流程,从数据构造、SFT监督微调讲起,延伸至LoRA、模型蒸馏与GRPO强化学习微调,并结合ms-swift、verl、TRL等主流框架,帮助你理解微调技术路线,建立开展LLM微调的基础能力。
时间:2026年5月27日星期三(下午)3:00-4:00
地点:图书馆302报告厅
线上参与:腾讯会议(会议ID:134 627 949 参会密码见校内邮件通知)
主讲人:洪沐天,信息学院2022级本科生
讲座大纲:
· 大模型微调的基本概念与适用场景
· SFT监督微调:常用技巧
· LoRA, QLoRA, 与全量微调
· GRPO的原理与实践流程
· ms-swift、verl、trl 等微调框架介绍

