手把手教你微调大模型

发布时间：2026-05-22浏览次数：11

你是否也想开展大模型微调相关的研究或项目，却不知从何入手？本讲座将面向对大语言模型微调感兴趣的同学，系统介绍大模型微调的基本思路与实践流程，从数据构造、SFT监督微调讲起，延伸至LoRA、模型蒸馏与GRPO强化学习微调，并结合ms-swift、verl、TRL等主流框架，帮助你理解微调技术路线，建立开展LLM微调的基础能力。

时间：2026年5月27日星期三（下午）3:00-4:00

地点：图书馆302报告厅

线上参与：腾讯会议(会议ID:134 627 949 参会密码见校内邮件通知)

主讲人：洪沐天，信息学院2022级本科生

讲座大纲：

· 大模型微调的基本概念与适用场景

· SFT监督微调：常用技巧

· LoRA, QLoRA, 与全量微调

· GRPO的原理与实践流程

· ms-swift、verl、trl 等微调框架介绍

培训/讲座/展览

手把手教你微调大模型