# 캘리포니아 대학교 공개 강의 《대형 언어 모델의 강화 학습》, “이론 + 실전” 방식으로 AI 훈련의 핵심 기술을 0부터 1까지 투명하게 설명하며, 강화 학...
Canonical: https://social-archive.org/yena/IGxVGZ0G7x
Original URL: https://x.com/Jolyne_AI/status/2072545810127171857
Author: 徐伦
Platform: x
## Content
## 1 캘리포니아 대학교 공개 강의 《대형 언어 모델의 강화 학습》, “이론 + 실전” 방식으로 AI 훈련의 핵심 기술을 0부터 1까지 투명하게 설명하며, 강화 학습부터 LLM 훈련까지의 완전한 프레임워크를 체계적으로 구축할 수 있도록 돕습니다. 강의 내용은 포괄적이며, 보조 자료도 완비되어 있습니다: 강의 슬라이드, 완전한 비디오, 실습 연습이 모두 갖춰져 있어, 수강 후 바로 적용할 수 있습니다. 강의 주소: http:// ernestryu.com/courses/RL-LLM .html … 배울 내용: - 심층 강화 학습 핵심: MDP, 정책 그래디언트, A3C, PPO 등 주요 알고리즘 - 대형 언어 모델 기초: NLP, 언어 모델링, RNN 등의 입문과 맥락 - RLHF 전체 프로세스 분해: 인간 피드백 기반 훈련 방법과 구현 아이디어 - 검증 가능한 보상 강화 학습: 더 안전하고 신뢰할 수 있는 훈련 패러다임 - 실습 중심: Jupyter 코드 예제 + 수업 후 과제, 배우면서 바로 연습 강의는 UCLA 수학부 조교수를 주강사로 하며, YouTube에서 전체 비디오를 제공합니다. 내용이 탄탄하며, “RL + LLM 훈련”을 진정으로 이해하고 싶은 사람에게 적합합니다. https://t.co/W0l8b4f7Pi {{IMAGE_0}} --- ## 2 分享一门来自加州大学伯克利分校的进阶课程：Advanced LLM Agents。 这门课聚焦大语言模型 Agent 的最新进展，从推理到规划、从代码到数学证明，系统拆解“能思考、会行动”的代理是怎么做出来的。 课程由 Dawn Song 教授主讲，并邀请 Google、Meta {{IMAGE_1}}