yena shared this post · 4h ago
徐伦

캘리포니아 대학교 공개 강의 《대형 언어 모델의 강화 학습》, “이론 + 실전” 방식으로 AI 훈련의 핵심 기술을 0부터 1까지 투명하게 설명하며, 강화 학...

1

캘리포니아 대학교 공개 강의 《대형 언어 모델의 강화 학습》, “이론 + 실전” 방식으로 AI 훈련의 핵심 기술을 0부터 1까지 투명하게 설명하며, 강화 학습부터 LLM 훈련까지의 완전한 프레임워크를 체계적으로 구축할 수 있도록 돕습니다.

강의 내용은 포괄적이며, 보조 자료도 완비되어 있습니다: 강의 슬라이드, 완전한 비디오, 실습 연습이 모두 갖춰져 있어, 수강 후 바로 적용할 수 있습니다.

강의 주소:
http://
ernestryu.com/courses/RL-LLM
.html

배울 내용:

  • 심층 강화 학습 핵심: MDP, 정책 그래디언트, A3C, PPO 등 주요 알고리즘
  • 대형 언어 모델 기초: NLP, 언어 모델링, RNN 등의 입문과 맥락
  • RLHF 전체 프로세스 분해: 인간 피드백 기반 훈련 방법과 구현 아이디어
  • 검증 가능한 보상 강화 학습: 더 안전하고 신뢰할 수 있는 훈련 패러다임
  • 실습 중심: Jupyter 코드 예제 + 수업 후 과제, 배우면서 바로 연습

강의는 UCLA 수학부 조교수를 주강사로 하며, YouTube에서 전체 비디오를 제공합니다. 내용이 탄탄하며, “RL + LLM 훈련”을 진정으로 이해하고 싶은 사람에게 적합합니다.

https://t.co/W0l8b4f7Pi

{{IMAGE_0}}


2

分享一门来自加州大学伯克利分校的进阶课程:Advanced LLM Agents。

这门课聚焦大语言模型 Agent 的最新进展,从推理到规划、从代码到数学证明,系统拆解“能思考、会行动”的代理是怎么做出来的。

课程由 Dawn Song 教授主讲,并邀请 Google、Meta

{{IMAGE_1}}