본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
리더 모드
탐색기
Home
❯
Reinforcement Learning
❯
Group Relative Policy Optimization(GRPO)
Group Relative Policy Optimization(GRPO)
그래프 뷰
Properties
URL
https://arxiv.org/abs/2402.03300
백링크
The Student's Guide to Cognitive NeuroScience
Memory
Architecture
Benchmarks
LLMs
Fundamentals
self-consciousness
Theory of mind
Vision