본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
태그: SFT
5건의 항목
2026년 6월 04일
AgentFold - Long-Horizon Web Agents with Proactive Context Management
paper
agent
web-agent
long-horizon
context-management
memory
LLM
SFT
MoE
BrowseComp
AgentFold
application
2026년 6월 04일
AgentTuning - Enabling Generalized Agentabilities for LLMS
Agent
InstructionTuning
LLM
AgentLM
Llama2
SFT
Generalization
Training
2026년 6월 04일
Beyond Retrieval - Embracing Compressive Memory in Real-World Long-Term Conversations
Paper
LLM-Agent
Memory
Long-Term-Conversation
Compressive-Memory
RAG-Alternative
Dialogue-System
COMEDY
SFT
DPO
2026년 6월 04일
Method Change Evaluation: SFT → GRPO
experiment-design
method-evaluation
expert-review
GRPO
SFT
2026년 6월 04일
SC-SFT Dataset Selection: 포괄적 자의식 SFT를 위한 데이터셋 선정 근거
dataset-selection
self-consciousness
SFT
follow-up-experiment