본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
Home
❯
AI
❯
Papers
❯
LLMs
폴더: AI/Papers/LLMs
34건의 항목
2026년 4월 13일
A. Conclusion, Limitation, and Future
2026년 4월 13일
ACT_Agentic_Critical_Training_2026_Skill_LM
paper
Skill_LM
RL
agent
critical_reasoning
GRPO
imitation_learning
self_reflection
2026년 4월 13일
Byte-Pair Encoding(BPE)
2026년 4월 13일
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
2026년 4월 13일
Claude Models
claude-3
claude-3.5
claude-4
anthropic
constitutional-ai
safety
extended-thinking
computer-use
baseline-selection
2026년 4월 13일
Command R+ (Cohere)
command-r-plus
cohere
rag
tool-use
enterprise
baseline-selection
2026년 4월 13일
DeepSeek Models
deepseek-v2
deepseek-v3
moe
mla
fp8
efficient-training
baseline-selection
hyperparameters
2026년 4월 13일
Falcon - The RefinedWeb Dataset for Falcon LLM
falcon
refinedweb
data-quality
tii
baseline-selection
hyperparameters
2026년 4월 13일
GPT Models
gpt-4
gpt-4o
openai
multimodal
omni
scaling
baseline-selection
2026년 4월 13일
Gemini Models
gemini
gemini-1.5
google
multimodal
ultra
pro
nano
long-context
moe
baseline-selection
2026년 4월 13일
Gemma Models
gemma
gemma3
google
open-source
small-model
multimodal
vision
long-context
baseline-selection
hyperparameters
2026년 4월 13일
Is Your Code Generated by ChatGPT Really Correct! Rigorous Evaluation of Large Language Models for Code Generation
2026년 4월 13일
LLM_as_Judge_GenToJudgment_2025_LLM_Evaluation
paper
LLM_Evaluation
LLM_as_Judge
taxonomy
EMNLP
alignment
reasoning
bias
survey
2026년 4월 13일
LLM_as_Judge_Survey_2025_LLM_Evaluation
paper
LLM_Evaluation
LLM_as_Judge
reliability
bias
benchmark
survey
2026년 4월 13일
LLMs
2026년 4월 13일
LLaMA Models
llama
llama2
llama3
meta
open-source
scaling-laws
rlhf
dpo
gqa
baseline-selection
hyperparameters
paper
architecture
training
Dense
Meta
2026년 4월 13일
Language Models are Few-Shot Learners
GPT3
2026년 4월 13일
Language Models are Unsupervised Multitask Learners
GPT2
2026년 4월 13일
LoRA
2026년 4월 13일
LoraHub - Efficient Cross-Task Generalization via Dynamic LoRA Composition
paper
LoRA
ModuleComposition
CrossTaskGeneralization
GradientFree
CMA-ES
PEFT
2026년 4월 13일
LoraRetriever - Input-Aware LoRA Retrieval and Composition for Mixed Tasks in the Wild
paper
LoRA
Retrieval
MixedTask
ModuleComposition
BatchInference
ContrastiveLearning
PEFT
2026년 4월 13일
Mistral Models
mistral
mixtral
moe
sparse
sliding-window-attention
gqa
efficient
baseline-selection
hyperparameters
2026년 4월 13일
Motivation in Large Language Models
paper
LLM
motivation
psychology
behavioral-alignment
loss-aversion
zombie-framework
self-determination-theory
prompt-engineering
2026년 4월 13일
PaLM - Scaling Language Modeling with Pathways
palm
google
scaling
pathways
baseline-selection
hyperparameters
2026년 4월 13일
Phi-3 Technical Report
phi-3
microsoft
small-model
synthetic-data
baseline-selection
hyperparameters
2026년 4월 13일
QLoRA - Efficient Finetuning of Quantized LLMs
2026년 4월 13일
Qwen Models
qwen2.5
qwen3
alibaba
dense
moe
multilingual
reasoning
baseline-selection
hyperparameters
2026년 4월 13일
Reasoning Models Struggle to Control their Chains of Thought
paper
Safety
CoT
Monitoring
Controllability
Alignment
ReasoningModels
LLM
2026년 4월 13일
RoFormer - Enhanced Transformer with Rotary Position Embedding
2026년 4월 13일
The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs - An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities
2026년 4월 13일
Towards Ontology-Enhanced Representation Learning for Large Language Models
2026년 4월 13일
Training language models to follow instructions with human feedback - InstructGPT
instructgpt
rlhf
alignment
openai
baseline-selection
hyperparameters
2026년 4월 13일
Yi - Open Foundation Models by 01.AI
yi
01ai
bilingual
chinese
data-quality
baseline-selection
hyperparameters
2026년 4월 13일
LLMs Paper Collection
moc
llm