| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- fréchet inception distance
- 트랜스포머
- model context protocol
- Langchain
- extended thinking
- BLEU
- 토크나이저
- context engineering
- catastrophic forgetting
- langgraph
- RLHF
- re-ranking
- Engineering at Anthropic
- reinforcement learning from human feedback
- Embedding
- MHA
- Multi-Head Attention
- SK AI SUMMIT 2025
- transformer
- gqa
- CoT
- Positional Encoding
- test-time scaling
- self-attention
- PEFT
- attention
- rotary position embedding
- chain-of-thought
- flashattention
- MQA
Archives
- Today
- Total
목록Cider (1)
AI Engineer 공간 "사부작 사부작"
멀티모달 AI 평가의 복잡한 퍼즐: 여러 감각을 통합하는 인공지능의 진정한 실력을 어떻게 측정할 것인가?
멀티모달 모델 평가의 복잡성: 여러 감각을 통합하는 AI의 진정한 실력 측정하기현대 인공지능의 발전은 마치 인간의 감각 기관이 진화하는 과정과 닮아 있습니다. 과거 AI가 단일한 감각, 즉 텍스트나 이미지 중 하나만을 처리했다면, 이제는 인간처럼 시각, 청각, 언어를 동시에 이해하고 통합하는 멀티모달 AI의 시대가 열렸습니다. 하지만 이러한 복합적 능력을 가진 AI를 평가하는 것은 마치 오케스트라의 연주를 평가하는 것처럼 복잡하고 정교한 과정을 요구합니다. 각 악기의 개별 연주 실력뿐만 아니라 전체적인 조화와 협연 능력까지 종합적으로 판단해야 하기 때문입니다. 멀티모달 모델 평가는 단순히 정답률을 측정하는 것을 넘어서, 모델이 서로 다른 유형의 정보를 얼마나 효과적으로 통합하고 추론할 수 있는지를 종합적..
Theory/Evaluation-Benchmarking
2025. 6. 5. 08:13