| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- Engineering at Anthropic
- extended thinking
- 트랜스포머
- self-attention
- langgraph
- Multi-Head Attention
- RLHF
- MQA
- rotary position embedding
- MHA
- chain-of-thought
- gqa
- CoT
- BLEU
- transformer
- SK AI SUMMIT 2025
- re-ranking
- Positional Encoding
- model context protocol
- PEFT
- context engineering
- test-time scaling
- Embedding
- reinforcement learning from human feedback
- 토크나이저
- fréchet inception distance
- Langchain
- attention
- flashattention
- catastrophic forgetting
- Today
- Total
목록extended thinking (2)
AI Engineer 공간 "사부작 사부작"
클로드(Claude)의 생각 엿보기: Extended Thinking으로 투명하고 강력한 AI 에이전트 만들기복잡한 AI 멀티 에이전트 시스템을 구축할 때, 우리는 종종 "이 AI는 왜 이런 결정을 내렸을까?"라는 근본적인 질문에 부딪힙니다. 최종 결과물만으로는 그 과정의 타당성을 신뢰하기 어렵기 때문이죠. 마치 학생이 수학 문제의 답만 덜렁 적어냈을 때, 풀이 과정 없이는 정답에 이르기까지의 논리를 알 수 없는 것과 같습니다. 이러한 '블랙박스' 문제를 해결하고 AI의 투명성과 신뢰도를 높이기 위해 등장한 것이 바로 '추론 모델(Reasoning Model)'의 역할이며, 앤트로픽(Anthropic)의 클로드(Claude)가 제공하는 'Extended Thinking'은 이 개념을 가장 잘 구현한 기능..
AI가 더 깊이 생각하게 만드는 기술: 테스트-타임 스케일링과 예산 강제인공지능(AI)의 세계는 마치 끊임없이 진화하는 생명체와 같습니다. 더 똑똑하고, 더 유능한 AI를 만들기 위한 연구는 하루가 다르게 새로운 지평을 열고 있죠. 최근 AI 분야에서 가장 주목받는 혁신 중 하나는 모델이 문제의 난이도에 따라 '생각하는 시간'을 조절할 수 있게 만드는 기술입니다. 우리가 간단한 질문에는 즉시 답하지만, 어려운 수학 문제나 복잡한 코드를 디버깅할 때는 더 많은 시간과 정신력을 쏟는 것과 마찬가지입니다. 이러한 유연성을 AI에 부여하는 핵심 개념이 바로 테스트-타임 스케일링(Test-Time Scaling)입니다. 이는 모델을 더 크게 만드는 대신, 이미 훈련된 모델이 답변을 생성하는 '테스트 시점'에 더 ..