| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- RLHF
- flashattention
- attention
- gqa
- fréchet inception distance
- BLEU
- MQA
- catastrophic forgetting
- re-ranking
- rotary position embedding
- SK AI SUMMIT 2025
- reinforcement learning from human feedback
- test-time scaling
- 트랜스포머
- CoT
- context engineering
- model context protocol
- 토크나이저
- Engineering at Anthropic
- MHA
- PEFT
- extended thinking
- transformer
- Multi-Head Attention
- Embedding
- chain-of-thought
- Positional Encoding
- self-attention
- Langchain
- langgraph
- Today
- Total
목록Theory/Retrieval-Augmented Generation (5)
AI Engineer 공간 "사부작 사부작"
Lost in the Middle: LLM은 왜 긴 글의 중간을 기억하지 못할까?대규모 언어 모델(LLM) 기반의 챗봇에게 긴 보고서나 여러 문서를 주고 요약을 요청했을 때, 어딘가 중요한 내용이 빠진 듯한 느낌을 받은 적이 있으신가요? 이는 단순히 모델의 실수가 아니라, 현재 LLM 기술이 가진 흥미로운 한계를 보여주는 현상입니다. LLM이 긴 문맥(Context)의 중간에 있는 정보를 제대로 활용하지 못하는 이 문제를 'Lost in the Middle' 이라고 부릅니다. 이 현상은 '건초더미에서 바늘 찾기(Needle-in-a-Haystack)'라는 유명한 테스트를 통해 널리 알려졌습니다. 이 테스트는 Paul Graham의 에세이들을 취합하여 최대 128K 토큰에 가까운 긴 문서를 준비하고, 문서..
고급 RAG 기법: 단순 검색을 넘어 지능적 답변으로대규모 언어 모델(LLM)은 방대한 지식을 학습하지만, 최신 정보 부재나 환각(hallucination) 현상과 같은 한계를 지닙니다. 검색-증강 생성(Retrieval-Augmented Generation, RAG)은 이러한 LLM의 약점을 보완하기 위해 외부 지식 소스에서 관련 정보를 검색하여 답변의 정확성과 신뢰성을 높이는 핵심 기술입니다. 기본적인 RAG 접근법도 효과적이지만, 검색된 정보의 관련성이 떨어지거나 복잡한 질문에 대한 답변 능력이 제한될 수 있습니다. 이러한 한계를 극복하고 RAG 시스템의 성능을 한 차원 끌어올리기 위해 다양한 고급 기법들이 등장했습니다. 이 글에서는 단순 검색을 넘어 보다 정교하고 지능적인 답변 생성을 가능하게 하..
RAG 성능 평가: LLM의 신뢰성과 잠재력을 극대화하는 핵심 전략검색 증강 생성(Retrieval-Augmented Generation, RAG)은 대규모 언어 모델(LLM)이 외부 지식 소스를 활용하여 보다 정확하고 맥락에 맞는 답변을 생성하도록 하는 핵심 기술입니다. RAG 시스템은 사용자의 질의에 대응하여 관련 정보를 검색하고(Retrieval), 이를 기반으로 응답을 생성(Generation)하는 두 단계로 구성됩니다. 이러한 강력한 기능으로 인해 RAG는 복잡한 질의응답, 콘텐츠 생성, 연구 지원 등 다양한 분야에서 활용 가능성을 높이고 있지만, 그 성능을 체계적으로 평가하고 관리하는 것은 시스템의 신뢰성과 효용성을 보장하는 데 필수적입니다. 본 글에서는 RAG 성능 평가의 중요성과 핵심 차원..
더 똑똑한 검색을 찾아서: 어휘적, 의미적, 하이브리드 검색 완벽 가이드정보의 바다에서 원하는 정보를 정확하고 빠르게 찾는 것은 마치 숨은그림찾기와 같습니다. 특히 RAG(Retrieval-Augmented Generation) 시스템처럼 방대한 데이터 속에서 가장 관련성 높은 정보를 찾아내는 검색기의 역할은 무엇보다 중요합니다. 검색기는 마치 똑똑한 정보 탐험가처럼, 사용자의 질문 의도를 파악하고 최적의 답변을 이끌어낼 단서를 찾아냅니다. 하지만 이 탐험가들이 정보를 찾는 방식은 한 가지가 아닙니다. 마치 각기 다른 도구와 전략을 사용하는 탐험가들처럼, 검색기도 어휘적 검색, 의미적 검색, 그리고 이 둘을 결합한 하이브리드 검색 등 다양한 방법으로 정보를 탐색합니다. 이번 글에서는 이 세 가지 주요 검..
RAG: 똑똑한 LLM의 비밀 병기, RAG: 실시간 정보로 지능을 증강하다최근 인공지능(AI) 분야, 특히 대규모 언어 모델(LLM)은 놀라운 발전을 거듭하며 우리의 삶에 깊숙이 들어오고 있습니다. 하지만 LLM도 만능은 아닙니다. 학습 데이터에 없는 최신 정보를 모르거나, 때로는 사실과 다른 내용을 그럴듯하게 지어내는 '환각(Hallucination)' 현상을 보이기도 하죠. 이러한 한계를 극복하기 위해 등장한 기술이 바로 검색 증강 생성(Retrieval-Augmented Generation, RAG)입니다.RAG는 LLM이 답변을 생성하기 전에, 마치 똑똑한 조수가 옆에서 관련 자료를 찾아주듯, 외부 지식 소스에서 필요한 정보를 먼저 검색합니다. 그리고 이 검색된 정보를 바탕으로 LLM이 최종 답..