RAG란? RAG(Retrieval-Augmented Generation)의 약자로, 대규모 언어 모델(LLM)이 답변을 생성할 때 외부의 신뢰할 수 있는 지식 소스에서 관련 정보를 검색하고 활용하여 답변의 정확성과 최신성을 높이는 기술이다. 위 그림은 AWS에서 제공하는 구성도이다. LLM에게 질문을 할때 답변을 바로 생성하지 않고, Knowledge Sources를 갔다오게끔하는 방식으로 LLM이 어떤 분야에 특화되게끔 만드는데 용이하다. 구성은 간단해보이지만, 몇 가지 기술적인 부분들이 접목된다. 1. 데이터를 어떻게 표현할까?2. 데이터를 어떻게 저장할까?3. 어떻게 평가할 것인가? 요즘 이 과정들을 공부하고 있으니 하나씩 알아보자 1. Embedding Model세상에는 수많은 언어들이 있고, ..
개발/AI
2025. 10. 20. 15:59
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- docker
- JWT
- OpenAI
- lambda
- Log
- 인프런
- AWS EC2
- AWS
- Spring
- 오블완
- ecs
- 후쿠오카
- Redis
- serverless
- 스프링부트
- springboot
- 티스토리챌린지
- EKS
- terraform
- AOP
- ChatGPT
- GIT
- CORS
- 람다
- java
- Kotlin
- cache
- CloudFront
- S3
- elasticsearch
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
글 보관함
