어쩌다보니 RAG 시스템을 개발하게 되서 개괄적인 프로세스를 이해하기 위해서 구매한 책이다. 스프링 위에서 RAG를 개발해 본 적은 있지만, 당시에도 개발하기 급해서 세부적인 기술들은 많이 놓쳤던 것을 보완하고 요즘 AI 개발에 보편적으로 사용되는 Langchain에 대한 이해가 필요했었는데.. 꽤 나쁘진 않았다. 개인적으로 LLM이 어려운건 LLM이 등장하기 까지의 발전과정에 블랙박스가 많기 때문이라 생각하는데, 그거에 대해서 쉽고 간단하게 설명해줬다. 그리고 RAG 개발에 세부 단계들도 코드와 함께 간단하게 정리해줘서 쉽게 읽힌다는 장점도 있다. 아쉬운 점은 너무 보편적인 이야기가 정리되어 있어서 실무에서 얻을만한 세부적인 팁들이 거의 없다. 개괄적인건 어느정도 해봤고 알고 있는 나한테는 조금 아쉬웠..
나는 임베딩 벡터를 이용한 검색 시스템을 사전 이해 없이 통으로 만들어본 적이 있다. 그때의 지식이 크게 변하지 않은 채로 시간이 지나면서, 최근 다시 임베딩 벡터 기반 검색 기술을 공부하던 중 의미 기반 검색(Semantic Search) 과 키워드 기반 검색(Keyword Search) 의 개념을 명확히 알게 되었다. 그리고 이 두 접근 방식을 비교하다 보니, Sparse Vector(희소 벡터) 라는 개념이 그 중심에 있다는 걸 알게 됐다. 이번 글에서는 Sparse Vector가 무엇이고, Dense Vector와 어떤 차이가 있으며, 임베딩 기반 검색에서 어떤 역할을 하는지를 정리해보려 한다. 거기다 이전 글이 Embedding에 사용되는 벡터가 dense만 있다는 듯이 사용해서 자세히 알아봤다..
RAG 시스템에 필요한 것들을 개괄적으로 알아봤었다. 그리고 임베딩 모델의 중요성까지 알아봤다.2025.10.20 - [개발/AI] - RAG 이해하기: Embedding부터 평가 지표까지 RAG 시스템에 큰 영향을 주는 요소들은 데이터 전처리, 임베딩, 조회 알고리즘, 그리고 LLM이 대표적이다. 하지만 결국 저장소가 필요한 만큼 벡터 데이터베이스(Vector DB) 역시 간과할 수 없다. 특히 개발자 입장에서는 단순히 빠르기만 한 DB보다는쓰기 편하고, 조회 알고리즘 옵션이 다양하며, 환경에 맞게 유연하게 쓸 수 있는 도구가 훨씬 중요하다. 그래서 최근 여러 벡터 저장 방식을 테스트하고 있다. 그중 첫 번째로 선택한 건 PostgreSQL에서 제공하는 확장 기능인 pgvector였다. 개인적으로 P..
- Total
- Today
- Yesterday
- 티스토리챌린지
- 오블완
- Spring
- JWT
- Log
- EKS
- Kotlin
- ChatGPT
- Redis
- cache
- terraform
- CloudFront
- CORS
- OpenAI
- lambda
- elasticsearch
- java
- 스프링부트
- GIT
- AWS
- 람다
- 인프런
- docker
- springboot
- AOP
- ecs
- serverless
- AWS EC2
- 후쿠오카
- S3
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
