반응형
RAG = Retreival Augmented Generation
한국말로 검색 증강 생성이다
RAG 아키텍쳐는 다음 순서로 작동한다
- 사용자의 프롬프트 입력
- 프롬프트가 벡터 DB를 조회
- 벡터 DB는 데이터 소스를 통해 기 제작
- 벡터 DB를 통해 관련 정보 입수
- 사용자 프롬프트와 벡터 DB내에서 검색된 정보가 FM으로 이동
- 사용자에게 답변 반환
Amazon Bedrock에서 RAG Vector DB 만드는 법
- S3 doc 저장
- Embedding model 선택 (FM과 다르다)
- Vector DB 선택
AWS에서 벡터 DB 제공가능한 서비스
- OpenSearch
- Aurora
- * MongoDB / Redis / Pinecone (AWS 외부 서비스 중 현재 지원 중)
임베딩 모델
- Amazon Titan
- cohere
RAG 벡터 DB 종류
- OpenSearch ; 검색분석디비 / 리얼타임 유사성 검색 / 수백만 벡터 임베딩 / 인덱스 스케일 관리 / kNN 검색
- DocumentDB(MongoDB) ; NoSQL디비 / 리얼타임 유사성 쿼리 / 수백만 벡터 임베딩
- Aurora ; 관계형 디비
- RDS for PostgresQL ; 오픈소스 / 관계형 디비
- Neptune ; 그래프 디비
Source DB
- S3
- 컨플루언스
- MS 셰어포인트
- Web Pages
- 세일즈 포스 ... 그리고 증가할 것이다
반응형
'IT 공부 > AWS AI Practioner(완)' 카테고리의 다른 글
AWS AI Practitioner 6 RAG 핸즈온 (0) | 2024.10.01 |
---|---|
AWS AI Practitioner 5 RAG 핸즈온 (0) | 2024.10.01 |
AWS AI Practitioner 3 Evaluation (0) | 2024.10.01 |
AWS AI Practitioner 2 파인 튜닝 (1) | 2024.10.01 |
AWS AI Practitioner 1 Bedrock 탐색하기 (0) | 2024.10.01 |