본문 바로가기
IT 공부/AWS AI Practioner(완)

AWS AI Practitioner 4 RAG

by 랜턴K 2024. 10. 1.
반응형

RAG = Retreival Augmented Generation 

한국말로 검색 증강 생성이다 

 

RAG 아키텍쳐는 다음 순서로 작동한다

- 사용자의 프롬프트 입력

- 프롬프트가 벡터 DB를 조회 

- 벡터 DB는 데이터 소스를 통해 기 제작 

- 벡터 DB를 통해 관련 정보 입수

- 사용자 프롬프트와 벡터 DB내에서 검색된 정보가 FM으로 이동 

- 사용자에게 답변 반환 

 

Amazon Bedrock에서 RAG Vector DB 만드는 법

- S3 doc 저장

- Embedding model 선택 (FM과 다르다)

- Vector DB 선택 

 

AWS에서 벡터 DB 제공가능한 서비스

- OpenSearch

- Aurora 

- * MongoDB / Redis / Pinecone (AWS 외부 서비스 중 현재 지원 중)

 

임베딩 모델

- Amazon Titan

- cohere 

 

RAG 벡터 DB 종류

- OpenSearch ; 검색분석디비 / 리얼타임 유사성 검색 / 수백만 벡터 임베딩 / 인덱스 스케일 관리 / kNN 검색 

- DocumentDB(MongoDB) ; NoSQL디비 / 리얼타임 유사성 쿼리 / 수백만 벡터 임베딩 

- Aurora ; 관계형 디비

- RDS for PostgresQL ; 오픈소스 / 관계형 디비  

- Neptune ; 그래프 디비 

 

Source DB 

- S3 

- 컨플루언스

- MS 셰어포인트

- Web Pages

- 세일즈 포스 ... 그리고 증가할 것이다 

반응형