반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 면접왕 이형
- 베스트 모델
- 예측선
- 밑시딥2
- 밑시딥
- 안드로이드
- GPT-3
- 면접왕이형
- 과적합
- 딥페이크
- 뉴로 심볼릭
- 보이스피싱
- ESG
- 독서 #독서후기 #피로사회 #행동과잉 #긍정과잉
- gradiant descent
- 경사하강법
- 코틀린
- ESG 채권
- 밑바닥부터 시작하는 딥러닝
- 선형회귀
- 학습 자동 중단
- 안드로이드 구조
- nlp
- 모두의 딥러닝
- 다중분류
- 로지스틱 회귀법
- andoriod with kotlin
- MRC
- k겹 교차검증
- 경제신문스크랩
Archives
- Today
- Total
Practice makes perfect!
Week 11 (6) Passage Retrieval – Scaling Up 본문
1. Passage Retrieval and Similarity Search
How to find the passage in real time? -> Similarity Search
1) MIPS (Maximum Inner Product Search)
주어진 질문(query) 벡터 q에 대해 Passage 벡터 v들 중 가장 질문과 관련된 벡터를 찾아야함
(관련성은 inner product 값으로 계산)
- 검색 : 인덱싱 된 벡터들 중 질문 벡터와 가장 내적값이 큰 상위 k개의 벡터를 찾는 과정
- 인덱싱 : 방대한 양의 passage 벡터들을 저장하는 방법
- brute-force(exhaustive) search : 저장해둔 모든 Sparse/Dense 임베딩에 대해 일일히 내적값을 계산하여 가장 값이 큰 passage 추출
- 실제로 검색해야 할 데이터는 훨씬 방대하기 때문에 더이상 모든 문서 임베딩을 일일히 보면서 검색할 수 없음
2) Tradeoffs of similarity search
2. Approximating Similarity Search
1) Compression - Scalar Quantization(SQ)
compression : vector를 압축하여, 하나의 vector가 적은 용량을 차지 -> 압축량 ↑ => 정보 손실 ↑
ex) scalar quantization
2) Pruning - Inverted File (IVF)
pruning : Search space를 줄여 search 속도 개선(dataset의 subset만 방문)
쿼리에 가장 근접한 cluster만 보는 방식. 그 내의 포인트에 대해서는 exhaustive search로 모두 검색.ex) k-means clustering
+ FAISS : Library for efficient similarity search (indexing 쪽을 도움. endoing은 x)
반응형
'Study > AI Tech' 카테고리의 다른 글
Week 12 (8) Reducing Training Bias (0) | 2021.10.21 |
---|---|
Week 12 (7) Linking MRC and Retrieval (0) | 2021.10.20 |
Week 11 (5) Passage Retrieval - Dense Embedding (0) | 2021.10.14 |
Week 11 (4) Passage Retrieval - Sparse Embedding (0) | 2021.10.14 |
Week 11 (3) Generation-based MRC (0) | 2021.10.13 |
Comments