Week9 (3) BERT 학습

본문 바로가기

Notice

Recent Posts

Recent Comments

Link

Tags more

Archives

Today

Total

관리 메뉴

Practice makes perfect!

Week9 (3) BERT 학습 본문

Study/AI Tech

Week9 (3) BERT 학습

na0dev 2021. 9. 29. 12:43

1) BERT 모델 학습

BERT 학습 단계

Tokenizer 만들기
데이터셋 확보 : BERT는 모델 사이즈가 매우 크기 때문에 모델의 파라미터를 하나로 수렴하기 위해서는 대용량의 corpus를 필요로 함
Next sentence prediction (NSP)
Masking

BERT [MASK] token 공격

BERT 모델은 [MASK] token을 잘 예측하기 위해 학습한다.
그래서 [MASK] token을 예측하는 task를 통해 개인정보를 획득할 수도 있다.

따라서 언어모델 학습 시 반드시 개인 정보가 마스킹 처리 되거나 없는 데이터를 이용해야 한다!

'Study > AI Tech' 카테고리의 다른 글

Week 11 (1) MRC Intro (0)	2021.10.12
Week 10 (1) GPT 언어 모델 (0)	2021.10.05
Week 9 (4) 한국어 언어 모델 학습 및 다중 과제 튜닝 (0)	2021.10.01
Week9 (2) BERT 언어모델 (0)	2021.09.28
Week 9 (1) 인공지능과 자연어 처리 (0)	2021.09.27

'Study/AI Tech' Related Articles

more

Comments

티스토리툴바