일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 과적합
- nlp
- ESG
- gradiant descent
- 안드로이드 구조
- 모두의 딥러닝
- 밑시딥2
- 예측선
- 코틀린
- 선형회귀
- andoriod with kotlin
- 보이스피싱
- k겹 교차검증
- 밑시딥
- 면접왕 이형
- 밑바닥부터 시작하는 딥러닝
- 뉴로 심볼릭
- ESG 채권
- 다중분류
- GPT-3
- 딥페이크
- 로지스틱 회귀법
- 안드로이드
- 경제신문스크랩
- 경사하강법
- 학습 자동 중단
- 베스트 모델
- MRC
- 독서 #독서후기 #피로사회 #행동과잉 #긍정과잉
- 면접왕이형
- Today
- Total
목록전체 글 (51)
Practice makes perfect!
1) 강의 내용 이미지 Autoencoder - encoder : 입력된 이미지를 압축된 형태로 표현 - decoder : 원본을 다시 복원 - compressed data는 입력 이미지에 대한 벡터값이 될 수 있음. (본인 스스로를 가장 잘 표현할 수 있게 학습된 모델이기 때문) BERT - self attention(transformer)를 사용한 모델 - 입력된 정보를 다시 입력된 정보로 representation하는 것을 목적으로 학습됨 - masking 기술을 사용해 어렵게 만든 문제를 해결하도록 함. - BERT는 mask된 자연어를 원본 자연어로 복원하는 과정으로 학습 - GPT-2 는 원본 이미지를 특정 sequence로 자르고 모델이 그 next를 예측하는 것을 목적으로 학습 - sent..
1. 자연어 단어 임베딩 1) 특징 추출과 분류 - 분류를 위해서는 데이터를 수학적으로 표현해야 함. - 먼저 분류 대상의 특징을 파악하고(Feature extraction), 이를 기준으로 분류 대상을 그래프 위에 표현하고 경계를 수학적으로 나눌 수 있음 (Classification) - 이러한 특징을 컴퓨터가 스스로 찾고, 스스로 분류하는 것이 '기계학습'의 핵심 2) Word2Vec - word2vec 알고리즘 : 자연어의 의미를 벡터 공간에 임베딩 - 한 단어의 주변 단어들을 통해, 그 단어의 의미를 파악 - 주변부의 단어를 예측하는 방식으로 학습 수행(Skip-gram 방식) - CBOW : 주변 단어들을 통해서 중간의 단어를 예측하는 모델 - Skip-Gram : 중심 단어를 통해 주변 단어를..
1. 자연어 처리란 NLP (Natural Language Processing)는 자연어를 처리하는 분야, 우리의 말을 컴퓨터에게 이해시키기 위한 기술이다. 영어, 한국어와 같은 자연어는 기계적이고 고정된 프로그래밍 언어와 달리 같은 의미의 문장도 여러 형태로 표현할 수 있고, 그 의미나 형태가 유연하게 바뀔 수 있다. 활용되는 예로 검색엔진, 기계번역, 질의응답 시스템, IME(입력기 전환), 문장 자동요약, 감정분석 등이 있다. 자연어를 컴퓨터에게 이해시키는 데는 '단어의 의미'를 이해시키는 것이 중요하다. 시소러스를 활용, 통계 기반, 추론 기반(word2vec) 이렇게 세 가지 기법이 있다. 2. 시소러스 먼저 시소러스는 사람이 직접 단어의 의미를 정의하는 방식이다. 시소러스는 '동의어'와 '유의..
- 문제 링크 : https://www.acmicpc.net/problem/2178 - 접근 방법 : 처음엔 이동에 제약이 있는 경우라고 생각해 DFS로 풀었다. 예제 입력은 다 맞았지만 DFS는 모든 노드를 다 탐색하기 때문에 시간이 오래 걸려 런타임 에러가 떴다. 다시 문제를 읽어보니 '지나는 최소 칸 수' 즉 최단거리를 구하는 문제였다. 최단거리는 BFS로 접근해야하고, 인접한 경로의 거리를 업데이트하는 식으로 코드를 작성하였다. # DFS 사용, 런타임 에러 발생 n, m = map(int, input().split()) graph = [list(map(int, input())) for _ in range(n)] visited = [[0] * m for _ in range(n)] visited[0..
문제 링크 : https://www.acmicpc.net/problem/1303 접근 방법 : 인접한 병사들의 수를 세는 것이 목적이다. 현재 위치에서 모든 노드를 탐색할 필요없이 인접한 우리 병사의 수만 세면 되므로 BFS를 사용하였다. from collections import deque m, n = map(int, input().split()) graph = [list(input()) for _ in range(n)] dx = [1,-1,0,0] dy = [0,0,1,-1] W, B = 0, 0 visited = [[0]*m for _ in range(n)] q = deque() def bfs(x,y): q.append((x,y)) visited[x][y] = 1 cnt = 1 while q: x,..
► BFS (Breadth-First Search) - 너비 우선 탐색 - 현재 나의 위치에서 가장 가까운 노드들을 모두 방문 - 방문하면서 현재위치 pop, 방문할 곳 append, 방문한 곳 check ☞ 미로탐색 중 최단 거리를 찾는 문제, 임의의 경로를 찾는 문제에서 사용 ex) 우리나라에서 직통도로로 연결된 지역 중, 서울과 경기도 사이에 존재하는 경로를 찾고싶을 때 깊이 우선 탐색의 경우(DFS) - 전국의 모든 도로를 다 살펴봐야할 수도 있다. 너비 우선 탐색의 경우(BFS) - 서울과 인접한 도로먼저 탐색 from collections import deque visited = [False] * 10 def bfs(v): q = deque([v]) visited[v] = True while ..
문제 정수 n이 매개변수로 주어집니다. 다음 그림과 같이 밑변의 길이와 높이가 n인 삼각형에서 맨 위 꼭짓점부터 반시계 방향으로 달팽이 채우기를 진행한 후, 첫 행부터 마지막 행까지 모두 순서대로 합친 새로운 배열을 return 하도록 solution 함수를 완성해주세요. 제한사항 n은 1 이상 1,000 이하 입출력 예 n result 4 [1,2,9,3,10,8,4,5,6,7] 5 [1,2,12,3,13,11,4,14,15,10,5,6,7,8,9] 6 [1,2,15,3,16,14,4,17,21,13,5,18,19,20,12,6,7,8,9,10,11] def solution(n): a = [[0]*i for i in range(1,n+1)] # 직각 삼각형을 표현할 리스트 생성 dx = [1,0,-1]..
# 데이터 입력 df_pre = pd.read_csv('../dataset/wine.csv', header=None) # sample()는 원본 데이터에서 정해진 비율만큼 랜덤으로 뽑아오는 함수. # frac=1은 100% df = df_pre.sample(frac=1) # 모델 업데이트 모델 저장 폴더 설정 (에포크마다 모델의 정확도를 저장할 폴더) MODEL_DIR = './model/' if not os.path.exists(MODEL_DIR): # 폴더가 존재하지 않으면 os.mkdir(MODEL_DIR) # 이 이름의 폴더 생성 # checkpointer에 모니터할 값 지정 val_loss : 테스트 오차(케라스 내부에서 기록되는 값) 모델이 저장될 곳 : 위에서 생성한 modelpath ver..