본문 바로가기

컴퓨터이야기

(78)
Adam optimizer 적응형 모멘트 추정 (Adaptive Moment Estimation, Adam) 각 매개변수마다 맞춤 학습률을 계산하는 최적화 스케줄이다. Adadelta 와 RMSProp도 Adadelta 부분에서 첫번째 방정식에서 설명한 대로 이전 경사들의 제곱값의 감소 평균을 사용한다. 그렇지만 이전 경삿값의 감소 평균을 사용한다. SG와 SSG는 수학적으로 경사의 첫번째와 두번째 모멘트를 추정하는 것과 같아서 이 방식을 적응형 모멘트 추정이라고 한다. Adam 최적화에서는 3가지 초매개변수 기본학습률, 경사감소율, 경사제곱값의 감소율이 눈에 띈다. Adam은 최근 복합적인 딥러닝 모델을 훈련하는 데 성공적인 최적화 스케줄 중 하나이다.
[펌]디컨볼루션(Deconv. 합성곱 계층의 역) 이 계층은 입력 데이터를 공간적으로 확장하므로, 이미지를 생성하거나 재구성하는 것을 목표로 하는 모델에서 핵심적인 계층이다. CNN에서 convolution layer는 convolution을 통해서 feature map의 크기를 줄인다. 하지만 Deconvolution은 이와 반대로 feature map의 크기를 증가시키는 방식으로 동작한다. 1 각각의 픽셀 주위에 zero-padding을 추가한다. 2. 이렇게 padding이된 것에 convolution 연산을 한다.
무어의 법칙 2년마다 컴퓨터 처리 능력이 두배씩 증가한다
[펌] 민감도와 특이도 민감도 와 특이 도는 상태의 존재 여부를 보고하는 테스트의 정확성을 수학적으로 설명합니다. 조건이 충족되는 개인은 "긍정적"으로 간주되고 조건이 충족되지 않은 개인은 "부정적"으로 간주됩니다. 민감도 (진양성률)는 진정으로 양성인 것을 조건으로 하는 양성 테스트의 확률을 나타냅니다. 특이성 (진음성 비율)은 음성 테스트의 확률을 말하며, 진정으로 음성인 것을 조건으로 합니다. F-score 와의 차이점 정밀도(Precision) 란 모델이 True라고 분류한 것 중에서 실제 True인 것의 비율입니다. 재현율(Recall) 이란 실제 True인 것 중에서 모델이 True라고 예측한 것의 비율입니다. 결론적으로 Recall = Sensitivity 랑 같군요. Accuracy랑 Precision이랑은 분모..
편집거리 알고리즘 Levenshtein Distance(Edit Distance Algorithm) [[펌]https://madplay.github.io/post/levenshtein-distance-edit-distance 편집거리 알고리즘 Levenshtein Distance(Edit Distance Algorithm) 문자열 간의 유사도를 알아내는 편집거리 알고리즘을 살펴보자. madplay.github.io 러시아 과학자 블라디미르 리벤슈테인(Vladimir Levenshtein)가 고안한 알고리즘입니다. 편집 거리(Edit Distance) 라는 이름으로도 불립니다. Levenshtein Distance는 두 개의 문자열 A, B가 주어졌을 때 두 문자열이 얼마나 유사한 지를 알아낼 수 있는 알고리즘입니다. 그러니까, 문자열 A가 문자열 B와 같아지기 위해서는 몇 번의 연산을 진행해야 하는 지..
valence 원자가, 혹은 결합의 의미 [펌] https://blog.daum.net/shintc200/184 Valence 1. 원자가(價), 2.수가(數價) ((염색체 등이 결합하는)) Valence라는 용어는 1935년 쿠르트 레빈(Kurt Lewin)의 저서에서 독일어 Valenz를 번역하여 영어에 도입한 것이다. Valenz는 "엮이다(binding)"라는 뜻이다. 문법 용어로는 한 단어가 의미론적 통사론적으로 다른 단어와 연결되는 능력, 특히 한 동사가 여러 주어와 목적어 등을 가지고 완벽한 하나의 문장을 만드는 능력을 의미한다. 자연과학에서는 원자가 다른 원자와 결합하는 기제를 설명하는 데 사용되며 이때는 한국어로 "원자가(原子價)"라고 번역한다. 'val, vail, vale'은 strong, worth, well이라는 개념입니..
plot_model The first step is to define the discriminator model. The model must take a sample image from our dataset as input and output a classification prediction as to whether the sample is real or fake. This is a binary classification problem. Inputs: Image with three color channel and 32×32 pixels in size. Outputs: Binary classification, likelihood the sample is real (or fake). plot_model 을 위해서는 아래 라이브..
CIFAR-10 CIFAR is an acronym that stands for the Canadian Institute For Advanced Research and the CIFAR-10 dataset was developed along with the CIFAR-100 dataset (covered in the next section) by researchers at the CIFAR institute. The dataset is comprised of 60,000 32×32 pixel color photographs of objects from 10 classes, such as frogs, birds, cats, ships, airplanes, etc.