[펌]유니그램 모델
unigram model간단히 설명하자면, 각 단어의 빈도 수를 세어서 전체 단어수로 나누어 준 것으로 확률 모델을 만드는 것이다. 확률론적 언어 모형¶확률론적 언어 모형(Probabilistic Language Model)은 mm개의 단어 w1,w2,…,wmw1,w2,…,wm 열(word sequence)이 주어졌을 때 문장으로써 성립될 확률 P(w1,w2,…,wm)P(w1,w2,…,wm) 을 출력함으로써 이 단어 열이 실제로 현실에서 사용될 수 있는 문장(sentence)인지를 판별하는 모형이다.이 확률은 각 단어의 확률과 단어들의 조건부 확률을 이용하여 다음과 같이 계산할 수 있다.P(w1,w2,…,wm)===P(w1,w2,…,wm−1)⋅P(wm|w1,w2,…,wm−1)P(w1,w2,…,wm−2)⋅..