본문 바로가기

분류 전체보기

(1412)
2024년 1월 5일 1월 첫째날이 아닌 바로 오늘이 2024년의 시작이다. 연말연초 제주도 여행으로 잔뜩 먹고 마시고 흥취에 젖어 다시 새롭게 시작하는데 시간이 걸렸다. 놀고 먹는 일에는 관성이 있나보다. 한번에 따악 하고 멈춰지지 않는다. 갈 때까지 가야만 이성이 나를 붙잡는다. 2024년은 욕망을 다스리는 한해가 되도록 해보자. 도대체 내가 어떤 욕구를 갈망하였는지, 그것이 어떤 의미였는지 생각해보아야 한다. 이것저것 더 덜어내는 삶을 살아보련다. 냉장고도 비우고, 몸도 비우고, 마음도 비우고... 대단한 일을 계획하지 말자. 소소한 소일거리와 행복을 추구하자. 올해의 키워드는 비움이다. 몸도 마음도 사람도 비우자.
DTM DTM은 "Document-Term Matrix"의 약자입니다. Document-Term Matrix는 문서와 단어 간의 관계를 나타내는 행렬입니다. 이 매트릭스는 행이 문서를 나타내고 열이 단어를 나타내며, 각 원소는 해당 단어의 문서 내 등장 빈도수를 나타냅니다. DTM은 자연어 처리와 텍스트 마이닝에서 텍스트 데이터를 수치적으로 표현하는 일반적인 방법 중 하나입니다.
petition petition (n.) 14세기 중반, petiocioun, "특히 신에게 하느님에게 기도나 간청"을 뜻하는 말로, 앵글로-프랑스어 (14세기 초)에서 유래한 것으로, 옛 프랑스어 peticion "요청, 간청" (12세기, 현대 프랑스어 pétition)에서 유래하였으며, 직접적으로 라틴어 petitionem (주격형 petitio) "때리기, 찌르기, 공격, 목표; 찾기, 탐색"에서 파생된 법률에서는 "청구, 소송"을 뜻하는 동작 명사로, 과거 분사 형태의 어간 petere 에서 유래하였습니다. "찾아가다, 공격하다; 찾다, 노력하다; 청하다, 간청하다, 요청하다; 가져오다; 유래하다; 요구하다, 필요로 하다"를 뜻하는 PIE 어근 *pet- 에서 유래하였습니다. 의미로는 "상급자에게 공식적으로 작..
메타학습 https://www.aitimes.com/news/articleView.html?idxno=136179
[펌]지프의 법칙 지프의 법칙에 따르면 어떠한 자연어 말뭉치 표현에 나타나는 단어들을 그 사용 빈도가 높은 순서대로 나열하였을 때, 모든 단어의 사용 빈도는 해당 단어의 순위에 반비례한다. 따라서 가장 사용 빈도가 높은 단어는 두 번째 단어보다 빈도가 약 두 배 높으며, 세 번째 단어보다는 빈도가 세 배 높다. 예를 들어, 브라운 대학교 현대 미국 영어 표준 말뭉치의 경우, 가장 사용 빈도가 높은 단어는 영어 정관사 “the”이며 전체 문서에서 7%의 빈도(약 백만 개 남짓의 전체 사용 단어 중 69,971회)를 차지한다. 두 번째로 사용 빈도가 높은 단어는 “of”로 약 3.5% 남짓(36,411회)한 빈도를 차지하며, 세 번째로 사용 빈도가 높은 단어는 “and”(28,852회)로, 지프의 법칙에 정확히 들어 맞는다...
파이썬에서 정규식을 지원하는 라이브러리 re import re re.findall("[a-zA-Z0-9]", "How are you?") 이렇게 쓰는데는 줄임 표현인 \w 가 있다! re.findall("[\w]", "How are you?") \w에는 공백이 포함되지 않는다. 이를 이용하면 공백이나 쉼표 등으로 구분되는 단어들을 찾아낼 수 있다. "[\w]+" +가 1번 이상 반복을, {2,4}를 이용하면 횟수 지정 가능 [\w']+ 와 [\w]+ 차이 from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer("[\w']+") #regular expression(정규식)을 이용한 tokenizer #단어단위로 tokenize \w:문자나 숫자를 의미 즉 문자나 숫자 혹은 '가 반..
pytorch 설치하기 역시나 하나를 얻으면 하나를 잃게 마련이다. torch 모듈이 제대로 동작하지 않는다. torch는 찾아보니 CUDA 12.2버전을 지원하는 라이브러리가 없다. 다시 다운그레이드 해야겠다. https://pytorch.org/get-started/locally/ Start Locally Start Locally pytorch.org 이걸 실행하기 위해 CUDA 버전을 12.1로 내려보자. nvcc --version nvidia-smi 두개의 정보가 달라졌지만 텐서플로우와 파이토치 잘 동작한다.
CUDA 설치하기 1. https://developer.nvidia.com/cuda-toolkit-archive CUDA Toolkit Archive Previous releases of the CUDA Toolkit, GPU Computing SDK, documentation and developer drivers can be found using the links below. Please select the release you want from the list below, and be sure to check www.nvidia.com/drivers for more recent production developer.nvidia.com NVIDIA 버전에서 확인했으니, 최신 버전으로 12.2로 업그레이드 해보자 Cha..