분류 전체보기124 [리눅스 명령어][파일 처리] 디렉터리 조회(ls) ls의 여러가지 옵션들 > ls [옵션][디렉터리[파일]...] [옵션] 설명 -a 일반 파일(디렉토리) 외에 *닷 파일(dotfile)도 표시 (기본 'ls' 명령어에선느 닷파일을 표시하지 않음) -d 디렉터리를 인수로 지정했을 때 디렉터리 내부를 표시하는 것이 아니라 다른 파일과 마찬가지로 디렉터리명을 표시 -F 분류기호를 추가하여 표시 ① / : 디렉터리 ② @ : 심볼릭 링크 ③ * : 실행 가능한 파일 -l 최종 업데이트 일자, 파일 소유자, 권한 등을 표시 -t 파일을 알파벳 순서가 아니라 최근에 갱신한 순서대로 표시 -R 서브 디렉터리 안에 있는 파일도 모두 표시 -h -l 옵션과 함께 지정하면, 파일크기를 읽기 쉬운 단위로 표시 (K-킬로, M-메가, G-기가) -1 한줄에 하나씩 표시 -.. 2021. 8. 14. [알고리즘] 다이나믹 프로그래밍(Dynamic Programming) 오늘은 다이나믹 프로그래밍(Dynamic Programming)에 대해서 알아보도록 하겠습니다. 이름이 너무 무섭게 생겼기 때문에, 마음의 준비를 하고 알고리즘 공부를 시작했는데요, 기초 이론은 생각보다 빡세지 않았고, '이게 다인가?' 하는 물음에 대해서 나무위키에서 시원하게 답이 나와있어서 좋았습니다 :) 1. 다이나믹 프로그래밍(Dynamic Programming)이란? : 다이나믹 프로그래밍 알고리즘은 응용 수학자 리차드 벨만(Richard Bellman)이 1953년에 고안한 알고리즘으로, 리차드 벨만은 그전에 최단 거리를 구할때 사용하는 벨만-포드(Bellman-Ford)알고리즘을 고안하고, 머신러닝 분야의 '차원의 저주(Curse of Dimensionality)라는 이론을 만든 저명한 수학.. 2021. 7. 25. [알고리즘][트리] 이진트리(Tree Diagram) - Python 1. 트리 구조 1.1 트리의 정의 - 트리는 계층형 트리 구조를 시물레이션하는 추상형 자료형(ADT)으로, 루트 값과 부모-자식 관계의 서브트리로 구성되며, 서로 연결된 노드의 집합입니다. - 트리의 중요한 속성은 '재귀로 정의된(Recursively Defined) 자기 참조(Self Refrential) 자료구조' 라는 점입니다. 풀어 설명하자면, 트리의 자식도 트리이고 그 자식의 자식도 트리입니다. 즉, 트리는 여러개의 서브트리로 구성되어있습니다. - 보통 데이터베이스는 내부적으로 대용량 데이터 처리에 적합하도록 트리 자료구조를 이용하여 항상 데이터가 정렬되어 있습니다. 탐색에 빠르고 용이한 트리구조로 되어있어서, 데이터가 많아도 탐색 속도가 빠릅니다. 1.1 트리의 특징 - "트리는 순환 구조(.. 2021. 7. 17. [알고리즘][검색] 이진 탐색(Binary Search) - Python 1. 이진 탐색(Binary Search) 이란? - [나무위키] 이진 탐색(Binary Search)는 오름차순으로 정렬된 리스트를 같은 크기의 두 부분 리스트로 나누고 필요한 부분에서만 탐색하도록 제한하여 원하는 원소를 찾는 알고리즘입니다. 리스트의 중간 부분에 찾는 원소가 있는지 확인하고, 없으면 위쪽에 있는지 아래쪽에 있는지 판단하여 맨 앞부터 검색하거나 중간부터 검색합니다. - 대학생때 많이들 하는 '업다운' 게임과 같은 방식입니다! 2. 이진 탐색의 파이썬 코드 2.1 재귀함수로 구현한 이진 탐색 def binary_search(array, target, start, end): if start > end: return None mid = (start + end) // 2 if array[mid.. 2021. 7. 16. [알고리즘][정렬] ③ 퀵 정렬 (Quick Sort) - Python 2021.07.10 - [알고리즘(Algorithm)] - [알고리즘][정렬] ① 선택 정렬 (Selection Sort) - Python [알고리즘][정렬] ① 선택 정렬 (Selection Sort) - Python 이 글은 '이것이 코딩테스트다(나동빈 저)'를 공부하면서 정리한 글입니다. 1. 정렬(Sorting)이란? - 정렬은 '특정한 기준에 따라서 데이터를 순서대로 나열하는 것'을 말합니다. 흔히 우리가 알고있 hyen4110.tistory.com 2021.07.10 - [알고리즘(Algorithm)] - [알고리즘][정렬] ② 삽입 정렬 (Insertion Sort) - Python [알고리즘][정렬] ② 삽입 정렬 (Insertion Sort) - Python hyen4110.tistory.. 2021. 7. 11. [알고리즘][정렬] ② 삽입 정렬 (Insertion Sort) - Python 2021.07.10 - [알고리즘(Algorithm)] - [알고리즘][정렬] ① 선택 정렬 (Selection Sort) - Python [알고리즘][정렬] ① 선택 정렬 (Selection Sort) - Python 이 글은 '이것이 코딩테스트다(나동빈 저)'를 공부하면서 정리한 글입니다. 1. 정렬(Sorting)이란? - 정렬은 '특정한 기준에 따라서 데이터를 순서대로 나열하는 것'을 말합니다. 흔히 우리가 알고있 hyen4110.tistory.com 이전 글에서는 선택정렬(Selection Sort)에 대해서 알아보았습니다. 선택정렬은 가장 원시적인 방법으로 복잡도가 O(N²)에 해당하여 데이터가 늘어날수록 느려지는 단점이 있었습니다. 이번 글에서는 선택정렬처럼 직관적으로 이해하기 쉬우면서 좀 .. 2021. 7. 10. [알고리즘][정렬] ① 선택 정렬 (Selection Sort) - Python 이 글은 '이것이 코딩테스트다(나동빈 저)'를 공부하면서 정리한 글입니다. 1. 정렬(Sorting)이란? - 정렬은 '특정한 기준에 따라서 데이터를 순서대로 나열하는 것'을 말합니다. 흔히 우리가 알고있는 '오름차순', '내림차순'이 이에 해당됩니다. - 정렬 알고리즘은 단순히 데이터를 정렬하는 것을 넘어 '이진탐색(Binary Search)'를 가능하게 하는 일명 전처리 단계와 같습니다. - 정렬 알고리즘에는 많은 종류가 존재하지만, 코딩테스트에 많이 사용되는 대표 4인방(선택 정렬, 삽입 정렬, 퀵 정렬, 계수정렬)만 다루도록 하겠습니다. 2. 선택 정렬(Selection Sort) 2.1 선택 정렬의 원리 - 선택 정렬(Selection Sort)에서는, 데이터가 무작위로 있을 때에 가장 작은 데.. 2021. 7. 10. [통계] 분산분석(ANOVA) 1.분산분석이란? - 분산 분석(Analysis of variance, ANOVA, 또는 변량 분석)은 통계학에서 두 개 이상 다수의 집단을 서로 비교하고자 할 때 집단 내의 분산, 총평균 그리고 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법입니다(출처: 위키피디아) 2. 일원분산분석(One-way ANOVA) - 일원 배치법(One-way layout)은 특성값에 대한 한 종류의 변수의 영향을 조사할 때 사용하는 분산 분석법입니다. 변수의 각 수준이 처리(treatment)가 되며 2개의 처리 효과를 비교할 때는 t-검정을, 3개 이상의 처리 효과를 비교할 때는 ANOVA를 사용합니다. - 즉, 일원 분산분석은 3개 이상의 모평균 간 차.. 2021. 6. 13. [통계] 다중선형회귀(Multivariable Linear Regression) - 이전 글 - 1) 2021.06.13 - [통계 분석(Statistics)] - [통계]선형회귀분석_회귀계수의 추정과 T검정 2) 2021.06.13 - [통계 분석(Statistics)] - [통계] 선형회귀분석_결정계수와 분산분석(ANOVA) 앞의 글들에서는 단순선형회귀, 즉 독립변수가 1개인 경우만 살펴보았습니다. 하지만 일반적으로 독립변수가 여러개인 상황이 일반적이죠. 오늘 글에서는 독립변수가 2개 이상일 경우, 어떻게 회귀계수를 추정하고 검정하는지 살펴보도록하겠습니다. 1. 다중회귀분석 1.1 독립변수가 2개인 경우 1) 회귀계수의 점추정 2) 회귀계수의 표준오차 - X의 변량과 회귀계수의 표준오차는 서로 반비례관계에 있음을 확인할 수 있다. = X의 변량을 크게 함으로써, 회귀계수의 표준오.. 2021. 6. 13. [통계] 선형회귀분석_결정계수와 F검정 이 글에서는 김성범 교수님의 강의자료를 일부 참고하였습니다. 공부를 하면서 찾아본 강의 중 가장 흐름이 이해가 잘되고 자료가 깔끔하여서 강력히 추천드립니다! :D https://www.youtube.com/watch?v=ClKeKeNz7RM 지난 선형회귀분석 설명에서 결정계수 R2에 대해서 간단히 살펴보았습니다. 2021.05.23 - [통계 분석(Statistics)] - [통계] 선형회귀분석(Linear Regression) [통계 기초] 선형회귀분석(Linear Regression) 2021.05.23 - [통계 분석(Statistics)] - [통계 기초] 상관관계(Correlation Coefficient) [통계 기초] 상관관계(Correlation Coefficient) 1. 상관관계(Cor.. 2021. 6. 13. [통계] 선형회귀분석_회귀계수 추정과 T검정 지난 글에서는 선형회귀분석에 대해서 살펴보면서, 회귀식은 어떻게 추정하는지 그리고 그렇게 추정된 회귀모형이 얼마나 설명력이 있는지 결정계수 R2를 가지고 적합도를 판단할 수있음을 보았습니다. 2021.05.23 - [통계 분석(Statistics)] - [통계 기초] 선형회귀분석(Linear Regression) [통계 기초] 선형회귀분석(Linear Regression) 2021.05.23 - [통계 분석(Statistics)] - [통계 기초] 상관관계(Correlation Coefficient) [통계 기초] 상관관계(Correlation Coefficient) 1. 상관관계(Correlation Coefficient) 1.1 상관관계란? - [의미] 상관.. hyen4110.tistory.com .. 2021. 6. 13. [NLP][논문리뷰] Transformer-XL: Attentive Language ModelsBeyond a Fixed-Length Context https://arxiv.org/pdf/1901.02860.pdf 오늘 소개할 Transformer XL은 ACL 2019에 발표된 논문으로, 기존의 Transformer 모델이 가지고 있는 ‘고정된 길이의 문맥(fixed-length context)'이라는 한계점을 개선하되 시간적인 일관성(temporal coherence)을 파괴하지 않는 선에서 새로운 아키텍처를 제시한 논문입니다. 이 논문의 저자는 유명한 언어모델인 XLNET과 정확히 동일한 저자들이 작성하였는데요, XLNET은 당시 2019년 20개 NLP task에서 bert를 넘어섰고, 18개 task에서 SOTA를 달성했습니다. XLNET의 프리퀄로 알려진 transformer-XL을 살펴보겠습니다. 1. 등장 배경 1) 언어모델에서의 오래.. 2021. 6. 9. [NLP][논문리뷰] XLNet: Generalized Autoregressive Pretrainingfor Language Understanding https://arxiv.org/pdf/1906.08237.pdf 최근 양방향 컨텍스트에 대한 모델링이 가능해짐과 함께, BERT와 같은 Denoising autoencoding 기반의 사전학습 방식은 Auto-regressive 언어 모델링 기반의 사전학습 방식보다 더 나은 성능을 달성하였습니다. 그러나 BERT의 경우 마스크로 입력값을 손상시켜 학습해야만 하는데, 이는 마스크 된 토큰들 간의 dependency를 반영하지 못하며, 또한 pretrain에 존재하는 [MASK] 심볼이 실제 데이터로 finetune할때는 존재하지 않는다는 문제도 존재합니다. 저자는 이러한 AR과 AE의 장단점을 고려한 Auto-regressive 사전훈련 방법인 XLNet을 제안하였습니다. (1) factorization.. 2021. 6. 9. [NLP][기초개념] 사전 훈련(Pre-training) 언어 모델 아래 사이트의 글들을 참고하여 이해한 개념을 정리하였으며, wikidocs의 내용을 주로 참고하고, 언어모델과 관련된 개념들은 wikidocs의 글을 요약 정리한점을 미리 말씀드립니다. https://wikidocs.net/108730 https://www.analyticsvidhya.com/blog/2017/06/transfer-learning-the-art-of-fine-tuning-a-pre-trained-model/ http://jalammar.github.io/illustrated-bert/ 1. 사전훈련이란? - NLP 분야에서 많이 등장하는, '사전 훈련(Pre-trianing)' 개념에 대해서 이해하기 쉽게 설명해보고자 합니다. - 사전 훈련이라는 개념은 NLP분야에만 한정된 것이 아니라 .. 2021. 5. 29. [NLP][논문리뷰] ALBERT: A lite BERT for self-supervised learning of language representations 이번 글에서는 구글과 도요타에서 작년 2020년 ICLR에 발표한 논문인 'ALBERT: A lite BERT for self-supervised learning of language representations'에 대해서 리뷰하도록 하겠습니다. ALBERT: A Lite BERT for Self-supervised Learning of Language Representations Increasing model size when pretraining natural language representations often results in improved performance on downstream tasks. However, at some point further model increases becom.. 2021. 5. 29. 이전 1 ··· 3 4 5 6 7 8 9 다음