전체 글88 [Git] 깃 기본편(2): 스테이징 영역, 커밋 (Staged, Commit, Status, Add, Log) Staging area 깃의 스테이징 영역은 매우 중요한 개념이다. 이전 글에서 우리는 local repository(로컬저장소)에서 했던 작업 내용들을 remote repository(원격저장소)에 반영을 해봤다. 한번 반영된 내용은 돌이키기가 어렵다. 그래서 그 중간에 스테이징 영역이라는 것이 존재한다. 쉽게 생각해서 배달되기 전 박스라고 생각하자. 어떤 내용물이든 집어넣을 수 있고 또 뺄 수 있다. 박스가 완성이 됐다면 원격 저장소로 넘기자. git에 관리되는 파일의 라이프사이클부터 보고 가자. 디렉토리의 파일은 Untracked와 Tracked 두 가지로 구분된다. 그리고 Tracked는 또 다시 Unmodified, Modifed, Staged로 구분된다. Untracked 파일은 Git이 팔로.. 2023. 1. 10. [Git] 깃 기본편(1): 로컬, 원격 저장소 연결하기 (repository, local, remote, origin, upstream) 개발자라면 Git을 사용해 보지 않은 사람은 있을지언정 들어보지 못한 사람은 없을 것이다. 코딩을 하는 데 있어 매우 편리한 도구 중 하나이기 때문이다. 그럼 Git(깃)이란 무엇인가? 깃은 버전 관리 도구 중 하나의 소프트웨어인데, 많은 유저로부터 가장 널리 쓰인다. 버전 관리 도구란 파일이나 디렉토리에 과거, 현재 작업내역을 관리하는 도구라고 이해하면 된다. 개발자들은 소스코드를 매번 새로 작성하고 업데이트 하고를 수십번 반복 해야하는 숙명인데, 과거 코드들이 어떻게 변경되어 왔는지 그리고 어떻게 변경할 것인지 등을 관리해주는 아주 유용한 도구이다. Git의 여러가지 장점이 있지만 대표적으로, 1. 분산 버전 관리이기 때문에 중앙 저장소가 날라가도 원상 복구가 가능하다. 로컬 저장소를 통해 중앙 저장.. 2023. 1. 10. FDP 합격 후기 및 시험공부 팁 (2) 이어서 시험 공부 팁에 대해 또 끄적여보겠다. 개개인마다 지식의 양과 공부를 하는 방법이 다 다르기에 내 것 또한 그냥 참고만 하면 좋을 것 같다. 앞 글에서 말했듯이 나는 어느 정도 지식이 있는 상태라고 판단했다. "어느 정도"를 어떻게 정량화해서 설명해야할지 모르겠지만, 굳이 예시를 들자면, 2장에서 Linear and logistic regression에서 회귀분석 및 Ridge, Lasso 등 다양한 주제가 나오는데, 여기서 Ridge, Lasso가 왜 필요한지, 어떤 차이점이 있는지 얼핏 기억나는 정도라고 보면 될 것 같다. 5장의 Neural networks and reinforcement learning의 경우에는 기본 개념만 알지 더 자세한 지식은 백지라고 간주하면 된다. 공부 시간으로 따.. 2022. 12. 2. FDP 합격 후기 및 시험공부 팁 (1) 오늘은 FDP라는 시험에 대해 좀 끄적여볼까 한다. 아직 국내에서는 많은 사람들에게 알려진 시험인 것 같진 않고 실제로 나 또한 시험 준비 전에 구글링을 해도 딱히 도움되는 정보가 많이 없었던 걸로 기억이 난다.. 시험을 준비하고 있거나 할지말지 고민하는 분들에게 조금이나마 도움이 됐으면 하는 바람으로 애기 재우고 오랜만에 블로그를 켰다ㅎ 우선, FDP란 Financial Data Professional, 금융 데이터 전문가라는 2019년에 신설된 국제공인 자격증이다. 그 외에 FDP 기관에 대한 배경이나 커뮤니티 등과 같은 그 외의 정보들은 홈페이지에 들어가면 자세히 나오니 생략할게요... (https://fdpinstitute.org/) 개인적으로 자격증에 크게 의미를 두지 않는 1인으로서 지금까지 .. 2022. 12. 2. [테린이 일기] 내가 테니스를 택한 이유 / 파주 운정 실내테니스, 바모스테니스 난 지금껏 워크 & 라이프의 발란스에서 상당 시간을 일에 양보해왔다. 이제 나도 나이가 점차 들다 보니 라이프에 시간을 조금씩 할애하기 시작하였고 그 중 하나가 운동과 스포츠다. 운동은 별다른 선택지가 많이 없어 흔히들 하는 헬스로 꾸준히 채워가는 중이다. 몸은 별볼일 없지만 나름 PT만 몇백회는 한 것 같다. 물론 지금도 하고 있고 내 나름의 몸에 대한 투자라고 생각한다. 몸 변화가 크게 없더라도 이 마저 안 했다면 허리 하나 정도는 부셔지지 않았을까 합리화를 하곤 한다. 두번째로 스포츠이다. 스포츠는 너무 많은 선택지가 존재한다. 주변 또래들이 많이들 하는 것을 간추려보자면 골프, 축구, 러닝 그리고 테니스이다. 축구와 러닝은 점차 나이가 들면서 하나 둘씩 접는 추세이다. 축구는 부상의 위험이 크고 .. 2022. 6. 20. [Python] 람다 관련 (apply, applymap) 안녕하세요~ 우주신 입니다. 저번 포스팅에 이어 lambda와 함께 자주 쓰이는 apply를 빠르게 살펴볼게요. 이전 포스팅: 람다 관련 (lambda, map) apply는 map과는 달리 series(row/column) 전체에 해당 함수를 적용 합니다. 예시부터 보면서 쉽게 이해해보죠. 먼저, 데이터는 sklearn에서 제공하는 datasets을 불러왔습니다. import pandas as pd import numpy as np from sklearn import datasets data = datsets.load_diabetes() 저희는 예시에 쓸 아무 데이터프레임 하나만 필요하니 아래와 같이 df로 정의하겠습니다. df = pd.DataFrame(data['data'], index=data['.. 2022. 4. 26. [Python] 람다 관련 (lambda, map) 안녕하세요~ 우주신 입니다. 오늘은 파이썬에 익숙치 않은 분들에게는 생소할 수도 있지만 한번 익히고 나면 자주 등장하는 lambda와 map 그리고 apply에 대해서 배워보겠습니다. 먼저 순차적으로 lambda부터 짚고 가보죠. 1. lambda 인자: 표현식 lambda x: f(x) 쉽게 생각하면 lambda는 function을 정의하는 방법 중 하나인데, 차이점은 한 줄로 표현하고 함수의 이름이 없다는 것 입니다. 예를 들어, 아래는 lambda를 통해 함수를 정의하고 인자로 2라는 값을 넣은 결과 입니다. f = (lambda x: x*2) f(2) 4 이를 다시 우리가 흔히 쓰는 function으로 바꿔서 표현하자면 아래와 같습니다. def f(x): return x*2 f(2) 4 그럼, 굳.. 2022. 4. 26. [Python] 회귀분석(Regression Analysis) [회귀식 추정, 회귀모형 검정, 적합도 파악] 안녕하세요~ 우주신 입니다. 저번 상관분석 포스팅에 이어 이번에는 회귀분석(Regression Analysis)에 대해 정리 해보겠습니다. 상관분석은 변수들이 서로 얼마나 밀접하게 직선적인 관계를 가지고 있는지를 분석하는 통계적 기법이며, (바로 이전 글에 자세히 다뤄봤으니 참고) 회귀분석은 한 개 또는 그 이상의 변수들(독립변수)에 대하여 다른 변수(종속변수) 사이의 관계를 수학적인 모형을 이용하여 설명하고 예측하는 분석기법 입니다. 쉽게 말하자면, 상관분석에서는 산점도의 점들의 분포를 통해 일정한 패턴을 확인한 후, 상관계수를 구하여 두 변수 간의 선형 관계를 알 수 있었습니다. 여기서 더 나아가, 이 일정한 패턴을 활용하여 무엇인가를 예측하는 분석을 회귀분석이라고 보시면 됩니다. 회귀분석 하면 괜히.. 2021. 8. 7. [Python] 상관분석(Correlation Analysis), [산점도, 공분산, 상관계수, 검정] 안녕하세요. 우주신 입니다. 약 3년만에 포스팅을 하네요... 일을 하다보니 포스팅을 꾸준히 못 하고 있습니다..ㅠ 오늘은 블로그에서 가장 조회수가 높은 '[R] 상관분석...' 글을 Python으로 빠르게 변환 해봤습니다. 이번 포스팅과 다음 포스팅에서는 상관분석과 회귀분석에 대해 정리해보겠습니다. 우리는 종종 어떤 두 사건 간의 연관성을 분석해야 할 경우가 많습니다. 둘 또는 그 이상의 변수들이 서로 관련성을 가지고 변화할 때 그 관계를 분석해야 하는데, 가장 잘 알려진 방법 중 하나가 상관분석과 회귀분석 입니다. 예를 들어, GDP와 기대수명 간의 관계, 키와 몸무게 간의 관계를 보자면, 각각 두 변수 간의 선형적 관계를 상관(Correlation)이라고 하며, 이러한 관계에 대한 분석을 상관분석(.. 2021. 3. 5. [C] Countsort:: 계수정렬 안녕하세요. 우주신 입니다. 이번 포스팅에서는 계수정렬(Count Sort)에 대해 알아보겠습니다. 앞선 포스팅에서의 삽입, 퀵, 힙 정렬 등의 방법은 정렬할 때 두 값을 비교하며 정렬을 했다.이를 Comparison Sort라고도 부르는데, 이와 반대로 계수정렬은 비교를 하지 않고 정렬을 하기 때문에 Non-Comparison Sort의 방법 중 하나이다. [4 1 3 4 3] 리스트를 정렬하면서 자세히 알아보자. 우선, 두 개의 리스트 B, C를 만들어준다. B는 A 리스트를 정렬하여 결과물을 넣어줄 리스트이다.C(Counting List)의 Index는 곧 A의 요소이고, C의 값은 A의 요소들의 갯수이다.예를 들어 A에 4가 총 몇 개 나온지는 C의 4번째 Index를 보면 알 수 있다. 그러므로.. 2018. 7. 28. [이집트/사파가] 스노쿨링 투어 후기 안녕하세요. 우주신 입니다. 이번에는 이집트 사파가(Safaga)에서 즐겼던 스노쿨링 투어에 대한 후기를 포스팅 하겠습니다. 저는 룩소르에서 하루를 보내고 푹 쉬고자 사파가에서 1박 2일 일정을 보냈습니다.본래 다합가서 스노쿨링을 하려 했으나 그 주변에서 테러가 발생해서 사파가로 선택 했네요.사파가는 이집트 오른쪽 끝에 홍해와 맞닿아 있는 도시 중 하나 입니다. 첫날은 그냥 해변가에서 수영하고 맥주 마시며 쉬었습니다.더치들은 아침, 점심, 저녁으로 맥주를 한잔씩 안 하면 현기증이 오기에 어김없이 맥주부터 시켰죠..ㅋ 비수기에 가서 사람이 없던지라 오히려 더 편히 쉬었던 것 같네요. 그렇게 하루를 푹 쉬고 호텔을 통해서 사파가 스노쿨링 투어를 예약 했어요.업체가 많지는 않아 가격이 다 비슷할거라 생각이 들.. 2018. 7. 23. [Python] Apriori algorithm:; 연관규칙분석 (2) 안녕하세요. 우주신 입니다. 저번 포스팅에 이어서 연관규칙 알고리즘의 Apriori 알고리즘에 대해 글을 쓰겠습니다. 저번 포스팅에서 연관규칙분석 개념 및 Apriori 알고리즘에 대해 알아봤으니,이번에는 파이썬 코드를 보며 한번 더 복습해보자.(지난 포스트의 지식을 다 안다는 전제하에 코드만 설명) 내가 테스트한 트랜잭션 데이터베이스(Transaction Database)는 아래와 같은 양식이다.각 줄이 itemset을 구분하며, 1번 itemset은 7번 item과 14번 item으로 구성되어 있다고 보면 된다. Apriori 알고리즘은 아래와 같은 순서로 진행된다.1. 트랜잭션 데이터베이스를 스캔하면서 1-빈번항목집합을 구한다.2. k-빈번항목집합을 대상으로 (k+1)-빈번항목집합을 구한다.- Se.. 2018. 7. 23. 이전 1 2 3 4 ··· 8 다음