[Stata] 초보자를 위한 데이터 전처리부터 회귀분석까지 정리
·
Concept Notes/Statistics & Stata
Stata를 처음 배울 때, 명령어 하나하나는 이해가 되더라도 막상 do-file 전체를 보면 "이 코드가 지금 무슨 흐름으로 돌아가는 거지?" 싶을 때가 있었습니다. use, rename, recode, gen, replace 정도는 알아도 전처리 파일을 만들고, 여러 데이터를 합치고, 분석용 변수를 새로 만들고, 회귀분석까지 이어지는 전체 흐름은 한 번에 잘 안들어왔었습니다. 이번 글에서는 특정 데이터셋 자체를 설명하기보다, Stata do-file에서 자주 등장하는 핵심 코드들을 초보자 눈높이에서 전반적으로 정리해보려고 합니다. 1. do-file의 시작: 작업 환경 정리Stata do-file은 보통 아래처럼 시작하면 됩니다.clear allset more offcd "C:\project\dat..
[Stata] Descriptive Statistics (codebook, tab, su, bysort)
·
Concept Notes/Statistics & Stata
오랜만에 stata에 대한 질문을 받아서 이렇게 관련 글을 작성해본다. 재학중일 때, 그리고 졸업 직후에는 spss, stata 설치부터 다양한 질문들을 받고 해결해주었었는데 정말 오랜만이다. descriptive statistics를 볼 때, 강력한 명령어가 있으니... 그것은 바로 bysort 이다. 패널데이터분석에서 패널회귀분석, DID 등 고급분석이 중요하겠지만, 그래도 논문 작성에서 빠질 수 없는 것이 바로 기술통계(descriptive statistics)에 관한 표 정리 아닌가. 이때 이 명령어가 빛을 발한다. 오늘은 다루는 김에 codebook, tabulate(tab), summarize(su)까지 다뤄보겠다. 이것을 마스터하고 응용하면, STATA에서 결과에 원하는 옵션을 주어 출력하..
[수학] 기본 개념 정리
·
Concept Notes/Mathematics
⚠️ 수식이 들어가 있어 모바일에서는 코드로 보일 수 있습니다. PC로 보시길 권장합니다. [1] 숫자 & 지수 ・ 로그 기초지수가 '밑을 몇 번 곱해야 이 숫자가 되는가'를 나타낸다면, 로그는 그 지수(거듭제곱 횟수) 자체를 구하는 역연산입니다.$a^x = N$ 이라는 지수식은 로그 정의에 의해 $log_a N = x$로 변환되며, 이때 밑($a$)은 1이 아닌 양수여야 합니다.밑이 같은 지수끼리의 곱셈은 지수의 덧셈($a^m * a^n = a^{m+n}$)이 되고, 나눗셈은 지수의 뺄셈이 됩니다.로그의 진수끼리 곱해져 있으면 로그의 합($log_a{MN} = log_a M + log_a N$)으로 분리할 수 있어 큰 수의 계산을 돕습니다.로그는 밑변환 공식 ($log_a b = \frac{log_c ..
<박사가 사랑한 수식>, 그리고 AI 시대를 관통하는 수학의 본질
·
Concept Notes/Mathematics
오늘 지수와 로그, 그리고 자연로그의 개념을 다시 정리하다가 문득 2006년의 기억이 떠올랐습니다.당시 한국에서 개봉했던 일본영화 을 보고, 그 여운에 이끌려 소설까지 단숨에 읽어 내려갔던 10대의 제 모습입니다. 당시 저에게 수학은 단순히 시험을 위한 도구가 아니었고, 교과서와 문제집 외의 자료들을 찾아보는 것이 취미였던 저에게, 이 작품은 수학이 얼마나 인간적이고 따뜻할 수 있는지 알려준 이정표 같았습니다. 🖋️ 80분의 기억, 그리고 영원한 수식 소설 속 박사는 사고로 기억이 80분밖에 유지되지 않습니다. 하지만 그는 숫자를 통해 세상과 소통합니다.아들(루트)의 생일(28)에서 '완전수'의 귀함을 발견하고, 자신의 학위번호(284)와 가사도우미의 시계 번호(220)에서 서로를 완성하는 '우애수..
Python vs SPSS vs Stata, 무엇을 배워야 할까?
·
Concept Notes/Statistics & Stata
데이터 분석을 공부하려고 하면 꼭 한 번은 이런 고민을 하게 된다.특히 통계를 배우는 대학생, 대학원생이라면 꼭 한 번은 이런 고민을 하게 되는 것 같다. "Python을 배워야 할까?""SPSS가 더 쉬운가?""STATA는 또 뭐가 다른 걸까?" 이 외에도 SPSS Process Macro, AMOS, Mplus 등의 다양한 도구가 있어서 어떤 것을 선택할지 알아볼수록 고민이 된다. 나 역시 비슷한 고민을 했었기에 정리를 해보게 되었다.결론부터 말하면, 어떤 도구가 더 좋다기보다는 '목적에 따라 선택이 달라진다는 것'이다. 1. Python - 실무와 가장 가까운 선택요즘 데이터 분석이나 AI를 이야기 할 때 가장 많이 등장하는 언어가 바로 Python이다.Python은 단순한 통계 프로그램이 아니라프..
[Stata] 한글 Label 깨짐, 인코딩 하기
·
Concept Notes/Statistics & Stata
(저는 석사학위논문 툴로 STATA를 사용했고, 다양한 국내외 패널데이터를 너무 열심히 살펴보았기 때문에 정형데이터와 STATA 코딩 관련 질문 환영합니다.) 📊 [스테이-타] 혹은 [스타타]라고 발음하는 STATA.나의 주심 교수님과 부심 교수님은 미국의 같은 대학원을 졸업하셨음에도 불구하고 다르게 발음하셨었다는 기억 ; STATA는 유료 프로그램이지만 검색을 잘하면 무료로 구할 수가 있기에 ... 통계 툴로 추천하는 바입니다. (R보다 쉽고, 그래프가 깔끔하고, Windows 용 - Linux 용 - MacOS 용이 모두 존재한다는 장점) GUI기반으로 명령문으로도 구현할 수 있는 SPSS가 보편적이지만, 저는 둘다 써 본 결과 오히려 STATA가 더 맘에 들었습니다. 하지만 만약 다시 통계 프로그..