[Stata] 초보자를 위한 데이터 전처리부터 회귀분석까지 정리
·
Concept Notes/Statistics & Stata
Stata를 처음 배울 때, 명령어 하나하나는 이해가 되더라도 막상 do-file 전체를 보면 "이 코드가 지금 무슨 흐름으로 돌아가는 거지?" 싶을 때가 있었습니다. use, rename, recode, gen, replace 정도는 알아도 전처리 파일을 만들고, 여러 데이터를 합치고, 분석용 변수를 새로 만들고, 회귀분석까지 이어지는 전체 흐름은 한 번에 잘 안들어왔었습니다. 이번 글에서는 특정 데이터셋 자체를 설명하기보다, Stata do-file에서 자주 등장하는 핵심 코드들을 초보자 눈높이에서 전반적으로 정리해보려고 합니다. 1. do-file의 시작: 작업 환경 정리Stata do-file은 보통 아래처럼 시작하면 됩니다.clear allset more offcd "C:\project\dat..
[Stata] Descriptive Statistics (codebook, tab, su, bysort)
·
Concept Notes/Statistics & Stata
오랜만에 stata에 대한 질문을 받아서 이렇게 관련 글을 작성해본다. 재학중일 때, 그리고 졸업 직후에는 spss, stata 설치부터 다양한 질문들을 받고 해결해주었었는데 정말 오랜만이다. descriptive statistics를 볼 때, 강력한 명령어가 있으니... 그것은 바로 bysort 이다. 패널데이터분석에서 패널회귀분석, DID 등 고급분석이 중요하겠지만, 그래도 논문 작성에서 빠질 수 없는 것이 바로 기술통계(descriptive statistics)에 관한 표 정리 아닌가. 이때 이 명령어가 빛을 발한다. 오늘은 다루는 김에 codebook, tabulate(tab), summarize(su)까지 다뤄보겠다. 이것을 마스터하고 응용하면, STATA에서 결과에 원하는 옵션을 주어 출력하..
Python vs SPSS vs Stata, 무엇을 배워야 할까?
·
Concept Notes/Statistics & Stata
데이터 분석을 공부하려고 하면 꼭 한 번은 이런 고민을 하게 된다.특히 통계를 배우는 대학생, 대학원생이라면 꼭 한 번은 이런 고민을 하게 되는 것 같다. "Python을 배워야 할까?""SPSS가 더 쉬운가?""STATA는 또 뭐가 다른 걸까?" 이 외에도 SPSS Process Macro, AMOS, Mplus 등의 다양한 도구가 있어서 어떤 것을 선택할지 알아볼수록 고민이 된다. 나 역시 비슷한 고민을 했었기에 정리를 해보게 되었다.결론부터 말하면, 어떤 도구가 더 좋다기보다는 '목적에 따라 선택이 달라진다는 것'이다. 1. Python - 실무와 가장 가까운 선택요즘 데이터 분석이나 AI를 이야기 할 때 가장 많이 등장하는 언어가 바로 Python이다.Python은 단순한 통계 프로그램이 아니라프..