[파이썬 텍스트 가공] 그레이 아나토미 메러디스의 대사만 모으기

2021. 4. 22. 14:39·Python & SQL/Python Practice

1. 구글에서 grey's anatomy script 로 검색하여 대본찾기

( https://greysanatomy.fandom.com/wiki/A_Hard_Day%27s_Night/Transcript )

 

 

2. 전체 복사하여 텍스트 파일에 붙여넣기 및 저장

 

GA101.txt
0.04MB

 

 

3. 다음과 같이 Meredith: 대사만 추출

(상세히 달아 놓은 주석 참고)

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# 사용할 모듈 임포트
import os, re, codecs
 
# GA101.txt 파일을 저장한 폴더로 이동
os.chdir(r'C:\Users\jieun\Desktop\scripts')
 
# 텍스트 파일을 불러와 객체 f에 저장 후 객체 f를 읽기 모드로 열어서 scipt101이라는 객체에 저장
f = codecs.open('GA101.txt', 'r', encoding = 'utf-8')
script101 = f.read()
 
# 'Meredith:' 다음 아무 문자나 반복되는(.+) 패턴을 script101에서 찾아 리스트로 변환 
Line = re.findall(r'Meredith:.+', script101)
 
print(Line [:3])  # 3줄만 확인
 
f.close() 
 
# 리스트로 저장한 메러디스의 대사를 텍스트 파일로 저장
f = open('meredith.txt', 'w', encoding = 'utf-8')
 
# 객체 meredith 생성
meredith = ''
 
# Line 리스트의 모든 원소를 가져와 meredith 문자열에 추가
for i in Line:
    meredith += i + '\n'  # 가독성을 위해 줄바꿈 \n
    
f.write(meredith)
 
f.close()
Colored by Color Scripter
cs

 

* 26번 줄의 \는 백슬래시(\)다.

 

 

4. 결과

 

meredith.txt
0.01MB

 

'Python & SQL > Python Practice' 카테고리의 다른 글

단 10줄로 실행하는 나만의 챗봇 만들기 (feat. 하버드 CS50)  (0) 2026.02.14
[파이썬] 네이버 뉴스 기사 크롤링(제목, URL)  (0) 2021.05.07
서울시 자치구별 인구 분포 및 스타벅스 분포  (5) 2021.04.09
파이썬 실행 파일 만들기 (convert .py to .exe)  (2) 2021.04.06
기상청 공공데이터로 내 생일 기온 변화 그래프 그리기(feat. 주피터 노트북)  (0) 2021.03.31
'Python & SQL/Python Practice' 카테고리의 다른 글
  • 단 10줄로 실행하는 나만의 챗봇 만들기 (feat. 하버드 CS50)
  • [파이썬] 네이버 뉴스 기사 크롤링(제목, URL)
  • 서울시 자치구별 인구 분포 및 스타벅스 분포
  • 파이썬 실행 파일 만들기 (convert .py to .exe)
J. Son
J. Son
Petit à petit l'oiseau fait son nid.
  • J. Son
    Steady Study Log
    J. Son
  • 전체
    오늘
    어제
    • 분류 전체보기 (170) N
      • Python & SQL (63)
        • Python Basics (21)
        • Python Problems (23)
        • Python Practice (11)
        • MySQL (1)
        • Git & GitHub (7)
      • ML & DL (7) N
      • Projects (5)
        • Project Portfolio (5)
      • AI Camp (4)
        • Camp Reflection (4)
      • Concept Notes (6)
        • Statistics & Stata (4)
        • Mathematics (2)
      • Archive (84)
        • Java (24)
        • R (1)
        • Languages (49)
        • Miscellaneous (10)
  • 블로그 메뉴

    • 홈
    • 방명록
  • 링크

    • GitHub
    • WikiDocs
  • 공지사항

  • 인기 글

  • 태그

    MySQL
    점프투파이썬 연습문제
    어린왕자 프랑스어
    GIT
    streamlit
    파이썬
    머신러닝
    자바
    Le Petit Prince
    점프투파이썬 연습문제 풀이
    불어 공부
    Python
    python streamlit
    프랑스어 공부
    맥 git
    passe compose
    share.streamlit.io
    불어 관계대명사
    객체
    파이썬 문제
    초보자를 위한 파이썬 300제
    파이썬 크롤링
    Stata
    machine learning
    어린왕자 불어
    프로젝트 오일러
    python problem
    복합과거
    Github
    파이썬 streamlit
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
J. Son
[파이썬 텍스트 가공] 그레이 아나토미 메러디스의 대사만 모으기
상단으로

티스토리툴바