Python / Pandas / 엑셀 파일들을 CSV로 변환하고 병합하는 방법

시트가 하나인 엑셀 파일을 CSV로 변환

import pandas as pd

df = pd.read_excel( "excel_1.xlsx" )
df.to_csv(
  "csv_1.csv",
  index = False,
  encoding = "utf-8-sig",
)

시트가 여러 개인 엑셀 파일을 CSV로 변환

import pandas as pd

xlsx = pd.ExcelFile( "excel_2.xlsx" )
dfs = []

for sheet in xlsx.sheet_names:
  df = pd.read_excel( xlsx, sheet_name = sheet )
  dfs.append( df )

result = pd.concat( dfs )
result.to_csv( "csv_2.csv", index = False, encoding = "utf-8-sig" )

폴더 안의 모든 엑셀 파일을 CSV로 변환

import pandas as pd
import glob

for excel_file in glob.glob( "*.xlsx" ) :
  print( excel_file )
  xlsx = pd.ExcelFile( excel_file )
  dfs = []
  for sheet in xlsx.sheet_names:
    df = pd.read_excel(
      xlsx,
      sheet_name = sheet
    )
    dfs.append( df )
  result = pd.concat( dfs )
  result.to_csv(
    excel_file + ".csv",
    index = False,
    encoding = "utf-8-sig"
  )

두 개의 CSV 파일 합치기

import pandas as pd

df1 = pd.read_csv( "csv_1.csv" )
df2 = pd.read_csv( "csv_2.csv" )

result = pd.concat(
  [ df1, df2 ],
  ignore_index = True
)
result.to_csv(
  "merge_1.csv",
  index = False
)

폴더 안의 모든 CSV 파일 합치기

import pandas as pd
import glob

files = glob.glob( "*.csv" )
df = pd.concat(
  [ pd.read_csv( f ) for f in files ],
  ignore_index = True
)

df.to_csv(
  "merge_2.csv",
  index = False
)

 

같은 카테고리의 다른 글
Python / Visual Studio Code 개발 환경 만들기

Python / Visual Studio Code 개발 환경 만들기

파이썬 개발을 위한 도구는 여러 가지가 있습니다. Visual Studio Code도 그 중 하나입니다. VS Code에 Python 확장 기능을 설치하고, Hello World를 출력해보겠습니다.

Python / 설치 / 윈도우에 설치하기

Python / 설치 / 윈도우에 설치하기

Windows를 OS로 하는 컴퓨터에 Python을 설치하는 방법입니다.

Python / Pandas / 엑셀 파일들을 CSV로 변환하고 병합하는 방법

시트가 하나인 엑셀 파일을 CSV로 변환 import pandas as pd df = pd.read_excel( "excel_1.xlsx" ) df.to_csv( "csv_1.csv", index = False, encoding = "utf-8-sig", ) 시트가 여러 개인 엑셀 파일을 CSV로 변환 import pandas as pd xlsx = pd.ExcelFile( "excel_2.xlsx" ) dfs = for sheet in xlsx.sheet_names: df = pd.read_excel( xlsx, sheet_name = sheet ) ...

Python / PIP 사용법

Python / PIP 사용법

pip는 파이썬으로 작성된 패키지 소프트웨어를 관리하는 패키지 관리 시스템입니다. 파이썬 2.7.9 이후 버전과 파이썬 3.4 이후 버전은 pip를 기본적으로 포함하고 있습니다. pip는 에서 실행할 수 있습니다.