CV・NLPハマりどころメモ

画像認識と自然言語処理を研究する上でうまくいかなかったことと,その対策をまとめる自分用のメモが中心.

複数のCSVを一つの表にまとめる[Python][Pandas]

hogeというフォルダの中に複数のCSVが配置されているとき、

以下のコードで複数のCSVを一つのDataFrame(表)としてまとめることが可能

from glob import glob

import pandas as pd

 

csv_files = glob("hoge/*.csv")

df = pd.concat([pd.read_csv(i) for i in csv_files])

やってることは、まずglobによってファイルパスのリスト化し、pd.read_csvと内包表記を組み合わせてDataFrameのリストを作る。

最後にpd.concatに先ほどのDataFrameのリストを入力すれば完成。