반응형
MATLAB에서 사용하는 데이터 파일인 MAT 파일을 파이썬에서 사용하는 Dataframe으로 변경하는 방법에 대해 소개했습니다.
MAT 파일 Dataframe 변경 시 문제점
반응형
파이썬에서 MAT 파일을 읽고자 했지만, 구글링을 해도 찾기가 어려웠습니다. 별다른 라이브러리에 대한 포팅 없이 깔끔하고 쉽게 포팅하는 방법에 대해 기술했습니다.
개발 환경은 colab 기준이며, scipy가 필요하지만 colab 상에서 설치 되어 있기 때문에 별도의 라이브러리 설치는 필요가 없습니다.
아래 코드를 보면, MAT 파일을 읽은 후 파일 형태를 보면 dict 파일로 설정되어 있습니다. dict 파일 기준으로 dataframe.from_dict를 사용했지만, 에러가 발생됩니다.
MAT 파일 Dataframe 변경 방법
반응형
먼저 scipy에서 파일을 읽은 다음 아래의 코드를 따라가면 큰 이슈 없이 데이터프레임 로딩이 가능합니다. 코드를 설명드리면, dict 파일을 읽어서 key를 column형태로 넣고 flatten 명령으로 데이터를 펴준다고 보시면 됩니다.
df = pd.DataFrame({key: np.array(value).flatten() for key, value in mat_file_data.items()})
제가 찾은 방법 중에서 가장 깔끔한 방법입니다. 일단 파일 로딩을 해야 일이 진행이 되니 참조 드립니다.