본문 바로가기

AI & Data analystics/Data

openDART에서 데이터 수집하기(feat.XBRL) | 데이터 분석 기초(2)

 

안녕하세요. 데이터CPA, cloud 입니다.

 

오늘은 주피터노트북을 설치했던 지난 글에 이어서, openDART 사이트에서 재무제표 데이터 다운로드 하는 법과 파이썬, API키를 이용해 대량 데이터를 수집하는 방법을 알아보겠습니다.

 

데이터 분석 기초(1) 아나콘다 & 주피터 노트북(Jupyter Notebook) 설정

누구나 할 수 있는 데이터 분석AI와 데이터 분석은 이제 필수 소양이 되어가고 있고, 모든 분야에서 데이터를 기반으로 한 의사결정이 이루어지고 있습니다.하지만 오히려 개발자들과 빅데이터

datacpa.tistory.com

 

목차는 다음과 같습니다.

(1) openDART에서 대량 데이터 수집하기

(2) API를 이용해 원하는 데이터 받기

(3) 한계점

 

어떤 기업에 대해 알고싶을 때, 가장 쉬운 방법은 뉴스나 증권사 분석리포트를 보는 것입니다. 하지만 직접 더 정확하고 많은 정보를 알고싶다면, 해당 기업의 재무제표를 찾아 보는 것이 가장 좋은 방법입니다.

 

재무제표는 DART 에서 확인하실 수 있습니다.

 

전자공시시스템

많이 본 문서 최근 3영업일 기준 가장 많이 본 공시를 보여줍니다.

dart.fss.or.kr

 

검색창에 기업이름 입력 후 검색해보시면, 정말 다양한 정보를 직접 확인할 수 있습니다.

 

(1) openDART에서 대량 데이터 수집하기

그런데 만약, 작년에 재무제표를 공시한 모든 기업의 재무정보를 한번에 보고싶다면 어떻게 하실 건가요? 업종분석을 하고 싶은데 몇십개, 몇백개 기업 정보를 한번에 보고 싶다면?

많은 분들께서 만드시느라 고통받고 계시지만... XBRL이 도입되면서 천단위가 넘는 기업의 데이터를 한번에 받아볼 수 있게 되었고, 이렇게 불러온 정보들이 자동으로 분류되어 더 비교가능하고 유용한 데이터가 되었습니다.

 

한 번 직접 활용해보겠습니다!

다트 홈페이지에서, 메뉴 중 OpenDART를 클릭하여 들어갑니다.

 

DART 홈페이지 메뉴 중 OpenDART 클릭!
공시정보 활용마당에서 왼쪽 재무정보조회 중 회사간 주요계정 비교 클릭

 

일단 우리에게 가장 익숙한 재무정보를 한번에 살펴보고자 한다면

사진과 같이 공시정보활용마당에 들어가신 뒤, 왼쪽 재무정보 조회 메뉴에서 회사간 주요계정 비교 항목에서

보고자 하는 사업연도, 보고서명, 업종, 별도/연결 항목을 넣어주고 검색을 누르시면 XBRL을 기반으로 한 번에 몇천건의 데이터를 확인하실 수 있습니다.

 

2024년 사업연도 정기보고서를 XBRL로 만들어 제출한 비금융업종의 기업은 2846개이고, 

각 기업들의 자산총계, 부채총계, 자본총계, 유동자산, 유동부채 등 주요 계정을 확인할 수 있습니다.

MultipleAccount.xls
0.82MB

 

 

(2) 주요 재무지표 확인하기

DART에서는 XBRL로 제출된 정보를 단순히 조회하는 것에 그치지 않고, 선택한 기업들의 여러 재무지표도 보여주고 있습니다.

회사가 직접 공시한 자료를 바탕으로 부채비율, 유동비율, 재무레버리지, 이자보상비율 등 중요한 지표들을 자동으로 계산해주는 편리한 시스템입니다.

 

 

회사간 주요지표 비교 항목에 들어가서 사업연도, 보고서명, 업종구분, 회사명, 지표구분을 선택해주시면 아래 첨부한 파일과 같은 데이터를 얻을 수 있습니다. 이 뿐만 아니라 매출액이익률과 같은 수익성지표, 매출채권회전율과 같은 활동성 지표 등 다양한 비율을 정리된 채로 볼 수 있습니다.

엔터안정성지표.xlsx
0.01MB

 

 

(3) 한계점

하지만, 이 기능을 이용해서 특정 업종에 속하는 모든 회사의 데이터를 보는 것은 매우 비효율적입니다. 왜냐하면, 대부분의 지표는 아래 사진처럼 회사명을 하나하나 선택해주어야 하는 문제가 있기 때문입니다.

미디어/엔터 기업을 생각해서 하나하나 검색해 선택해주어야 합니다.

 

 

따라서 다음 글에서는, API를 발급받고 이를 이용해 대량의 데이터 수집을 자동화하는 방법을 소개하겠습니다.

 

완성된 python 코드와 그 결과물까지 모두 제공할 예정이니, 파이썬으로 따라해보실 분들은 전글을 참고해주시고, 데이터만 필요하신 분은 그냥 받아가시면 됩니다!

 

https://datacpa.tistory.com/5

 

데이터 분석 기초(3) API를 활용한 재무데이터 수집(OpenDART API)

안녕하세요. 데이터CPA, cloud 입니다. 오늘은 OpenDART에서 재무제표와 각종 재무지표를 확인했던 지난 글에 이어서, API를 이용해 대량의 데이터 수집을 자동화하는 방법에 대해 소개하겠습니다. 지

datacpa.tistory.com