공공데이터포털은 국내 공공기관이 보유하고 있는 공공데이터를 하나로 통합 관리하는 사이트로, 행정안전부가 운영하고 있습니다. 약 89,600건에 달하는 방대한 양의 공공데이터가 개방되어 있어 누구나 데이터를 자유롭게 공유·활용할 수 있는데요. 사이트 내에서 데이터를 원하는 형태로 시각화할 수 있고, 일부 데이터는 open API 형태로도 제공받을 수 있기 때문에 데이터 분석 및 개발 프로젝트에 매우 유용한 사이트입니다.
국가통계포털은 통계청에서 운영하는 One-Stop 통계 서비스로, 국내·국제·북한의 주요 통계 데이터를 살펴볼 수 있다는 점이 특징입니다. 경제·사회·환경 등 30개 분야에 걸친 국내 통계뿐만 아니라, 국제금융·경제에 관한 IMF, Worldbank, OECD 등의 국제 통계도 제공하고 있죠. 데이터가 주제별로 잘 분류되어 있어 원하는 데이터를 쉽고 편리하게 검색할 수 있고, open API 서비스를 통해 데이터를 JSON, SDMX, XML, XLS 등 다양한 형태로 이용할 수 있습니다.
열린데이터 광장은 서울시와 관련된 공공데이터 및 통계자료를 제공하는 사이트입니다. 보건, 문화·관광, 환경, 교통, 인구 등 다양한 카테고리의 데이터셋을 원본 형태뿐만 아니라 open API로도 이용할 수 있죠. 특히 인구 데이터, 시민 생활 데이터, 실시간 도시데이터 등 서울시의 주요 정보를 이해하기 쉽게 시각화하여 제공하고 있기 때문에, 서울시 관련 자료가 필요한 분들께 매우 유용한 사이트입니다.
캐글은 데이터 사이언스 및 머신러닝 경진대회(Competition)를 주최하는 해외 온라인 커뮤니티 사이트입니다. 각종 기업이나 단체들이 상금을 걸고 데이터셋과 해결과제를 올리면, 유저들이 이를 해결하기 위해 경쟁하는 방식이죠. 캐글에서는 유저들이 자유롭게 올리는 다양한 데이터셋과 데이터 분석 코드도 자유롭게 살펴볼 수 있는데요. 머신러닝이나 데이터 분석 등 전반적인 데이터 사이언스에 관심이 있다면, 캐글에 방문해 보세요.
AI허브는 데이터, API, 컴퓨팅 자원 등 AI 기술 및 제품·서비스 개발에 필요한 인프라를 누구나 무료로 활용할 수 있게 하는 정부 운영 서비스입니다. 정부의 지능정보산업 인프라 조성사업으로 구축된 14개 분야의 AI 학습용 데이터를 비롯해, 국내외 기관·기업에서 보유한 AI 학습용 데이터를 공개하고 있는데요. 이미지, 비디오, 오디오 등 다양한 형태의 데이터를 얻을 수 있다는 점이 특징입니다. 머신러닝 혹은 딥러닝 서비스 개발에 관여하고 있거나, 양질의 한국형 AI 학습용 데이터셋을 찾는 분들께 추천드리는 사이트입니다.