패스트캠퍼스데이터분석부트캠프 6

[데이터 분석] DB와 DBMS

데이터란? 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 정보를 의미한다. 이러한 데이터를 여러 사람이 공유하고 사용할 목적으로 통합 관리되는 데이터 저장소를 데이터베이스(Database, DB)라 부른다. 데이터베이스는 다음과 같은 특징을 가지고 있다. 1) 자료를 구조화하여 저장하기 때문에, 효율적인 관리가 가능함. 2) 여러 업무에 여러 사용자가 동시에 사용 가능함. 3) 사용자가 데이터베이스의 기능을 사용하기 위해서는 응용 프로그램을 활용해야 함. 앞서 언급했듯, 사용자가 데이터베이스의 기능을 사용하기 위해서는 DBMS(Database Management System)이라는 프로그램을 이용해야 한다. DB에 직접 접근하지 않고 DBMS를 통해 데이터 입력·조회·갱신을 수행..

학습/SQL 2025.05.22

[커널 아카데미] 데이터 분석 부트캠프 18기 7주차 회고

7주차부터는 SQL 수업이 본격적으로 시작되었다! 회사 다닐 때 옆에 정보화부서로부터 데이터를 요청하면, 늘 SQL로 데이터를 추출해서 보내주시곤 하셨다. 그래서 나는 단순히 SQL이 방대한 데이터들을 필요한 정보만 추출할 때만 쓰이는 툴 정도로만 이해를 하였다. 그런데 실제 데이터 분석 현업에서 근무하고 계신 분들의 이야기를 들어보면, 많은 분들이 SQL을 이용하여 데이터 분석을 하고 계셨다. 앞서 진행된 파이썬 수업에서 쓴맛을 맛본 바,,, SQL만큼은 내가 다 정복하겠다는 마인드로 이번주를 시작하였다. 데이터 분석 필수 Tool SQL SQL의 종류 1. DDL(Data Definition Language) : CREATE, ALTER, DROP, TRUNCATE2. DML(Data Manipula..

학습 2025.04.13

[커널 아카데미] 데이터 분석 부트캠프 18기 3-6주차 회고

파이썬 수업 때는 여러가지 일들로 블로그를 소홀히 하게 되었다.  그래서 4주치를 한 번에..^^ ㅎㅎ.. 3주차 부터는 본격적인 파이썬 수업이 시작되었다. 사실 나는 학부 때도 코딩 수업을 배워본 적이 없어서, 코딩을 늘 배워보고 싶다는 마음을 늘 품고 있었다.  새로운 걸 배운다는 생각에 설레는 마음으로 수업을 들었다. 단순히 파이썬을 통해서 데이터 분석하는 것을 넘어, 그동안 내가 상상만 해왔던 웹 크롤링, 자동화 파이프라인 구축, 주식자동매매 프로그램 만드는 방법까지 알려주신다고 하니까  앞으로의 수업들이 너무나 기대되는 3주였다!  파이썬 강사님은 유튜브도 하시던데 나중에 기회되면 강사님 채널에 있는 것들도 따라해 볼 생각~~! ▼ 아래는 강사님 유투브 채널 !  https://youtube.c..

학습 2025.04.13

[데이터 분석] 시계열 데이터 분석과 시각화

시계열 데이터는 일정한 시간 간격(일별, 월별, 분기별, 연도별 등)으로 수집되는 데이터이다(e.g., 주가, GDP 등).   시계열 데이터는 다음과 같은 특징을 가지고 있다. 첫째, 시간에 따라 자연적인 순서가 정해진다.  시계열 데이터는 시간의 흐름에 따라 수집된다. 따라서 판매액이 일별로 기록되었다면, 1월 1일, 1월 2일, 1월 3일, ,,, 등으로 정해진 순서에 따라 데이터가 수집되어야 의미가 있다.  둘째, 시계열 데이터의 관찰값들은 서로 영향을 주고 받을 수 있다.  시계열 데이터는 과거의 값이 미래 값에 영향을 미칠 가능성이 높다. 이를 자기상관성이라고 부르는데, 예를 들어 A사의 주가가 오늘 높으면 내일도 높을 가능성이 있거나, 오늘 기온이 높으면 내일도 기온이 높은 것처럼 관찰값들이..

[데이터 시각화] 폭포형 차트(Waterfall Chart)

폭포형 차트(Waterfall Chart)는 데이터의 증가 및 감소의 누적 효과를 막대 그래프로 시각화한 것이다.  다시 말해, 데이터가 어떻게 늘어나고 줄어드는지를 보여주는 차트다. 따라서 폭포형 차트를 통해 초기값에서 최종값까지 어떠한 변화가 있었는지를 확인할 수 있다.  시간에 따른 데이터의 변화를 확인할 수도 있지만, 폭포형 차트는 위의 그림처럼 손익계산을 시각적으로 표현할 수도 있다.  즉, 전체 매출에서 각종 지출들을 차례대로 공제하고 남은 순이익이 어떻게 계산되는지를 차트를 통해 쉽게 이해할 수 있다.  EXCEL에서 폭포수 차트 그리기여기서는 시간의 흐름에 따른 데이터의 변화를 보여주는 폭포수 차트를 그려보고자 한다. 아래의 삼성물산 2022년 2분기 ~ 2024년 3분기 실적 자료를 활용..

[커널 아카데미] 데이터 분석 부트캠프 18기 2주차 회고

이번 주는 데이터 분석을 위한 기초 통계와 엑셀을 통한 데이터 분석법에 대해 집중적으로 배웠다.  이번 주는 배웠던 것들 중 새롭게 배운 내용들을 바탕으로 블로그를 작성해보려 한다.  시계열 데이터 분석 시계열 데이터는 일정한 시간 간격(일별, 월별, 분기별, 연도별 등)으로 수집되는 데이터이다(e.g., 주가, GDP 등).  '정상성'을 기준으로 시계열 데이터를 두 가지로 나눌 수 있다.  1. 정상성을 가지고 있는 정상 시계열 데이터2. 정상성을 가지고 있지 않은 비정상 시계열 데이터  정상성이란 추세나 계절성이 존재하지 않하는 특성을 말한다. 그러나 대부분의 시계열 데이터는 정상성을 가지지 않은 비정상 시계열 데이터에 해당하며, 이러한 상태에서는 분석이 어렵다. 따라서 데이터를 분석하기 전에 차분..

학습 2025.03.09