존재적 특성 : 객관적 사실을 의미하는 것. 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실
당위적 특성 : 예측, 전망, 추정을 위한 근거. 다른 객체와의 상호관계 속에서 가치를 갖는다는 의미.
유형
DIKW 피라미드
구분 | 내용 |
---|---|
데이터(Data) | 가공되기 전의 객관적 수치 또는 기호 |
ex) A마트 100원, B마트 200원 | |
정보(Information) | 데이터의 가공 및 처리를 통해 도출된 현상 |
ex) A마트가 B마트보다 더 싸다 | |
지식(Knowledge) | 정보의 구조화를 통해 도출되는 고유의 아이디어 |
ex) 상대적으로 저렴한 A마트에서 사야지 ! | |
지혜(Wisdom) | 지식의 축적과 아이디어가 결합된 창의적 산물 |
ex) A마트 다른 제품도 B마트보다 쌀 것이라 판단. |
⇒ 지식은 존재의 형태에 따라 암묵지와 형식지로 구분 가능
암묵지 : 개인에게 축적된 내면화된 지식으로 공통화, 내면화 과정이 작용됨.
→ Know-how
형식지 : 언어나 문서로 표준화 및 형상화된 지식으로 표출화, 연결화 과정이 작용됨.
→ 특정 기록 매체에 저장.
정의
특징
특징 | 내용 |
---|---|
Volume(규모) | 수집, 저장, 처리하는 데이터의 규모가 매우 큼 |
Variety(다양성) | 정형화된 데이터뿐만 아니라 다양한 유형의 데이터를 처리함 |
Velocity(속도) | 데이터의 수집, 분석, 활용의 속도가 매우 빠름 |
Veracity(신뢰성) | 데이터 처리를 통한 노이즈 제거로 수집된 데이터의 신뢰 확보 |
Value(가치) | 수집된 데이터를 처리함으로써 다양한 가치를 창출함. |
변화
변화 | 내용 |
---|---|
사전처리 → 사후처리 | 과거 : 필요한 정보만 수집하고 필요한지 않은 정보는 제거 |
현재 : 가능한 한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아냄. | |
표본조사 → 전수조사 | 데이터 수집 비용의 감소와 클라우드 컴퓨팅 기술의 발전으로 데이터 처리 비용 감소. ⇒ 표본 조사 방식에서 전수조사를 통해 샘플링에서 얻지 못하는 패턴이나 정보를 발견하는 방식으로 데이터 활용 방법이 변화됨. |
질 → 양 | 데이터가 지속적으로 추가될 경우 양질의 정보가 오류 정보보다 많아 전체적으로 좋은 결과 산출에 긍적적인 영향을 미친다는 인식의 변화가 나타남 |
인과 관계 → 상관관계 | 데이터 기반의 상관관계 분석이 주는 인사이트가 인과 관계에 의한 미래 예측을 압도하는 시대가 도래 |
활용
가치 산정
영향
⇒ 데이터 사이언티스트와 알고리즘 전문가(Algorithmist)의 시장가치 증가 예상
위기 요인과 통제 방안
데이터 산업
산업 | 내용 |
---|---|
제조 | 제품 생산 불량률 개선, 수요 예측을 통한 판매 계획 향상 |
쇼핑 | 구매 분석을 통한 소비 예측 |
물류 | 물류 관리 최적화 |
의료 | 헬스케어 서비스를 통한 의료 복지 향상 |
⇒ 비즈니스 핵심가치 도출과 가치 창출의 평가지표 수립이 필요. 이를 토대로 효과적으로 시장과 고객의 변화에 대응할 수 있어야 함.
⇒ 전략적인 분석 인사이트를 가지고 핵심적인 비즈니스에 집중하여 데이터를 분석하고 전략을 수립하는 운영방식이 중요.
데이터 사이언스 : 다양한 유형의 데이터로부터 의미 있는 정보를 추출하는 분야.