You can edit almost every page by Creating an account. Otherwise, see the FAQ.

디지털정보처리론 데이터 수집, 분석 및 시각화 실습

EverybodyWiki Bios & Wiki

스크립트 오류: "Unsubst" 모듈이 없습니다. package.lua 80번째 줄에서 Lua 오류: module 'Module:Namespace detect/data' not found.

본인 소개[편집]

명지대학교 인문캠퍼스에서 국어국문학과를 전공하고, 문헌정보학과를 복수전공하고 있는 김현정입니다. 지금까지 문헌정보학과를 복수전공하며 정보조직, 도서관 경영, 도서관 역사, 고문헌, 정보과목 등을 배웠습니다. 과학기술의 발달으로 인터넷상에는 너무 많은 정보가 돌아다니고, 과거와 달리 하루에 굉장히 많은 양의 정보를 보게 되는 요즘은 정보라는 분야에 대해 관심을 가지고 있습니다.

Map
명지대학교 지도

내용 소개[편집]

20-1학기 디지털정보처리론이라는 수업에서 엑셀을 활용한 정보처리 과정을 배우고, 직접 실습했습니다. 이 페이지는 최종적으로 정보처리 과정을 실습하기 위한 페이지로 정보 수집, 데이터 전처리 및 가시화, 워드클라우드 보고서로 구성되어 있습니다. 2020년도 상반기 도서관의 인기 대출도서 현황을 파악한다는 목표하에 도서관 정보나루에서 데이터를 수집했고, 파워쿼리(Power Query)를 통해 정보를 구조화할 것입니다. 마지막으로는 파워비아이(PowerBI), 워드클라우드 보고서(word cloud report)를 통해 데이터를 시각화하는 모습을 확인할 수 있습니다.

엑셀을 활용한 정보처리 과정 및 결과[편집]

데이터 수집[편집]

도서관 정보나루는 문화체육관광부 소속 기관인 국립중앙도서관(National Library of Korea)에서 개발, 운영하고 있는 페이지로 도서관별로 공개된 데이터를 볼 수 있습니다. 정보처리 과정을 실습하기 위해 홈페이지에서 2020년도 1월 1일부터 2020년도 6월 26일까지 공공도서관에서 인기 있는 대출도서 정보와 통계를 수집했습니다.

퍼즐 형태의 로고
국립중앙도서관 로고

국립중앙도서관 디지털도서관 과제와 현황 동영상

데이터 전처리[편집]

엑셀의 파워쿼리(Power Query)를 이용해 도서관 정보나루에서 제공받았던 파일을 전처리했습니다. 파워쿼리(Power Query)의 열제거를 이용해 필요한 문단인 '순위'와 '서명', '대출권수'만 남겨 기존 표 형식에서 테이블 형태로 재구성했습니다.


전처리 전:
Puzzle globe logo


전처리 후:
Puzzle globe logo

데이터 가시화[편집]

엑셀의 파워비아이(Power BI)를 활용해 미리 구조화한 문서를 꺾은선형 차트로 만들어 시각화했습니다.

Puzzle globe logo

워드클라우드 보고서(word cloud report)[편집]

2020년도 1월 1일부터 2020년도 6월 26일까지 공공도서관에서 인기 있는 대출도서 1위부터 200위까지를 워드클라우드(word cloud)를 통해 시각화한 모습입니다. 워드클라우드를 통해 인기 있는 대출도서의 키워드는 '장편소설', '설민석', 대모험', '천재', '역사'라는 사실을 파악할 수 있습니다.

키워드 Top 5 장편소설, 설민석, 대모험, 천재, 역사

Puzzle globe logo


This article "디지털정보처리론 데이터 수집, 분석 및 시각화 실습" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:디지털정보처리론 데이터 수집, 분석 및 시각화 실습. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.



Read or create/edit this page in another language[편집]