공공장소
574
2018-08-08 23:34:58 작성 2018-08-08 23:35:39 수정됨
0
393

★★★빅데이터 통합 마스터 클래스-하둡 플랫폼부터 데이터 시각화까지, 빅데이터의 모든 것!



공공장소 빅데이터 통합 마스터 Class는 빅데이터 실무 역량의 극대화를 목표로 5주만에 빅데이터의 모든 것을 마스터하는 공공장소만의 통합 교육 과정입니다.

빅데이터 프로세싱 시작 단계인 리눅스 기반의 Hadoop 플랫폼 구축부터 파이썬 크롤링스파크 데이터 처리/분석 R, 데이터 시각화에 의한 데이터 엔지니어링 고급 스킬까지,

단 하나의 강좌에서 빅데이터 모든 단계를 실무적 관점에서 마스터할 수 있습니다.

 

1. 과정목표

- Hadoop기반 빅데이터 플랫폼 구축과 데이터 처리,분석을 위한 Hadoop 에코시스템 학습부터

- 파이썬, Spark, R을 활용하여 데이터의 수집부터 처리, 분석, 시각화 실습까지 실무적 빅데이터 프로세스 기술 마스터

 

2. 상세 커리큘럼


- 하둡시스템을 구축 및 운영하는데 필요한 기본적인 리눅스 명령어와 SSH, 쉘스크립트에 대해 학습하고, 하둡 시스템을 설치하는 과정을 쉘스크립트로 작성해봄으로써 하둡 기반 빅데이터 플랫폼 설치 과정을 마스터 합니다.

 


- 하둡 운영시 자주 사용되는 HDFS조작 명령어를 실습하고 맵리듀스의 동작원리를 이해합니다.

- 하이브 사용법을 알아보고 Hive Server2를 통한 JDBC연결을 실습합니다.



- 파이썬의 기초 문법을 리뷰하고 이를 활용한 크롤러를 직접 구현합니다.

- 네이버 주식 페이지로부터 현재 주식의 가격과 종목게시판의 게시글을 수집, HDFS에 적재하는 실습을 진행합니다.

 


- 인메모리 고속 처리 프레임워크인 Spark의 구조에 대해 살펴보고,

- RDD베이스와 DataSet베이스 각각의 데이터 처리방법을 실습합니다.

- Spark mllib 라이브러리를 소개하고 TF-IDF를 통한 주요 단어 추출 실습을 진행합니다

  (3주차에 수집한 종목게시판의 게시글을 실습에 활용)

 


- 대표적인 머신러닝 알고리즘 소개 및 군집, 분석, 분류, 회귀 등 다양한 분석 기법을 학습합니다.

- R을 활용한 머신러닝 대표 알고리즘과 다양한 시각화라이브러리를 실습합니다.

   (3주차에 수집한 주가정보와 4주차에 추출된 대표키워드를 활용)

 

==> 보다 상세한 내용과 신청은 강좌 상세 페이지 바로가기 를 클릭해 주세요

0
0
  • 댓글 0

  • 로그인을 하시면 댓글을 등록할 수 있습니다.