구트아카데미학원-자바,오라클(ocp),빅데이터,레드햇,ocp,엑사(exa)데이터

구트아카데미


교육과정

구트아카데미의 교육과정은 누구나 처음부터 차근차근 시작할 수 있도록 기초교육부터 기업에서 요구하는 실무스킬과 미래산업 기술까지 단계별로 설계하였습니다.

전체 교육과정

구트아카데미에서 개강되는 과정 및 일정을 한 번에 확인하실 수 있습니다.

작성자 goottedu
작성일 18-04-16 13:12 | 126 | 0
개강일 2018-12-01
과정명 [BigData] Spark를 활용한 머신러닝[ 내일배움카드-국비지원 과정]
인원 15
수강료 국비지원
현황 모집중

본문

Spark-스파크를 활용한 머신러닝

911633330_edu3.gif
  • 과정명

    [Bigdata]스파크를 활용한 머신러닝
  • 교육일정

    주말 2018.12.01~2018.12.22
  • 교육기간

    주말 토,토,토,토(4일)
  • 교육시간(수강료)

    주말:오전 09:30~18:30/ 총 32시간 (210,368원,재직자카드 0원)
  • 수강정원

    20명

Apache Spark?

오픈 소스 클러스터 컴퓨팅 프레임워크이다. 원래 캘리포니아 대학교 버클리의 AMPLab에서 개발된 스파크의 코드베이스는 나중에 아파치 소프트웨어 재단에 기부되었으며 그 이후로 계속 유지 보수를 해오고 있다. 스파크는 암시적 데이터 병렬성과 장애 허용과 더불어 완전한 클러스터를 프로그래밍하기 위한 인터페이스를 제공합니다.

과정소개

본 과정은 머신러닝의 개념과 알고리즘을 학습하고, Spark를 활용한 빅데이터 처리와 기술을 학습하는 과정입니다.
Spark는 기존 빅데이터 처리 기술의 단점을 극복하기 위한 대안으로 제시되고 있으며, 많은 연구기관에서 차세대 빅데이터 기술로 예측하고 있는 Spark를 활용한 빅데이터 처리 기술을 본 과정에서 실습 중심으로 학습 하실 수 있습니다.

과정의 특장점

- 변화하고 있는 빅데이터 분석 환경을 반영한 교육내용 구성
최근 빅데이터 분석 환경이 배치와 실시간 분석을 동시에 요구하는 환경으로 변화하고 있으며, Spark는 그러한 환경변화에 가장 적합한 빅데이터 분석 플랫폼이라고 할 수 있습니다.


- Spark를 이용한 실시간 머신러닝 학습
쉽고, 빠르고 범용적인 Spark를 이용하여 실시간 머신러닝을 학습해 보는 과정입니다.


훈련목표

- 머신러닝의 개념을 이해합니다.
- 상황별 사용할 수 있는 머신러닝 알고리즘을 이해합니다.
- 대용량의 데이터를 처리하기 위한 Spark 클러스터에서 머신러닝을 수행합니다.

학습대상

- 기업 내 정보화 및 IT혁신사업 담당자
- 기업의 전산시스템 및 데이터 관리 담당자
- 기타 빅데이터에 관심 있는 재직자

커리큘럼

교과목명 교육내용

1일차

(8시간)

  • 환빅데이터와 머신러닝
  • 빅데이터 분석환경의 변화
  • Spark 아키텍처의 이해
  • 함수형 언어구조 이해
  • 데이터 전처리
  • 데이터 전처리

2일차

(8시간)

  • Collaborative Filtering 개념
  • 추천기 엔진
  • 분류와 회귀 분석 개요
  • 선형 모델의 개념
  • 확률에 의한 분류

3일차

(8시간)

  • 결정 트리를 활용한 데이터 분류
  • 회귀분석
  • 차원감소
  • 비지도 학습의 개념
  • 군집 알고리즘
  • Streaming Kmeans

4일차

(8시간)

  • 텍스트 마이닝 개요
  • 텍스트 마이닝
  • 텍스트 마이닝을 활용한 문서 분류
  • 딥 러닝
  • Artificial neural network 개념
  • Multilayer Perceptron in Spark
  • Optimization &Parallelization
  • 실시간 머신러닝
  • 딥러닝과 실시간 머신러닝

댓글목록 0

등록된 댓글이 없습니다.