Top

IBM 왓슨 애널리틱스와 인지 컴퓨팅 [왓슨으로 익히는 최신 예측 기반 분석]

  • 원서명Learning IBM Watson Analytics (ISBN 9781785880773)
  • 지은이제임스 밀러(James D. Miller)
  • 옮긴이황진호
  • ISBN : 9788960779280
  • 25,000원
  • 2016년 11월 22일 펴냄
  • 페이퍼백 | 256쪽 | 188*235mm
  • 시리즈 : acorn+PACKT, 데이터 과학

책 소개

소스 파일은 아래 깃허브 페이지에서 내려 받으실 수 있습니다.
(https://github.com/AcornPublishing/ibm-watson)

요약

IBM 왓슨 애널리틱스의 개념부터 시작하여, 실제 사용처를 다룬 예제를 통해 왓슨이 제공하는 여러 분석 기술을 적용해 본다. 책 전반에 걸쳐 솔루션을 디자인하는 방법과 왓슨 분석 툴을 최적화하고, 확장하는 방법을 배우게 될 것이다. 더 나아가 왓슨 분석 툴을 기업의 상황에 적용하고, 다른 IBM 솔루션과 분석 툴과 통합함으로써 처음부터 끝까지 모든 분석 과정을 익힌다.

이 책에서 다루는 내용

■ 접근과 설정이 용이한 왓슨 언어 학습

■ 왓슨의 사용처 개발 과정과 중요성 및 실제 사용처 예제

■ 실제 사용성을 바탕으로 한 왓슨 분석 솔루션 디자인

■ 콘텐트 분석 사이클 관련 기본 개념과 왓슨 분석의 적용

■ 탐색, 예측, 조합 등 왓슨의 모든 기능

■ 왓슨 솔루션의 최적화 및 확장

■ 기업 수준에서의 왓슨의 사용

■ 왓슨과 다른 툴 셋의 통합

이 책의 대상 독자

데이터의 발견 및 분석을 수행하고 의미를 부여하고자 하는 모든 사람들을 위한 책이다. 데이터 과학자들은 클라우드에서 데이터 분석 작업을 쉽게 실행할 새로운 방법을 탐구하는 목적으로 이 책을 활용할 수 있다. 이 책은 프로그래밍 경험이 없어도 읽을 수 있다.

이 책의 구성

1장, ‘퀵 스타트’에서는 IBM 왓슨 분석 툴에 접근하는 방법을 순차적으로 제공한다. 현재 사용 가능한 IBM 왓슨의 여러 버전과 주요 개념 및 용어를 설명하고, 또한 일반적인 사용 설정 방법이나 본인에 맞는 조정 방법 등을 소개한다.
2장, ‘실제 사용처 찾기’에서는 데이터에서 의미 있는 통찰력을 얻기 위해 실제 사용처를 찾는 것이 IBM 왓슨 분석 툴을 사용하는 데 어떤 도움이 되는지 현실적인 예제를 사용해 설명한다.
3장, ‘왓슨 분석 툴을 활용한 솔루션 디자인’에서는 데이터 분석을 위해 IBM 왓슨 분석 툴을 사용하는 타당한 접근법을 찾는 과정, 시작하기 전에 생각해봐야 할 사항들, 시작부터 끝까지 처리되는 솔루션 디자인의 개발 방법, 결과 분석에 대한 기대치의 설정 방법 등을 다룬다.
4장, ‘내용 분석 이해하기’에서는 내용 분석 실습과 빅데이터 분석 툴로 IBM 왓슨 분석 툴이 사용되는 방법을 논의한다.
5장, ‘왓슨 분석 예측과 조합’에서는 IBM 왓슨 분석 예측과 조합을 살펴보기 위해 실제 사용처를 활용한다.
6장, ‘최적화와 확장’에서는 IBM SPSS와 같은 외부 툴을 사용해 왓슨 분석 툴을 확장하는 개념을 살펴본다.
7장, ‘기업적 관점’에서는 IBM 왓슨 분석 툴을 사용할 때 기업적인 관점에서 생각할 수 있도록 한다.
8장, ‘통합적인 가치 추가’에서는 IBM 코그노스 기업 정보 수집 BI 보고를 포함한 여러 데이터 소스로 왓슨을 통합하는 것이 왜 중요한지 다루며, 그러한 통합을 수행하는 데 요구되는 과정을 설명한다.

저자/역자 소개

지은이의 말

기술적인 경험과 언론의 보도 내용을 봤을 때, IBM 왓슨 분석 툴은 일반적으로 필요한 복잡성을 제외하고도 데이터를 발견하고 분석을 실행하는 정교한 능력을 갖춰 데이터 과학자들을 대체할 수 있을 것처럼 보인다. IBM은 인지 컴퓨팅(왓슨)에 계속해서 많은 자본을 투자하고 있다. 현재 IBM은 이 기술을 주류로 만들기 위해 학생들이 인지 컴퓨팅 과정을 밟도록 여러 선두적인 기술 대학과 파트너십을 맺고 있다. 따라서 IBM 왓슨을 배워야 할 필요성이 점차 대두되고 있다.

지은이 소개

제임스 밀러(James D Miller)

IBM이 공증한 전문가, 독창적인 혁신가, 우수한 관리자, 상급 프로젝트 팀장, 애플리케이션/시스템 설계자다. 여러 플랫폼과 기술을 넘나들며 애플리케이션과 시스템을 디자인하고 개발하며 35년간 훌륭한 경험을 쌓아왔다. 그의 경험은 고객들에게 IBM 왓슨 분석 툴, 코그노스 BI(IBM Cognos Business Intelligence), TM1을 접목한 새로운 기술과 플랫폼을 소개하는 일을 포함한다. 웹 구조 디자인, 시스템 분석 및 디자인, 사용자 인터페이스 디자인 및 테스트, 데이터베이스 모델링, OLAP(Online Analytical Processing)의 개발 및 디자인, 웹과 메인 프레임 애플리케이션과 시스템 사용성에 관련된 개발, IBM 왓슨 분석 툴, IBM 코그노스 BI와 TM1(TM1 규칙, TI, TM1Web, 계획 매니저), 코그노스 프레임워크 매니저, dynaSight(ArcPlan), ASP, DHTML, XML, IIS, 마이크로소프트 비주얼 베이직, VBA, 비주얼 스튜디오, PERL, SPLUNK, WebSuite, 마이크로소프트 SQL 서버(Microsoft SQL Server), 오라클(ORACLE), 사이베이스 서버(SYBASE Server) 등과 관련된 프로젝트에서 일해왔다. 또한 그의 역할은 윈도우 및 SQL 솔루션 개발과 디자인의 전반적인 부분을 포함한다. 예를 들어 분석, 사용자 인터페이스 및 웹사이트 디자인, 데이터 모델링, 테이블, 화면/폼, 스크립트의 개발, SQL(그리고 원격 저장된 절차와 실행) 개발/테스팅, 테스트 준비, 프로그래머의 관리와 교육을 담당했다.
그는 메인프레임(DB2, Lawson, Great Plains 등) 시스템, 클라이언트/서버 SQL 서버, 웹 기반 애플리케이션, 기업 애플리케이션 및 데이터 기반의 통합과 관련된 데이터 전송 같은 ETL(Extract, Transform, Load) 기반 기술의 개발에도 경력을 갖췄다. 그리고 온라인 거래 애플리케이션, 웨어하우스 프로세스 제어와 스케줄링 시스템, 관리와 제어 애플리케이션의 디자인, 개발, 품질 보증(QA, Quality Assurance), 제품 전달에 걸친 웹 애플리케이션 개발 매니저로서의 책임도 맡고 있다. 그는 직접 자금 관리 이사(CFO)와 임원들에게 직접 보고하면서 4억 5,000만 달러의 가치가 있는 기업의 웹 기반 재무 보고 시스템의 디자인, 개발, 관리를 책임지고 있다.
더욱이 프로젝트 리더, 팀리더, 개발 리더, 애플리케이션 개발 관리자를 포함한 여러 위치에 있는 여러 사람들을 관리, 감독하는 역할을 수행하고 있다. ‘코그노스 TM1 개발자 인증 가이드(Cognos TM1 Developers Certification Guide)’, ‘스플렁크 통달하기(Mastering Splunk)’, ‘탁월함의 중심 세우기(Establishing a Center of Excellence)’ 같은 우수 사례에 기반한 여러 기술 백서들을 저술했다. 자신의 경험과 산업 현장의 우수 사례를 바탕으로 계속해서 블로그를 작성하고 있다. 이에 더해 끊임없이 배움을 찾고, 새로운 경험과 자격 인증들을 추구하고 있다. 현재 IBM 인증 비지니스 분석가(코스노스 TM1 IBM 코그노스 마스터 385 인증(100퍼센트 만점 취득)), IBM 인증 선진 솔루션 전문가(코그노스 TM1, IBM 코그노스 TM1 10.1 관리자 인증 C2020-703(100퍼센트 만점 취득)), IBM 오픈페이지 개발 입문 C2020-001-ENU(시험 98퍼센트 득점), IBM 코그노스 10 BI 관리자 C2020-622(시험 98퍼센트 득점), IBM 코그노스 10 BI 전문가 C2020-180 등의 자격 인증들을 취득했다.
혁신적이며, 큰 파장을 일으키는 기술의 평가 및 소개, 클라우드 마이그레이션, IBM 왓슨 분석 툴, 코그노스 BI와 TM1 애플리케이션 디자인 및 개발, OLAP, 비주얼 베이직, SQL 서버, 예측과 계획, 국제적인 애플리케이션 개발, 기업 정보 수집, 프로젝트 개발과 전달, 프로세스 개선에 전문성을 갖췄다.

옮긴이의 말

부분적인 데이터를 바탕으로 감성과 감정으로 의사를 결정하는 시대는 이미 저물었고, 데이터가 모든 의사 결정을 지배하는 시대가 도래했다. 지금까지 수많은 기업들이 쌓여가는 데이터를 제대로 사용하지 못했고, 창고에 처박아뒀던 습관을 다시 고쳐보기 시작했다. 방대한 데이터를 바탕으로 기업의 이윤에 도움이 될 만한 여러 가지 통찰을 얻기 위해 어떤 툴을 이용할지 고민하고 있다. 아직까지 완벽한 인지 분석 툴은 존재하지 않지만, IBM 왓슨은 상당히 진보된 분석 결과를 통찰로 보여준다.
오래지 않아 알려지기 시작한 빅데이터란 용어가 이제 그다지 낯설지 않고 오히려 친숙하게 느껴진다. 모든 정보는 빅데이터 분석을 통해 통찰로 분석되고, 이는 일반 사람들이 쉽게 이해할 수 있는 수준에 이르렀다. 빅데이터의 선두 주자라고 주장하는 많은 기업들이 즐비하다. IBM은 단연 이 분야에 있어서 선두를 달리고 있다. IBM은 단순히 왓슨 분석 툴을 제공하는 것뿐만 아니라, 머신 러닝(기계 학습)을 처리하는 컴퓨터 라이브러리를 무료로 공개하고, 많은 사람들이 사용할 수 있도록 하는 등의 많은 기여를 하고 있다.
바야흐로 데이터의 시대다. 데이터의 시대에서는 전문적으로 데이터를 분석할 수 있는 사람이 어디서나 필요하기 마련이다. 굳이 복잡한 수학에 기반한 전문적인 통계 관련 분야에 종사하지 않더라도, 관련된 툴을 다루며 빅데이터를 처리하는 데이터 분석가는 단연 인기 있는 직종 가운데 하나다. 미국에서 데이터 과학자의 연봉이 2만 달러를 넘어선 지 이미 오래다. 앞으로 이런 추세는 틀림없이 지속될 것이다.
내 경험에 비춰볼 때, 학교에서 배운 데이터 분석에 대한 지식을 바탕으로 이 책에서 제공하는 기술만 완전히 익혀도 데이터 분석의 기반은 갖췄다고 할 수 있다. 이 책의 역자로서 궁극적으로 바라는 바는, 독자 분들이 이 책에서 제공하는 데이터 분석의 실제 사용처 예제를 완전히 자신의 것으로 만들어 몸담은 회사의 데이터에 적용함으로써 많은 통찰을 얻을 뿐 아니라 이를 통해 개인의 발전을 이루고 산업의 발전에 기여하는 것이다.

옮긴이 소개

황진호

국내에서 학업을 마치고 1년여 동안 미국의 연구 기관에서 방문 연구원으로 재직했다. 한국으로 돌아와 포스코 ICT에서 통신 시스템 소프트웨어 개발자로 3년 동안 근무했다. 그 후 미국의 조지 워싱턴 대학교의 컴퓨터 사이언스 학과에서 박사 과정을 마쳤고, 지금은 미국 뉴욕에 위치한 IBM T.J. 왓슨 리서치 센터(IBM T.J. Watson Research Center)에서 클라우드 컴퓨팅과 빅데이터에 관한 연구를 진행 중이다. 에이콘출판사에서 펴낸 『Concurrent Programming on Windows 한국어판』(2012), 『Creating iOS 5 Apps Develop and Design 한국어판』(2012), 『Programming iOS 5 한국어판』(2012), 『Learning PHP, MySQL & JavaScript With jQuery, CSS & HTML5, 4th Edition』(2016)을 번역했고, 『리눅스 API의 모든 것』(2012)을 공역했다.

목차

목차
  • 1장. 퀵 스타트
    • 소개
      • 등록
      • 로그인
      • 환영 페이지
      • 계정
      • 업그레이드
      • 추가적인 내용
      • 바로가기 창
    • 내용 분석 구조
      • 주요 컴포넌트
      • 데이터의 흐름
      • 흐름 나가기
      • 상세 검사
    • 중요한 개념과 용어
      • 구조화와 비구조화
      • 텍스트 분석
      • 검색
      • 발견
      • 마이닝
      • 컬렉션
      • 양상
      • 빈도
      • 연관성
      • 편차
    • 일반적으로 도움이 되는 조언
      • 힌트
      • 참여
    • 요약

  • 2장. 실제 사용처 찾기
    • 실제 사용처 정의
      • 실제 사용처의 중요성
      • 왓슨 사용하기
    • 데이터에 대해 알아야 할 내용
      • 질문 만들기
    • 데이터를 문맥에 맞추기
      • 데이터 문맥의 중요성
    • 실제 사용처 예제
      • NFL 스타디움 판매
      • 수익성 슬롯 머신
      • 품질
      • 데이터 개선하기
      • 메트릭 확인하기
      • 추가적인 질문
      • 범죄 기록
      • 문맥(Context)
      • 통찰 공유하기
      • 작업 저장
    • 요약

  • 3장. 왓슨 분석 툴을 활용한 솔루션 디자인
    • 데이터 고려하기
      • 콘텐트 분석 데이터 모델
    • 왓슨 분석 프로그래밍 인터페이스
    • 왓슨 분석 툴 프로그래밍
    • 요약

  • 4장. 내용 분석 이해하기
    • 콘텐트 분석의 기본 개념
      • 매뉴얼 혹은 자동
      • 텍스트 분석의 어려움
    • 왓슨 분석을 사용한 콘텐트 분석의 분석 사이클
      • 목적 정의
      • 데이터 획득
      • 분석 실시
      • 동작 결정
      • 검증
    • 실례가 되는 실제 사용처
      • 1단계: 목표 정의
      • 2단계: 데이터 획득
      • 3단계: 분석 실시
      • 4단계: 동작 결정
      • 5단계: 검증
    • 텍스트 데이터
      • 데이터 메트릭
      • 검색과 필터
    • 요약

  • 5장. 왓슨 분석 예측과 조합
    • 예측
    • 왓슨 분석 예측 만들기
      • 예측의 결과 확인하기
    • 조합
      • 대시보드
    • 템플릿 사용하기
    • 간단한 실제 사용처
    • 알아두면 좋은 내용들
      • 버전 관리
      • 조합
    • 요약

  • 6장. 최적화와 확장
    • 요구 사항 만족하기
      • 맞춤화하거나 확장하는 이유
    • 왓슨 맞춤화하기
      • 가입
      • 데이터
    • 탭, 그룹화, 새로운 데이터 추가하기
    • 왓슨 확장
      • 데이터 품질
      • 왓슨 데이터 메트릭
    • IBM SPSS 사용하기
    • 누락된 값 처리
    • 실제 사용처 예제
    • 요약

  • 7장. 기업적 관점
    • 기업의 입장 소개
    • 왓슨 지식의 정의
      • 데이터 이해
      • 데이터의 분류나 그룹화
      • 데이터 강화
      • 정규화와 모델링
      • 수집
    • 왓슨 객체 관리
    • 문서의 이름
      • 이름 규칙 개발하기
    • 테스팅
      • 공유하기 전에 테스트하기
    • 기업의 비전
      • 평가와 실험
      • 예측과 조합
      • 관리와 최적화
      • 비전에 관해
    • 기업 왓슨 로드맵
    • 왓슨 업그레이드
      • 무료 버전
      • 개인 버전
      • 프로 버전
    • 다음 과정
    • 기업 실제 사용처
      • 기업화 제안 사항
    • 모델러 스트리밍
      • 왓슨에 업로드하기
      • 왓슨으로 예측하기
      • 왓슨 버전
    • 요약

  • 8장. 통합적인 가치 추가
    • 왓슨 프로 버전으로 업그레이드
    • 왓슨 프로
      • 가용 공간
      • 관리: 계정, 사용자, 데이터 연결
      • 업그레이드: 관련된 제품
      • 문서
      • 대화
      • 폴더
    • 근원 데이터 연결 추가하기
      • 근원 데이터 선택하기
      • 또는 직접 만든 연결을 선택하기
      • 연결 만들기
    • 트위터
    • IBM 코그노스 BI
      • 코그노스 데이터 연결
    • 통합 과정
    • 더 많은 배움의 기회
      • 자신의 데이터 사용하기
    • 가용한 추가 자료
    • 요약

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안