
데이터 마이닝 4/e [실용적인 머신러닝 기술]
- 원서명Data Mining 4th Edition: Practical Machine Learning Tools and Techniques (ISBN 9780128042915)
- 지은이이안 위튼(Ian Witten), 아이베 프랭크(Eibe Frank), 마크 홀(Mark Hall), 크리스토퍼 팔(Christopher Pal)
- 옮긴이김성준
- ISBN : 9791161756424
- 50,000원
- 2022년 05월 31일 펴냄
- 페이퍼백 | 808쪽 | 188*235mm
- 시리즈 : 데이터 과학
책 소개
요약
머신러닝의 기초와 실제 데이터 마이닝에 적용하는 방법을 알려준다. 특히 4판에서는 데이터 준비, 분석 결과 해석, 결과 평가, 성공적인 데이터 마이닝 접근 방식의 핵심인 알고리듬에 이르기까지 데이터 마이닝을 진행하기 위해 알아야 할 모든 것을 다룬다.
이 책에서 다루는 내용
◆ 머신러닝 개념의 기본을 살펴보고 데이터 마이닝 프로젝트에 적용할 도구 및 기술에 관한 조언 제공
◆ 성능 개선을 위해 머신러닝의 입력 및 결과의 변형으로 구체적인 팁과 기술 제공
◆ 데이터 마이닝 작업용 머신러닝 알고리듬에 광범위하게 적용할 수 있는 WEKA 소프트웨어 툴킷 제공
이 책의 대상 독자
머신러닝 관행의 기본 원리와 아이디어에 관심이 있고 기술적으로 잘 알고 있는 일반 독자를 대상으로 한다. 또한 이 새로운 기술에 익숙해져야 하는 정보 전문가와 머신러닝이 무엇을 포함하는지 자세히 이해하려는 모든 사람에게 관심을 끌 것이다. 정보 시스템 실무자, 프로그래머, 컨설턴트, 개발자, 데이터 과학자, 정보 기술 관리자, 사양 작성자, 특허 심사관, 호기심 많은 사람, 학생, 교수 등 다양한 사용자를 위해 작성됐다.
이 책의 구성
1장, ‘데이터 마이닝… 이게 다 뭐죠?’에서는 예를 통해 머신러닝이 무엇인지, 어디에서 사용할 수 있는지 설명하고 실제 애플리케이션을 제공한다. 2장, ‘입력 - 콘셉트, 인스턴스, 속성’과 3장, ‘출력 - 지식의 표현’에서는 관련된 다양한 종류의 입력 및 출력 또는 지식 표현을 다룬다. 다양한 종류의 출력은 다양한 스타일의 알고리듬을 지시하며 4장, ‘알고리듬: 기본 방법’은 머신러닝의 기본 방법을 설명하며 이해하기 쉽도록 단순화했다. 여기에서 관련된 원칙은 복잡한 세부 사항이나 까다로운 구현 문제에 관여하지 않고 다양한 알고리듬으로 전달된다. 특정 데이터 마이닝 문제에 머신러닝 기술을 적용하는 데 진전을 이루려면 얼마나 잘하고 있는지 측정할 수 있어야 한다. 5장, ‘신뢰성: 학습에 대한 평가’를 통해 머신러닝에서 얻은 결과를 평가하고 성능 평가와 관련된 복잡한 문제를 해결할 수 있다.
2부에서는 데이터 마이닝을 위한 고급 머신러닝 기술을 소개한다. 가장 낮고 가장 상세한 수준인 6장, ‘트리 및 규칙’ 및 7장, ‘인스턴스 기반 및 선형 모델 확장’은 머신러닝 알고리듬 수행의 핵심적인 이슈를 세부적으로 잘 드러내며, 실무에 적용 시 필요한 복잡성을 내포하고 있다(하지만 몇 가지 알고리듬에 필요한 무거운 수학적 장치는 생략한다). 많은 독자가 이러한 세부 정보를 무시하고 싶어 할 수 있지만, 머신러닝 구조의 대부분 작업은 이 레벨에서 구현된다. 8장, ‘데이터 변환’은 머신러닝에 대한 입력 및 출력 엔지니어링과 관련된 실제 주제(예: 속성 선택 및 이산화)를 설명한다. 9장, ‘확률적 방법’과 10장, ‘딥러닝’에서는 각각 머신러닝 및 딥러닝의 확률적 방법을 설명한다. 11장, ‘지도 및 비지도 학습을 넘어서’는 준지도 및 다중 인스턴스 학습을 살펴보고, 12장, ‘앙상블 학습’에서는 다양한 학습 기술의 결과물을 결합한 ‘앙상블 학습’ 기술을 다룬다. 13장, ‘응용 영역, 그 너머의 세계’는 미래를 내다본다.
부록에서는 9장 및 10장의 자료 이해에 필요한 몇 가지 수학적 배경을 다룬다. 또 다른 부록에서는 1부 및 2부에 설명된 대부분의 아이디어를 구현하는 WEKA 데이터 마이닝 워크벤치(workbench)를 소개한다. 개념적 자료를 사용 방법의 실제적인 측면에서 명확하게 분리하고자 이를 실었다. 1부와 2부의 각 장 끝에는 관련 WEKA 알고리듬을 소개한다.
목차
목차
- 1부. 데이터 마이닝의 소개
- 1장. 데이터 마이닝… 이게 다 뭐죠?
- 2장. 입력 - 콘셉트, 인스턴스, 속성
- 3장. 출력 - 지식의 표현
- 4장. 알고리듬 - 기본 방식
- 5장. 신뢰성 - 학습에 대한 평가
- 2부. 고급 머신러닝 기술
- 6장. 트리와 규칙
- 7장. 인스턴스 기반 및 선형 모델의 확장
- 8장. 데이터 변환
- 9장. 확률적 방법
- 10장. 딥러닝
- 11장. 지도 및 비지도 학습을 넘어서
- 12장. 앙상블 학습
- 13장. 응용 영역, 그 너머의 세계
- 부록 A. 이론적 기초
- 부록 B. WEKA 워크벤치