Top

헬스케어 분석을 위한 머신러닝 [파이썬, 주피터 노트북, 텐서플로, 케라스를 이용한 적용 사례]

  • 원서명Machine Learning for Healthcare Analytics Projects : Build smart AI applications using neural network methodologies across the healthcare vertical market(ISBN 9781789536591)
  • 지은이에듀오닉스 러닝 솔루션스(Eduonix Learning Solutions)
  • 옮긴이고석범
  • ISBN : 9791161756233
  • 25,000원
  • 2022년 03월 31일 펴냄
  • 페이퍼백 | 216쪽 | 188*235mm
  • 시리즈 : 데이터 과학

책 소개

소스 코드 파일은 여기에서 내려 받으실 수 있습니다.
https://github.com/koseokbum/ml4hap2

요약

의료의 미래를 생각하는 의과 대학생과 의료인들의 의료 인공지능에 대한 관심이 나날이 높아지면서 관련 주제에 대한 논의도 뜨겁다. 이 책은 실질적인 사례로 헬스케어 관련 머신러닝을 구현하는 방법을 소개한다. 각 사례는 간단하면서도 머신러닝 프로젝트를 수행하는 단계와 방법이 녹아 있다. 이 책에서 소개하는 구체적인 사례를 통해 깊이 관련 내용을 탐구할 수 있는 생각의 틈새를 마련할 수 있다. 한국어판에서는 머신러닝을 실행시키는 주요 도구인 주피터 노트북에 대한 설명도 덧붙였다.

이 책에서 다루는 내용

◆ 판다스 데이터프레임(Pandas DataFrame) 구성 방법 설명
◆ 환자의 데이터셋으로 발병 예측하기
◆ 텍스트 데이터를 숫자형 데이터로 바꾸기
◆ 히스토그램을 훈련용 데이터셋과 테스트용 데이터셋으로 나누기
◆ 드롭아웃 정규화로 과적합 줄이는 방법 소개

이 책의 대상 독자

머신러닝 알고리듬을 적용해 스마트 인공지능 애플리케이션을 만들어보려는 데이터 과학자, 머신러닝 기술자, 헬스케어 전문가를 위한 책이다. 파이썬이나 다른 프로그래밍 언어의 기초 지식을 갖춘 독자를 대상으로 한다.

이 책의 구성

1장, ‘유방암 진단’에서는 유방암 진단 프로젝트를 다룬다. 데이터를 전처리하고 데이터에 대한 이해를 높이기 위한 탐색 과정을 설명한다. 또한 히스토그램과 산점도를 만들어보면서 분포와 변수들 간의 선형 관계도 살펴본다. 테스트 매개변수를 구현하고 KNN 분류자와 SVC 모델을 만들고, 분류 보고서를 사용해 결과들을 비교해볼 것이다.
2장, ‘당뇨병 발병 예측’에서는 케라스(Keras)로 딥 신경망을 구성해볼 것이다. 사이킷런(Scikit-learn)의 그리드 탐색(Grid search)을 사용해 최적 초매개변수(hyperparameter)를 탐색하고 초매개변수를 조절해 모델을 최적화하는 방법도 배운다.
3장, ‘DNA 분류하기’에서는 대장균 염기서열이 프로모터(promotor)인지 여부를 분류해주는 머신러닝 모델을 만들어볼 것이다. 분류 알고리듬으로 모델을 만들고 학습시킨 후 분류 보고서를 사용해 모델들의 성능을 서로 비교해본다.
4장, ‘관상 동맥 질환 진단’에서는 사이킷런과 케라스를 사용한다. 판다스(Pandas)의 read_csv() 함수를 사용해 UCI 데이터 저장소에서 데이터를 임포트하고, 이것을 프로세싱한다. 데이터를 정리해 기술하는 방법을 배우고 우리가 다루는 것이 무엇인지 알아내기 위해 히스토그램을 출력해볼 것이다.
5장, ‘머신러닝을 이용한 자폐증 스크리닝’에서는 약 90%의 정확도로 자폐증을 예측하는 머신러닝을 만들어볼 것이다. 카테고리형 데이터를 처리하는 방법인 원-핫 인코딩을 설명한다. 드롭아웃 정규화로 과적합을 줄이는 방법도 소개한다. 부록에서는 역자가 추가로 작성한 내용으로, 파이썬 데이터 과학 가이드를 제공한다. 파이썬 언어 환경을 구성하는 방법과 데이터 과학에 필수적인 주피터 노트북을 중심으로 다룬다.

저자/역자 소개

지은이의 말

최근 헬스케어 분야에도 머신러닝을 적용하는 일이 유행하고 있다. 머신러닝 알고리듬은 다양한 정형, 비정형, 반정형 데이터를 다룰 수 있는 전략을 제공한다. 이 책은 헬스케어 분석의 강력한 해법을 제공하는 새로운 접근법과 방법론을 다룬다.
이 책에서는 파이썬 에코시스템에 존재하는 여러 라이브러리를 이용해 핵심적인 머신러닝 알고리듬과 사례들을 설명한다. 이 책은 다섯 개의 헬스케어 과제를 진행하며 인공지능 애플리케이션의 효율성을 평가하는 내용으로 구성돼 있다. 독자들은 헬스케어 데이터를 효율적으로 처리하고 분석하는 더 나은 방법에 대한 인사이트를 얻을 수 있을 것이다. SVM, KNN 모델을 사용해 암을 진단하는 프로젝트, 케라스를 사용한 딥러닝으로 당뇨병 발생을 예측하는 사례, 신경망을 사용해 심장병을 예측하는 사례 등을 다룬다.
이 책을 마칠 무렵이면, 독자들은 헬스케어 도메인의 오래된 과제들을 어떻게 해결해야 할지 감을 잡을 수 있을 것이다.

지은이 소개

에듀오닉스 러닝 솔루션스(Eduonix Learning Solutions)

에듀오닉스 러닝 솔루션스는 고품질의 과학 기술 훈련용 콘텐츠를 제작해 배포한다. 산업계 전문가들로 구성된 우리 팀은 10여년 동안 경쟁력을 높여 왔다. 우리는 산업계와 전문가 세계에서 사용되는 방식으로 기술을 교육하는 것을 목표로 하고 있다. 우리는 모빌리티, 웹, 데이터베이스, 서버 관리 등에 이르는 기술에 대한 교육을 진행할 수 있는 전문 팀을 갖추고 있다.

옮긴이의 말

딥러닝, 머신러닝 등의 인공지능 기술이 삶의 문제를 해결하는 범용기술(General Purpose Technology)로 떠오르면서 4차 산업혁명에서 가장 핵심적인 역할을 할 것으로 예측되고 있다. 따라서 인공지능 기술에 주목할 수밖에 없다.
이 책은 헬스케어 데이터를 사용한 머신러닝 사례를 소개한다. 헬스케어는 의료부터 건강 관리까지 아우르는 ‘건강한 삶’이라는 보편적인 목적이 있는 모든 사람에게 영향을 미치는 중요한 분야다. 의학은 꾸준히 발전하고 있다. 그러나 인간의 삶을 둘러싼 환경이 바뀌고 수명이 늘어나는 만큼 의학과 보건, 헬스케어가 해결해야 하는 과제도 늘고 있다.
코로나 팬데믹을 기점으로 사회는 크게 변화하고 있으며, 지능 기반 의료는 중요한 자리를 차지하게 될 것이다. 이런 기술이 의료와 헬스케어의 여러 문제를 슬기롭게 해결할 수 있길 바란다.

옮긴이 소개

고석범

가톨릭대학교 의과 대학을 졸업하고 서울성모병원에서 신경과 전문의 자격을 획득했다. 종합병원과 요양병원에서 봉직의로 근무했고, 시립 요양원 책임자를 맡기도 했다. 센터 관리자, 병원장 등의 행정 경험을 하면서 컴퓨터가 의료 현장의 여러 문제를 해결할 수 있음을 깨닫고 독학으로 컴퓨터를 공부하기 시작했다. 또한 시간을 쪼개 R 프로그래밍 언어와 헬스케어 관련 책들도 저술하고 번역했다. 액체생검 바이오 벤처에서 일했고, 지금은 의료 현장으로 돌아와 헬스케어 ICT를 통해 의료의 질과 효율을 향상시키는 데 기여하고자 노력 중이다.

목차

목차
  • 01장. 유방암 세포 진단
    • SVM, KNN 모델을 사용한 유방암 진단
    • 데이터 전처리와 데이터 탐색
    • 데이터셋 분리
    • 모델 학습
      • 머신러닝을 사용한 예측
    • 요약

  • 02장. 당뇨병 발병 예측
    • 딥러닝과 그리드 탐색을 사용한 당뇨병 진단
    • 데이터셋 소개
      • 데이터 전처리
      • 데이터 정규화
    • 케라스 모델 정의
    • 사이킷런을 사용한 그리드 탐색법 수행
    • 드롭아웃 정규화를 사용해 과적합 줄이기
    • 최적 초매개변수 찾기
    • 뉴런의 개수 최적화
    • 최적의 초매개변수를 사용해 예측하기
      • 보너스
    • 요약

  • 03장. DNA 분류하기
    • DNA 염기서열 분류
      • 데이터 전처리
      • DNA 염기서열 생성
      • 머신러닝을 이용한 염기 서열 분류
    • 요약

  • 04장. 관상 동맥 질환 진단
    • 데이터셋
    • 결측값 처리
    • 데이터셋 분리
    • 신경망 훈련
    • 다중 분류와 이진 분류의 비교
    • 요약

  • 05장. 머신러닝을 이용한 자폐증 스크리닝
    • 머신러닝을 이용한 ADS 스크리닝
    • 데이터셋 소개
      • 필요한 라이브러와 데이터 임포트
      • 데이터셋 탐색
      • 데이터 전처리
    • 데이터셋을 훈련 데이터와 테스트 데이터로 나누기
    • 신경망 구현
    • 신경망 테스트
      • 드롭아웃 정규화를 사용해 과적합 해결하기
    • 요약

  • 부록 A. 파이썬 데이터 과학을 시작하는 보건 의료인을 위한 안내서
    • 컴퓨터에 파이썬 설치
      • 파이썬 버전에 대해
      • 아나콘다 파이썬 배포판 설치
    • 파이썬 가상 환경 만들기
      • 콘다 가상 환경 만들기
      • 파이썬 패키지는 가상 환경에 설치
      • 파이썬 패키지를 설치
    • 데이터 과학을 위한 최고의 실행 환경: 주피터 노트북
      • 가상 환경에 jupyter 패키지 설치와 실행
      • 주피터 노트북 실행시키기
      • 주피터 노트북 파일
      • 프로젝트 폴더에서 주피터 노트북 실행하기
      • 주피터 노트북의 발전된 형태: 주피터랩
    • 플레인 파이썬 인터프리터, 파이썬 스크립트 실행, ipython 인터프리터
      • ipython 인터프리터 좀 더 들여다보기
    • 주피터 노트북 커널(Kernel)에 대해
    • 구글 콜래보터리
    • 주피터 노트북의 활용
    • 요약

  • 부록 B. 주피터 노트북, 주피터랩, VS Code
    • 주피터 노트북 설치와 실행
    • 주피터 노트북 셀에 내용을 입력하는 방법
      • 셀의 종류
      • 파이썬 코드의 입력과 실행
      • 셀 모드와 단축키 사용
    • ipython 커널에서 유래한 기능
      • 리치 아웃풋: ipython 디스플레이 시스템
    • 노트북 대시보드, 주피터 노트북 파일 관리
    • 주피터 노트북 파일과 활용
    • 주피터 노트북의 기능 확장(nbextensions)
    • R 커널 추가하기
      • 주피터 노트북에 R 언어에 대한 커널을 추가하기
    • 주피터랩
      • 주피터랩의 설치와 실행
      • 노트북 작업
      • 다양한 콘텐츠 뷰어
      • 사용자 커스터마이징
    • 광대한 주피터 에코시스템
    • Visual Studio Code 텍스트 편집기와 주피터 노트북
      • Visual Studo Code 설치와 간단한 사용
      • VS Code에서 파이썬 사용하기
    • 컴퓨테이셔널 노트북

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안