
리버싱 [리버스 엔지니어링 비밀을 파헤치다]
- 원서명Reversing: Secrets of Reverse Engineering (ISBN 9780764574818)
- 지은이엘다드 에일람
- 옮긴이윤근용
- ISBN : 9788960770805
- 40,000원
- 2009년 05월 11일 펴냄 (절판)
- 페이퍼백 | 664쪽 | 188*250mm
- 시리즈 : acorn classics, 해킹과 보안
판매처
- 현재 이 도서는 구매할 수 없습니다.
책 소개
이 책의 예제 프로그램은 edit@acornpub.co.kr로 문의 주시면 받아보실 수 있습니다.
소프트웨어를 해부해서 설계와 구현 내용, 심지어 소스코드까지도 알아낼 수 있어서 최근 보안업계의 화두로 떠오른 리버싱. 복제방지기술 무력화와 상용보안대책 무력화로 무장한 해커들의 리버싱 공격 패턴을 파악하기 위한 최신 기술을 담은 해킹 보안 업계 종사자의 필독서. 소프트웨어의 약점을 찾아내 보완하고, 해커의 공격이나 악성코드를 무력화하며, 더 좋은 프로그램을 개발할 수 있도록 프로그램의 동작 원리를 이해하는 데도 효율적인 리버스 엔지니어링의 비밀을 파헤친다.
[ 이 책에서 다루는 내용 ]
■ IA-32 호환 프로세서용 컴파일러가 만든 어셈블리 언어 코드를 읽는 방법
■ 문서화되지 않은 파일 포맷이나 네트워크 프로토콜 해석
■ 리버스 엔지니어링이 합법인 경우와 불법인 경우, 그리고 불법일 때의 이유
■ 리버싱을 활용해 해커가 복사 방지 기술을 무력화하는 방법
■ 리버스 엔지니어링을 적용해 악성코드를 무력화하는 방법
■ 코드 리버싱을 막는 방어책과 효과적인 수행 방법
■ 닷넷 플랫폼 리버싱과 어셈블리 언어인 MSIL
■ 실제 악성코드 프로그램 분석 방법
■ 악성코드 프로그램을 이용해 공격자가 감염된 시스템 제어권을 획득하는 과정
[ 이 책의 구성 ]
이 책은 크게 4부로 나뉘어 있다. 1부는 이 책 전반을 이해하는 데 필요한 기본 내용을 제공하고, 2부에서 4부까지는 각각 리버스 엔지니어링 시나리오와 실례를 설명한다.
■ 1부. 리버싱 입문: 이 책은 로우레벨 소프트웨어를 이해하는 데 필요한 모든 기본적인 내용에 대한 논의로 시작한다. 알다시피 1부에서 모든 내용을 다루는 것은 불가능하다. 다만 이미 알고 있는 내용을 다시 되새겨주는 기회가 될 것이다. 1부를 읽으며 내용이 생소하다고 느껴지는 독자라면 이 책은 적합한 책이 아니다. 1부에서 주로 다루는 주제는 다음과 같다. 리버스 엔지니어링 소개와 다양한 적용 분야(1장), 로우레벨 소프트웨어 개념(2장), 마이크로소프트 운영체제의 내부(3장). 이런 주제와 일반적인 로우레벨 소프트웨어를 많이 접해 봤다면 1~3장은 굳이 읽지 않고 건너 뛰어도 된다. 4장은 다양한 타입의 리버스 엔지니어링 툴을 소개하고, 다양한 상황에서 적절히 사용할 수 있는 특별한 형태의 툴을 설명한다. 이 책에서는 전반에 걸쳐, 리버스 엔지니어링에 사용되는 갖가지 툴을 설명한다.
■ 2부. 리버싱 실전: 2부에서는 실제 소프트웨어에 대한 실제적인 리버스 엔지니어링 프로젝트를 수행한다. 각 장마다 다양한 종류의 애플리케이션에 대한 리버스 엔지니어링을 설명한다. 5장에서는 윈도우 내부 서비스와 API를 좀 더 잘 사용할 수 있도록 운영체제나 다른 업체의 라이브러리를 리버스 엔지니어링하는 방법을 알려준다. 6장에서는 데이터 리버스 엔지니어링 기술을 적용해서 문서화되지 않은 파일 포맷을 해석하는 방법을 설명한다. 7장에서는 리버스 엔지니어링 기술을 사용해 실행 바이너리에서 보안 취약점을 발견해내는 방법을 배워본다. 마지막으로 8장에서는 바이러스나 웜과 같은 악성코드 소프트웨어를 설명한다. 8장에서는 실제 악성코드 프로그램을 리버스 엔지니어링 해본다. 이는 악성코드 프로그램을 연구하고 위험성을 평가하기 위해 반드시 필요한 작업이다.
■ 3부. 크래킹: 3부에서는 복사 방지와 디지털 저작권 관리(DRM) 기술과 같은 특정한 형태의 보안 관련 코드에 대한 리버스 엔지니어링에 초점을 맞춘다. 9장에서는 복사 방지 기술의 일반적인 원리를 소개하고, 10장에서는 복사 방지와 DRM 기술과 같은 안티 리버스 엔지니어링 기술들을 설명하며 그 기술의 유효성을 평가할 것이다. 11장에서는 크래커가 복사 방지 메커니즘을 무력화해서 복사 방지된 컨텐츠를 훔치기 위해 리버스 엔지니어링을 어떻게 이용하는지 알아본다.
■ 4부. 고급 디스어셈블리: 4부에서는 실행 프로그램의 디스어셈블리 이외 부분을 다룬다. 12장에서는 마이크로소프트 닷넷 기반 플랫폼에서 작성된 가상 머신 기반의 프로그램을 리버스 엔지니어링하는 과정을 설명한다. 또한 닷넷 플래폼을 소개하고 그것의 로우레벨 어셈블리 언어인 MSIL(Microsoft Intermediate Language)도 설명한다. 13장에서는 디컴파일의 이론적인 설명과 그것이 어떻게 작동하는지, 네이티브 어셈블리 언어 코드를 디컴파일하는 것이 왜 그렇게 어려운 것인지 설명한다.
■ 부록: 인텔 IA-32 어셈블리 언어로 작성된 프로그램을 해석하는 데 도움이 될 수 있는 내용을 부록으로 다룬다. 단순한 어셈블리 언어의 레퍼런스 가이드를 넘어서 이 책이 제공하는 부록에서는 많이 사용되고 있는 컴파일러에 의해 제거된 컴파일러의 표현 방법과 코드, 그들을 구별하고 해석하는 방법을 설명한다.
[ 이 책의 대상 독자 ]
이 책은 여러 분야에 종사하는 사람들에게 도움이 되는 기술을 다양하게 다룬다. 운영체제, 어셈블리 언어, 컴파일 같은 소프트웨어의 다양한 로우레벨 측면을 알고 싶어 하는 소프트웨어 개발자는 특히 더 유용한 정보를 많이 찾을 수 있을 것이다. 운영체제나 소프트웨어 라이브러리, 특정 소프트웨어 컴포넌트 등 기존 코드를 빠르고 효과적으로 분석할 수 있는 기술을 향상시키려는 사람에게도 유용할 것이다. 이외에도 이 책은 보안이나 저작권 제어 등과 같은 다양한 주제도 들어 있으므로, 리버스 엔지니어링에 특별한 관심이 없더라도 이 책이 다루는 다양한 주제에서 흥미로운 내용을 찾을 수 있을 것이다.
이 책을 읽기 전 선수 지식을 제공하기 위해 나는 비교적 최신의 기술 사항들을 가능한 한 모두 다루려고 노력했다. 따라서 1부는 이 책을 읽는 데 꼭 필요한 기본 지식을 설명하면서 시작한다. 하지만 이 책에서 정말로 많은 것을 얻기 원하는 독자라면 어느 정도의 소프트웨어 개발 경험이나 지식은 갖추는 편이 좋다. 전문적인 소프트웨어 개발 경험은 전혀 없지만 현재 컴퓨터 공학을 전공하는 학생이라면 이 책을 읽는 데 큰 문제는 없을 것이다. 반대로 컴퓨터를 전공한 적은 없지만 수년간 프로그래밍 작업을 수행해 온 사람이라면 이 책에서 더 많은 내용을 배울 수 있을 것이다.
마지막으로 이 책은 로우레벨 소프트웨어와 리버스 엔지니어링 경험이 이미 있는 사람 중에서 흥미로운 고급 기술을 배우길 원하거나 기존 코드에서 상세한 정보를 추출하는 방법을 알고자 하는 사람들에게 도움이 많이 될 것이다.
[ 추천의 글 ]
우리는 소프트웨어가 정확히 어떤 작업을 수행하는지 알지 못한 채 소프트웨어를 실행한다. 그런 식으로 실행되는 소프트웨어의 수가 얼마나 많은지 알게 된다면 여러분은 깜짝 놀랄 것이다. 우리는 대개 상용 소프트웨어 패키지를 구입한 후 설치 프로그램을 실행해 프로그램을 설치한다. 소프트웨어가 설치되는 과정에서 수많은 파일이 복사되고 시스템 설정이 변경된다. 또한 이전 버전의 파일들은 삭제되고 중요한 레지스트리 파일이 변경된다. 웹사이트를 방문할 때도 해당 사이트를 제대로 보거나 제공하는 기능을 이용하기 위해 수십 가지 프로그램과 코드를 실행해야 한다. 또한 수많은 게임 CD와 유틸리티 CD를 구입하거나 셰어웨어 형태의 프로그램들을 내려 받는다. 그리고 특정 프로그램의 일부 기능을 사용하기 위해 동료나 친구들과 프로그램을 교환해서 사용하기도 한다.
그러고 나서 소프트웨어 제조사의 프로그램 변경 내용을 전적으로 신뢰한 상태에서 업데이트와 패치를 설치한다. 그리고 프로그램의 최신 변경 내용이 시스템의 다른 프로그램에 아무런 영향도 끼치지 않기를 무턱대고 바라기만 한다. 즉 전혀 알지 못하거나 이해하지 못하는 그 수많은 프로그램에 의존하는 것이다.
지금까지의 내용은 비단 개인용 데스크탑이나 노트북 컴퓨터에만 해당되는 문제가 아니다. 유비쿼터스 컴퓨팅이나 “모든 곳에 소프트웨어를(software everywhere)”이라는 기치 하에 소프트웨어 제어와 소프트웨어 간의 상호 접속 기능이 장치 안에 탑재되는 일이 기하급수적으로 늘어나고 있다. 이제는 아폴로 우주선이 달에 착륙하는 데 필요했던 코드보다 더 많은 소프트웨어 코드가 자동차의 엔진 제어장치에 들어간다.
오늘날 소프트웨어는 너무 복잡하고 서로 연동해서 동작하므로 개발자조차도 애플리케이션의 특징이나 그로 인한 간접적인 영향을 다 알지 못한다. 프로그램의 모든 제어 경로와 사용자 옵션을 테스트하는 데 필요한 비용과 시간이 너무 커서 소프트웨어 테스트를 제대로 수행하지 못하는 경우가 흔하다. 현재는 네트워크 플랫폼이 점점 증가하고 소프트웨어 아키텍처 계층이 다양해지면서, 모든 가능한 조합을 테스트하는 일은 사실상 불가능하다. 마치 마약 거래를 사전에 잡아내는 것처럼, 많은 소프트웨어 시스템이 알려지지 않았거나 예측 불가능한 이슈들을 테스트하고 있다.
리버스 엔지니어링은 소프트웨어를 제대로 이해하기 위한 핵심 기술이며 도구다. 리버스 엔지니어링은 “시스템의 구성 요소와 구성 요소 간의 상관관계를 찾아내고 시스템을 하이레벨의 개념에서 다른 형태로 표현하는 분석 과정”(IEEE 1990)이다. 리버스 엔지니어링을 통해 소프트웨어의 구조와 동작 방식을 시각화할 수 있다. 소프트웨어 조사를 위한 자동화된 툴의 적용과 분석 기술을 통해서 소프트웨어의 복잡성을 이해할 수 있다.
리버스 엔지니어링은 오랫동안 우리 곁에 있어왔다. 개념적으로 보면 누군가 다른 사람의 코드를 보는 일도 리버싱을 수행하는 것이라고 간주할 수 있다. 또한 개발자가 자신이 작성한 코드를 며칠 후에 보는 것도 리버싱이라고 할 수 있다. 리버스 엔지니어링은 어떤 것을 찾아내는 작업이다. 우리는 자신이 작성한 코드든 다른 사람이 작성한 코드든 간에, 누구도 예상하지 못한 것을 조사하고 배우고 살펴볼 수 있다.
1990년까지 소프트웨어 리버스 엔지니어링은 각종 컨퍼런스나 컴퓨터 사용자 그룹의 모임에서 주제로 다뤄왔다. 공학 분야에서 리버스 엔지니어링이 인식되기 시작한 때는 잡지에서 리버스 엔지니어링의 분류와 소프트웨어 설계를 복구하는 개념을 소개하면서부터다. 그 이후로 리버싱 기술, 소프트웨어 시각화, 프로그램 이해, 데이터 리버스 엔지니어링, 소프트웨어 분석을 연구하는 단체가 점점 더 많이 생겨났으며, 그와 관련된 툴과 방법론이 다양하게 개발됐다. 매년 열리는 국제 컨퍼런스인 WCRE(Working Conference on Reverse Engineering)와 같은 행사를 통해서 리버스 엔지니어링 기술은 지속적으로 탐구되고 확대되는 중이다. 요즘에는 플랫폼 마이그레이션, 상호 운용, 악성코드 탐지, 문제 해결 등의 목적으로 이 책의 주된 내용이기도 한 바이너리 리버싱에 대한 관심이 늘고 있다.
“당신은 과연 리버스 엔지니어링을 묵과할 수 있습니까?” 나는 관리 정보 기술 컨설턴트로서 이런 질문을 자주 받아왔다. 그러고는 대개 다음과 같은 질문이 곧바로 뒤따른다. “당신은 소프트웨어를 개발해서 판매해 왔습니다. 그렇다면 다른 사람으로부터 당신의 지적 재산권을 보호하고 존중 받고 싶지 않나요?” 이에 대한 논의는 일반적으로 리버스 엔지니어링 용어에 대한 부정적인 의미로부터 출발한다. 하지만 리버스 엔지니어링 기술은 소프트웨어 공급자와 소비자 모두에게 여러 가지 면에서 가치가 있다.
청진기는 강도가 금고의 잠금장치를 딸 때 소리를 듣기 위한 도구로 이용하기도 한다. 하지만 의사가 심호흡기 질환을 발견하기 위한 도구로도 사용한다. 또는 컴퓨터 기술자가 디스크 드라이브에 잠재적인 해를 끼칠 수 있는 먼지나 꽃가루에 노출되지 않게 밀폐된 디스크 드라이브의 작동 소리를 듣고 문제점을 진단하기 위한 용도로 쓸 수도 있다. 본래부터 좋거나 나쁜 툴은 없다. 다만 툴을 어떤 용도로 사용하느냐에 따라 달라질 뿐이다.
1980년대 초 IBM은 자사의 메인프레임 컴퓨터의 운영체제 소스코드를 고객들에게 더는 제공하지 않기로 결정했다. 메인프레임 고객은 항상 소스코드에 의존해서 IBM 운영체제의 문제점을 해결하고 원하는 용도에 맞게 수정하고 확장해 왔었다. IBM 사용자 그룹은 IBM의 조치에 대해 총기 규제법을 반대하는 사람들이 자신의 주장을 표현하기 위해서 내세우는 유명한 말을 차용해 “SOURCE가 불법이면 법을 위반하는 사람만이 SOURCE를 갖게 될 것이다”라는 식으로 바꿔 조롱을 퍼부었다. 해커와 악성코드 개발자들은 다른 소프트웨어를 해석하는 많은 기술을 이미 알고 있을 것이다. 하지만 이런 기술들은 악의적이지 않은 사람들에게도 유용하다는 사실이 중요하다.
리버스 엔지니어링은 특히 다양한 목적의 소프트웨어 분석에 유용하다.
■ 악성코드 검출: 많은 악성코드 기술들이 까다로운 코드가 어떻게 구조화 되어 있고 어떤 기능을 수행하는지 이해하고자 할 때 리버스 엔지니어링을 이용하다. 상용 악성코드 스캐너나 탐지기는 리버싱을 이용해 시그니처로 사용될 수 있는 인식 가능한 패턴을 판단한다.
■ 예상하지 못한 결함 발견: 훌륭하게 설계된 시스템이라고 할지라도 “순 공학(Forward Engineering)” 개발 기술로 인한 결함이 있을 수 있다. 리버스 엔지니어링을 이용하면 매우 중요한 소프트웨어 결함이 될 수 있는 것은 사전에 찾아낼 수 있다.
■ 남이 작성한 코드 사용 여부 판단: 지적 재산권에 관련된 재판을 지원하는 데에 있어서 보호된 코드나 기술이 애플리케이션 내부의 어디에서 사용되는지 알아내는 것은 중요하다. 리버스 엔지니어링을 이용하면 법적으로 문제가 되는 소프트웨어 요소의 존재 여부를 판단할 수 있다.
■ 셰어웨어와 오픈소스 코드의 사용 여부 판단: 소프트웨어 제품이 비공개적이나 독점적으로 사용되는 것이라면 공개된 코드를 쓰는 것 자체가 문제가 될 수 있다. 리버스 엔지니어링을 이용하면 코드가 복제됐는지 알 수 있다.
■ 남이 개발한 제품의 목적이나 영역에 대한 학습: 리버스 엔지니어링을 통해서 향상된 소프트웨어 학습이 가능하며 훌륭한 제품을 조사할 수 있다. 리버스 엔지니어링은 코드 지식을 쌓고 배우는 데 유용한 수단이 될 수 있다. 웹사이트를 만들 때 다른 웹사이트를 많이 참고한다. 수많은 웹 개발자들이 남들이 만든 웹사이트의 소스를 보면서 HTML과 웹 프로그래밍 기술을 배운다.
■ 원래 개발자가 미처 깨닫지 못한 특징이나 기회의 발견: 코드의 복잡성은 새로운 기술 혁신을 유발할 수 있다. 기존 기술을 새로운 환경에서 재사용하는 것이 가능하다. 리버스 엔지니어링을 통해 소프트웨어에 대한 새로운 발견과 새로운 기술 혁신의 기회가 마련될 수도 있다.
나는 CASE(Computer-Aided Software Engineering)의 적용 분야로서 새로운 시스템 개발과 소프트웨어 유지 보수에서 리버스 엔지니어링 툴을 통해 우리가 구축하는 시스템을 운용해야 한다고 오랫동안 주장해 왔다. 그렇게 해서 취약점과 문제점을 발견하면 이용자, 고객, 문제를 발견하고 해결하는 데 드는 많은 시간과 노력을 절약할 수 있다. 향상된 코드 이해를 통한 산업 전반의 비용 절감은 엄청나게 클 수 있다.
나는 30년 동안 소프트웨어 리버스 엔지니어링 분야를 연구해 왔다. 메인프레임, 중간 규모의 시스템, PC에서의 리버스 엔지니어링과 프로그램 언어, 바이너리 모듈, 데이터 파일, 작업 제어 흐름의 리버스 엔지니어링을 연구해 왔다. 리버스 엔지니어링 분야에 종사해 오면서 많은 방법론과 기술을 접해왔다. 하지만 그런 경력적인 배경에도 불구하고, 이 책을 통해서 많은 것을 배웠다. 여러분도 분명 그럴 것이라 믿는다.
소프트웨어를 해부해서 설계와 구현 내용, 심지어 소스코드까지도 알아낼 수 있어서 최근 보안업계의 화두로 떠오른 리버싱. 복제방지기술 무력화와 상용보안대책 무력화로 무장한 해커들의 리버싱 공격 패턴을 파악하기 위한 최신 기술을 담은 해킹 보안 업계 종사자의 필독서. 소프트웨어의 약점을 찾아내 보완하고, 해커의 공격이나 악성코드를 무력화하며, 더 좋은 프로그램을 개발할 수 있도록 프로그램의 동작 원리를 이해하는 데도 효율적인 리버스 엔지니어링의 비밀을 파헤친다.
[ 이 책에서 다루는 내용 ]
■ IA-32 호환 프로세서용 컴파일러가 만든 어셈블리 언어 코드를 읽는 방법
■ 문서화되지 않은 파일 포맷이나 네트워크 프로토콜 해석
■ 리버스 엔지니어링이 합법인 경우와 불법인 경우, 그리고 불법일 때의 이유
■ 리버싱을 활용해 해커가 복사 방지 기술을 무력화하는 방법
■ 리버스 엔지니어링을 적용해 악성코드를 무력화하는 방법
■ 코드 리버싱을 막는 방어책과 효과적인 수행 방법
■ 닷넷 플랫폼 리버싱과 어셈블리 언어인 MSIL
■ 실제 악성코드 프로그램 분석 방법
■ 악성코드 프로그램을 이용해 공격자가 감염된 시스템 제어권을 획득하는 과정
[ 이 책의 구성 ]
이 책은 크게 4부로 나뉘어 있다. 1부는 이 책 전반을 이해하는 데 필요한 기본 내용을 제공하고, 2부에서 4부까지는 각각 리버스 엔지니어링 시나리오와 실례를 설명한다.
■ 1부. 리버싱 입문: 이 책은 로우레벨 소프트웨어를 이해하는 데 필요한 모든 기본적인 내용에 대한 논의로 시작한다. 알다시피 1부에서 모든 내용을 다루는 것은 불가능하다. 다만 이미 알고 있는 내용을 다시 되새겨주는 기회가 될 것이다. 1부를 읽으며 내용이 생소하다고 느껴지는 독자라면 이 책은 적합한 책이 아니다. 1부에서 주로 다루는 주제는 다음과 같다. 리버스 엔지니어링 소개와 다양한 적용 분야(1장), 로우레벨 소프트웨어 개념(2장), 마이크로소프트 운영체제의 내부(3장). 이런 주제와 일반적인 로우레벨 소프트웨어를 많이 접해 봤다면 1~3장은 굳이 읽지 않고 건너 뛰어도 된다. 4장은 다양한 타입의 리버스 엔지니어링 툴을 소개하고, 다양한 상황에서 적절히 사용할 수 있는 특별한 형태의 툴을 설명한다. 이 책에서는 전반에 걸쳐, 리버스 엔지니어링에 사용되는 갖가지 툴을 설명한다.
■ 2부. 리버싱 실전: 2부에서는 실제 소프트웨어에 대한 실제적인 리버스 엔지니어링 프로젝트를 수행한다. 각 장마다 다양한 종류의 애플리케이션에 대한 리버스 엔지니어링을 설명한다. 5장에서는 윈도우 내부 서비스와 API를 좀 더 잘 사용할 수 있도록 운영체제나 다른 업체의 라이브러리를 리버스 엔지니어링하는 방법을 알려준다. 6장에서는 데이터 리버스 엔지니어링 기술을 적용해서 문서화되지 않은 파일 포맷을 해석하는 방법을 설명한다. 7장에서는 리버스 엔지니어링 기술을 사용해 실행 바이너리에서 보안 취약점을 발견해내는 방법을 배워본다. 마지막으로 8장에서는 바이러스나 웜과 같은 악성코드 소프트웨어를 설명한다. 8장에서는 실제 악성코드 프로그램을 리버스 엔지니어링 해본다. 이는 악성코드 프로그램을 연구하고 위험성을 평가하기 위해 반드시 필요한 작업이다.
■ 3부. 크래킹: 3부에서는 복사 방지와 디지털 저작권 관리(DRM) 기술과 같은 특정한 형태의 보안 관련 코드에 대한 리버스 엔지니어링에 초점을 맞춘다. 9장에서는 복사 방지 기술의 일반적인 원리를 소개하고, 10장에서는 복사 방지와 DRM 기술과 같은 안티 리버스 엔지니어링 기술들을 설명하며 그 기술의 유효성을 평가할 것이다. 11장에서는 크래커가 복사 방지 메커니즘을 무력화해서 복사 방지된 컨텐츠를 훔치기 위해 리버스 엔지니어링을 어떻게 이용하는지 알아본다.
■ 4부. 고급 디스어셈블리: 4부에서는 실행 프로그램의 디스어셈블리 이외 부분을 다룬다. 12장에서는 마이크로소프트 닷넷 기반 플랫폼에서 작성된 가상 머신 기반의 프로그램을 리버스 엔지니어링하는 과정을 설명한다. 또한 닷넷 플래폼을 소개하고 그것의 로우레벨 어셈블리 언어인 MSIL(Microsoft Intermediate Language)도 설명한다. 13장에서는 디컴파일의 이론적인 설명과 그것이 어떻게 작동하는지, 네이티브 어셈블리 언어 코드를 디컴파일하는 것이 왜 그렇게 어려운 것인지 설명한다.
■ 부록: 인텔 IA-32 어셈블리 언어로 작성된 프로그램을 해석하는 데 도움이 될 수 있는 내용을 부록으로 다룬다. 단순한 어셈블리 언어의 레퍼런스 가이드를 넘어서 이 책이 제공하는 부록에서는 많이 사용되고 있는 컴파일러에 의해 제거된 컴파일러의 표현 방법과 코드, 그들을 구별하고 해석하는 방법을 설명한다.
[ 이 책의 대상 독자 ]
이 책은 여러 분야에 종사하는 사람들에게 도움이 되는 기술을 다양하게 다룬다. 운영체제, 어셈블리 언어, 컴파일 같은 소프트웨어의 다양한 로우레벨 측면을 알고 싶어 하는 소프트웨어 개발자는 특히 더 유용한 정보를 많이 찾을 수 있을 것이다. 운영체제나 소프트웨어 라이브러리, 특정 소프트웨어 컴포넌트 등 기존 코드를 빠르고 효과적으로 분석할 수 있는 기술을 향상시키려는 사람에게도 유용할 것이다. 이외에도 이 책은 보안이나 저작권 제어 등과 같은 다양한 주제도 들어 있으므로, 리버스 엔지니어링에 특별한 관심이 없더라도 이 책이 다루는 다양한 주제에서 흥미로운 내용을 찾을 수 있을 것이다.
이 책을 읽기 전 선수 지식을 제공하기 위해 나는 비교적 최신의 기술 사항들을 가능한 한 모두 다루려고 노력했다. 따라서 1부는 이 책을 읽는 데 꼭 필요한 기본 지식을 설명하면서 시작한다. 하지만 이 책에서 정말로 많은 것을 얻기 원하는 독자라면 어느 정도의 소프트웨어 개발 경험이나 지식은 갖추는 편이 좋다. 전문적인 소프트웨어 개발 경험은 전혀 없지만 현재 컴퓨터 공학을 전공하는 학생이라면 이 책을 읽는 데 큰 문제는 없을 것이다. 반대로 컴퓨터를 전공한 적은 없지만 수년간 프로그래밍 작업을 수행해 온 사람이라면 이 책에서 더 많은 내용을 배울 수 있을 것이다.
마지막으로 이 책은 로우레벨 소프트웨어와 리버스 엔지니어링 경험이 이미 있는 사람 중에서 흥미로운 고급 기술을 배우길 원하거나 기존 코드에서 상세한 정보를 추출하는 방법을 알고자 하는 사람들에게 도움이 많이 될 것이다.
[ 추천의 글 ]
우리는 소프트웨어가 정확히 어떤 작업을 수행하는지 알지 못한 채 소프트웨어를 실행한다. 그런 식으로 실행되는 소프트웨어의 수가 얼마나 많은지 알게 된다면 여러분은 깜짝 놀랄 것이다. 우리는 대개 상용 소프트웨어 패키지를 구입한 후 설치 프로그램을 실행해 프로그램을 설치한다. 소프트웨어가 설치되는 과정에서 수많은 파일이 복사되고 시스템 설정이 변경된다. 또한 이전 버전의 파일들은 삭제되고 중요한 레지스트리 파일이 변경된다. 웹사이트를 방문할 때도 해당 사이트를 제대로 보거나 제공하는 기능을 이용하기 위해 수십 가지 프로그램과 코드를 실행해야 한다. 또한 수많은 게임 CD와 유틸리티 CD를 구입하거나 셰어웨어 형태의 프로그램들을 내려 받는다. 그리고 특정 프로그램의 일부 기능을 사용하기 위해 동료나 친구들과 프로그램을 교환해서 사용하기도 한다.
그러고 나서 소프트웨어 제조사의 프로그램 변경 내용을 전적으로 신뢰한 상태에서 업데이트와 패치를 설치한다. 그리고 프로그램의 최신 변경 내용이 시스템의 다른 프로그램에 아무런 영향도 끼치지 않기를 무턱대고 바라기만 한다. 즉 전혀 알지 못하거나 이해하지 못하는 그 수많은 프로그램에 의존하는 것이다.
지금까지의 내용은 비단 개인용 데스크탑이나 노트북 컴퓨터에만 해당되는 문제가 아니다. 유비쿼터스 컴퓨팅이나 “모든 곳에 소프트웨어를(software everywhere)”이라는 기치 하에 소프트웨어 제어와 소프트웨어 간의 상호 접속 기능이 장치 안에 탑재되는 일이 기하급수적으로 늘어나고 있다. 이제는 아폴로 우주선이 달에 착륙하는 데 필요했던 코드보다 더 많은 소프트웨어 코드가 자동차의 엔진 제어장치에 들어간다.
오늘날 소프트웨어는 너무 복잡하고 서로 연동해서 동작하므로 개발자조차도 애플리케이션의 특징이나 그로 인한 간접적인 영향을 다 알지 못한다. 프로그램의 모든 제어 경로와 사용자 옵션을 테스트하는 데 필요한 비용과 시간이 너무 커서 소프트웨어 테스트를 제대로 수행하지 못하는 경우가 흔하다. 현재는 네트워크 플랫폼이 점점 증가하고 소프트웨어 아키텍처 계층이 다양해지면서, 모든 가능한 조합을 테스트하는 일은 사실상 불가능하다. 마치 마약 거래를 사전에 잡아내는 것처럼, 많은 소프트웨어 시스템이 알려지지 않았거나 예측 불가능한 이슈들을 테스트하고 있다.
리버스 엔지니어링은 소프트웨어를 제대로 이해하기 위한 핵심 기술이며 도구다. 리버스 엔지니어링은 “시스템의 구성 요소와 구성 요소 간의 상관관계를 찾아내고 시스템을 하이레벨의 개념에서 다른 형태로 표현하는 분석 과정”(IEEE 1990)이다. 리버스 엔지니어링을 통해 소프트웨어의 구조와 동작 방식을 시각화할 수 있다. 소프트웨어 조사를 위한 자동화된 툴의 적용과 분석 기술을 통해서 소프트웨어의 복잡성을 이해할 수 있다.
리버스 엔지니어링은 오랫동안 우리 곁에 있어왔다. 개념적으로 보면 누군가 다른 사람의 코드를 보는 일도 리버싱을 수행하는 것이라고 간주할 수 있다. 또한 개발자가 자신이 작성한 코드를 며칠 후에 보는 것도 리버싱이라고 할 수 있다. 리버스 엔지니어링은 어떤 것을 찾아내는 작업이다. 우리는 자신이 작성한 코드든 다른 사람이 작성한 코드든 간에, 누구도 예상하지 못한 것을 조사하고 배우고 살펴볼 수 있다.
1990년까지 소프트웨어 리버스 엔지니어링은 각종 컨퍼런스나 컴퓨터 사용자 그룹의 모임에서 주제로 다뤄왔다. 공학 분야에서 리버스 엔지니어링이 인식되기 시작한 때는
“당신은 과연 리버스 엔지니어링을 묵과할 수 있습니까?” 나는 관리 정보 기술 컨설턴트로서 이런 질문을 자주 받아왔다. 그러고는 대개 다음과 같은 질문이 곧바로 뒤따른다. “당신은 소프트웨어를 개발해서 판매해 왔습니다. 그렇다면 다른 사람으로부터 당신의 지적 재산권을 보호하고 존중 받고 싶지 않나요?” 이에 대한 논의는 일반적으로 리버스 엔지니어링 용어에 대한 부정적인 의미로부터 출발한다. 하지만 리버스 엔지니어링 기술은 소프트웨어 공급자와 소비자 모두에게 여러 가지 면에서 가치가 있다.
청진기는 강도가 금고의 잠금장치를 딸 때 소리를 듣기 위한 도구로 이용하기도 한다. 하지만 의사가 심호흡기 질환을 발견하기 위한 도구로도 사용한다. 또는 컴퓨터 기술자가 디스크 드라이브에 잠재적인 해를 끼칠 수 있는 먼지나 꽃가루에 노출되지 않게 밀폐된 디스크 드라이브의 작동 소리를 듣고 문제점을 진단하기 위한 용도로 쓸 수도 있다. 본래부터 좋거나 나쁜 툴은 없다. 다만 툴을 어떤 용도로 사용하느냐에 따라 달라질 뿐이다.
1980년대 초 IBM은 자사의 메인프레임 컴퓨터의 운영체제 소스코드를 고객들에게 더는 제공하지 않기로 결정했다. 메인프레임 고객은 항상 소스코드에 의존해서 IBM 운영체제의 문제점을 해결하고 원하는 용도에 맞게 수정하고 확장해 왔었다. IBM 사용자 그룹은 IBM의 조치에 대해 총기 규제법을 반대하는 사람들이 자신의 주장을 표현하기 위해서 내세우는 유명한 말을 차용해 “SOURCE가 불법이면 법을 위반하는 사람만이 SOURCE를 갖게 될 것이다”라는 식으로 바꿔 조롱을 퍼부었다. 해커와 악성코드 개발자들은 다른 소프트웨어를 해석하는 많은 기술을 이미 알고 있을 것이다. 하지만 이런 기술들은 악의적이지 않은 사람들에게도 유용하다는 사실이 중요하다.
리버스 엔지니어링은 특히 다양한 목적의 소프트웨어 분석에 유용하다.
■ 악성코드 검출: 많은 악성코드 기술들이 까다로운 코드가 어떻게 구조화 되어 있고 어떤 기능을 수행하는지 이해하고자 할 때 리버스 엔지니어링을 이용하다. 상용 악성코드 스캐너나 탐지기는 리버싱을 이용해 시그니처로 사용될 수 있는 인식 가능한 패턴을 판단한다.
■ 예상하지 못한 결함 발견: 훌륭하게 설계된 시스템이라고 할지라도 “순 공학(Forward Engineering)” 개발 기술로 인한 결함이 있을 수 있다. 리버스 엔지니어링을 이용하면 매우 중요한 소프트웨어 결함이 될 수 있는 것은 사전에 찾아낼 수 있다.
■ 남이 작성한 코드 사용 여부 판단: 지적 재산권에 관련된 재판을 지원하는 데에 있어서 보호된 코드나 기술이 애플리케이션 내부의 어디에서 사용되는지 알아내는 것은 중요하다. 리버스 엔지니어링을 이용하면 법적으로 문제가 되는 소프트웨어 요소의 존재 여부를 판단할 수 있다.
■ 셰어웨어와 오픈소스 코드의 사용 여부 판단: 소프트웨어 제품이 비공개적이나 독점적으로 사용되는 것이라면 공개된 코드를 쓰는 것 자체가 문제가 될 수 있다. 리버스 엔지니어링을 이용하면 코드가 복제됐는지 알 수 있다.
■ 남이 개발한 제품의 목적이나 영역에 대한 학습: 리버스 엔지니어링을 통해서 향상된 소프트웨어 학습이 가능하며 훌륭한 제품을 조사할 수 있다. 리버스 엔지니어링은 코드 지식을 쌓고 배우는 데 유용한 수단이 될 수 있다. 웹사이트를 만들 때 다른 웹사이트를 많이 참고한다. 수많은 웹 개발자들이 남들이 만든 웹사이트의 소스를 보면서 HTML과 웹 프로그래밍 기술을 배운다.
■ 원래 개발자가 미처 깨닫지 못한 특징이나 기회의 발견: 코드의 복잡성은 새로운 기술 혁신을 유발할 수 있다. 기존 기술을 새로운 환경에서 재사용하는 것이 가능하다. 리버스 엔지니어링을 통해 소프트웨어에 대한 새로운 발견과 새로운 기술 혁신의 기회가 마련될 수도 있다.
나는 CASE(Computer-Aided Software Engineering)의 적용 분야로서 새로운 시스템 개발과 소프트웨어 유지 보수에서 리버스 엔지니어링 툴을 통해 우리가 구축하는 시스템을 운용해야 한다고 오랫동안 주장해 왔다. 그렇게 해서 취약점과 문제점을 발견하면 이용자, 고객, 문제를 발견하고 해결하는 데 드는 많은 시간과 노력을 절약할 수 있다. 향상된 코드 이해를 통한 산업 전반의 비용 절감은 엄청나게 클 수 있다.
나는 30년 동안 소프트웨어 리버스 엔지니어링 분야를 연구해 왔다. 메인프레임, 중간 규모의 시스템, PC에서의 리버스 엔지니어링과 프로그램 언어, 바이너리 모듈, 데이터 파일, 작업 제어 흐름의 리버스 엔지니어링을 연구해 왔다. 리버스 엔지니어링 분야에 종사해 오면서 많은 방법론과 기술을 접해왔다. 하지만 그런 경력적인 배경에도 불구하고, 이 책을 통해서 많은 것을 배웠다. 여러분도 분명 그럴 것이라 믿는다.
엘리엇 치코프스키
엔지니어링 매니지먼트 앤 인티그레이션 사(버지니아 주 헌던 시 소재)
리엔지니어링 포럼 의장
IEEE의 소프트웨어 공학기술위원회 사무국장
엔지니어링 매니지먼트 앤 인티그레이션 사(버지니아 주 헌던 시 소재)
리엔지니어링 포럼 의장
IEEE의 소프트웨어 공학기술위원회 사무국장