[인프라 엔지니어의 교과서] 1장 - 인프라 엔지니어의 업무
2021. 8. 1. 20:00ㆍ04. Archives/독서
728x90
반응형
1장 - 인프라 엔지니어의 업무
인프라 엔지니어에게 요구되는 것
- 기술력
- 책임감
- 정보 수집력
- 결단력
인프라 엔지니어의 업무
인프라 설계
- 인프라를 만든 목적 이해
- 조건을 특정 기준(필요한 기능, 성능)으로 정리
- 조건에 맞는 기획서, 설계서 작성
- 책임자 결재 요청
인프라 구축
- 분류
- 기기의 운반과 조립
- 장착
- 설치
- 설정
- 동작 테스트
- 부하 테스트
인프라 운영
장애 대응
- 하드웨어 고장 대응
- 급격한 액세스 증가에 대한 대책
- 부적절한 권한 설정에 의해 액세스가 불가능한 상황의 해소
수용량 관리
- 적당한 시기에 인프라의 수용력 재검토 필요
- 시간이 지나면서 액세스 수나 데이터 양에 변동이 생기기 때문
- 수용량 증가 → 인프라 추가
- 수용랑 감소 → 인프라 축소
인프라가 원인이 아닌 문제의 파악
- 장애 원인이 파악 후, 인프라가 원인이 아닌 경우에 대응 가능한 부서에 대응 요청
IT 인프라를 구성하는 요소
퍼실리티
- 건물, 시설, 설비를 의미
- 데이터 센터
- 데이터 센터를 구성하는 랙
- 에어컨
- 발전기
- 변압기
- 소화 설비 등
서버, 스토리지
- IT 서비스를 제공하는 서버
- 데이터를 대량으로 저장하는 스토리지
네트워크
- 서버와 스토리지를 연결하고 인터넷에 접속하는 네트워크
기술자 관점에서 보는 인프라 엔지니어
인프라 엔지니어는 우수한 기술자여야 한다.
- 요청된 과제에 대해 기술적인 관점에서 적절한 답을 제시, 실천 가능
- 어떤 문제 발생 시 단기간에 본질적인 해결책 제시
- 정확한 지식과 정보 수집력
- 최신 동향에도 정통
서버 하드웨어
- 종류
- Intel Architecture
- 엔터프라이즈 서버
- 주요 부품
- 메인보드
- CPU (Central Processing Unit)
- 메모리
- 저장장치
- NIC (Network Interface Card)
- PSU (Power Supply Unit)
서버 운영체제
- 리눅스, 윈도우, 유닉스
- 장애 대응 - 실전 경험이 제일 중요
스토리지
- 신기술
- 스토리지 가상화
- 씬 프로비저닝
- 중복 제거
- 스냅샷
- 비용 대비 효과 측며네서 적절한 스토리지를 선정할 수 있는 능력 필요
네트워크 설계와 구축
- 네트워크를 구축하고나서 제대로 동작하지 않았을 경우 원인 파악을 쉽게 하기 위해서 설계 단계부터 최대한 많은 검토를 통해 문제점을 파악해야 함
- 네트워크는 외부 네트워크와 연결이 되어야 인터넷이 성립
- 외부 네트워크와 연결했을 때 생기는 문제에 대응하기 위해서 다음 사항을 명확히 알아야 함
- 프로젝트에 관한 정확한 이해
- 자신들의 설계와설정은 아무 문제가 없다는 확신
- 상대방의 설계나 설정이 아마도 틀렸을거라는 근거
네트워크 장비
- 장비의 주된 역할
- 통신의 교환
- 장비 선정시 파악해야하는 내용
- 연결하는 서버 및 네트워크 장비의 수와 커넥터의 차이
- 어느 정도의 통신량을 얼마나 빠르게 교환하고 싶은지
- 라우터
- 스위치
- L2
- L3
- L4
- L7
선정자로서의 인프라 엔지니어
인프라 엔지니어는 기술자로서 객관적인 이유를 모아 모든 선택들을 최고의 선택으로 이끄는 게 중요
시스템 구성
- 프로젝트에 대해서 어떤 시스템을 어느 정도의 규모로 어떻게 구성할 것인지 검토
서버 사양 선정
- 부품에서 결정할 사항
- CPU
- 메모리
- 디스크
- RAID (Redundant Array of Inexpensive Disk)
- NIC
- PSU의 이중화 필요성
- 보수 연수
- 보수 레벨
- 확장성
- 물리적 크기 및 중량
네트워크 구성
- 몇 개의 스위치가 랙에 필요한지
- 각 스위치의 수용량
- 채택 업체
- 보증 기간
- 네트워크 인터페이스별 통신량 선정 및 이중화 여부 결정
데이터베이스 설계
- 종류와 요건 검토
- RDBMS의 선정
- 필요 용량 계산
- 데이터 베이스 스키마와 물리적 데이터 배치 결정
운영 시스템
- 시스템 감시 및 운영 방법 검토
운영 시스템의 예
- 시스템 감시 도구를 이용하여 장애 발생 감지, 장애 발생 감지한 경우에만 사원이 직접 대응
- 1차 대응 - MSP 업체, 그래도 해결되지 않는 경우 사원에게 문제 전달 및 대응
- 별도 조직 생성 후 24시간 365일 감시 시스템 구축
사내에서의 책임 범위
- 서비스, 기술, 시스템 별로 사내에서의 책임 범위 결정
반응형
'04. Archives > 독서' 카테고리의 다른 글
[책/경제] 부의 시나리오 - 오건영 (0) | 2021.09.22 |
---|---|
다음 포스팅 토픽 - 운영체제, 셸 스크립트 (0) | 2021.08.26 |
[도커/Docker] Ch2. 도커 엔진 (I) (0) | 2021.04.03 |
[도커/Docker] Ch1. 도커란? (0) | 2021.04.01 |
[도커/Docker] "시작하세요! 도커/쿠버네티스" 정리 (0) | 2021.03.31 |