[인프라 엔지니어의 교과서] 1장 - 인프라 엔지니어의 업무

2021. 8. 1. 20:0004. Archives/독서

728x90
반응형

1장 - 인프라 엔지니어의 업무

인프라 엔지니어에게 요구되는 것

  • 기술력
  • 책임감
  • 정보 수집력
  • 결단력


인프라 엔지니어의 업무

인프라 설계

  • 인프라를 만든 목적 이해
  • 조건을 특정 기준(필요한 기능, 성능)으로 정리
  • 조건에 맞는 기획서, 설계서 작성
  • 책임자 결재 요청

인프라 구축

  • 분류
    • 기기의 운반과 조립
    • 장착
    • 설치
    • 설정
    • 동작 테스트
    • 부하 테스트

인프라 운영

장애 대응

  • 하드웨어 고장 대응
  • 급격한 액세스 증가에 대한 대책
  • 부적절한 권한 설정에 의해 액세스가 불가능한 상황의 해소

수용량 관리

  • 적당한 시기에 인프라의 수용력 재검토 필요
    • 시간이 지나면서 액세스 수나 데이터 양에 변동이 생기기 때문
  • 수용량 증가 → 인프라 추가
  • 수용랑 감소 → 인프라 축소

인프라가 원인이 아닌 문제의 파악

  • 장애 원인이 파악 후, 인프라가 원인이 아닌 경우에 대응 가능한 부서에 대응 요청

IT 인프라를 구성하는 요소

퍼실리티

  • 건물, 시설, 설비를 의미
  • 데이터 센터
  • 데이터 센터를 구성하는 랙
  • 에어컨
  • 발전기
  • 변압기
  • 소화 설비 등

서버, 스토리지

  • IT 서비스를 제공하는 서버
  • 데이터를 대량으로 저장하는 스토리지

네트워크

  • 서버와 스토리지를 연결하고 인터넷에 접속하는 네트워크

기술자 관점에서 보는 인프라 엔지니어

인프라 엔지니어는 우수한 기술자여야 한다.

  • 요청된 과제에 대해 기술적인 관점에서 적절한 답을 제시, 실천 가능
  • 어떤 문제 발생 시 단기간에 본질적인 해결책 제시
  • 정확한 지식과 정보 수집력
  • 최신 동향에도 정통

서버 하드웨어

  • 종류
    • Intel Architecture
    • 엔터프라이즈 서버
  • 주요 부품
    • 메인보드
    • CPU (Central Processing Unit)
    • 메모리
    • 저장장치
    • NIC (Network Interface Card)
    • PSU (Power Supply Unit)

서버 운영체제

  • 리눅스, 윈도우, 유닉스
  • 장애 대응 - 실전 경험이 제일 중요

스토리지

네트워크 설계와 구축

  • 네트워크를 구축하고나서 제대로 동작하지 않았을 경우 원인 파악을 쉽게 하기 위해서 설계 단계부터 최대한 많은 검토를 통해 문제점을 파악해야 함
  • 네트워크는 외부 네트워크와 연결이 되어야 인터넷이 성립
  • 외부 네트워크와 연결했을 때 생기는 문제에 대응하기 위해서 다음 사항을 명확히 알아야 함
    • 프로젝트에 관한 정확한 이해
    • 자신들의 설계와설정은 아무 문제가 없다는 확신
    • 상대방의 설계나 설정이 아마도 틀렸을거라는 근거

네트워크 장비

  • 장비의 주된 역할
    • 통신의 교환
  • 장비 선정시 파악해야하는 내용
    • 연결하는 서버 및 네트워크 장비의 수와 커넥터의 차이
    • 어느 정도의 통신량을 얼마나 빠르게 교환하고 싶은지
    • 라우터
    • 스위치
      • L2
      • L3
      • L4
      • L7

선정자로서의 인프라 엔지니어

인프라 엔지니어는 기술자로서 객관적인 이유를 모아 모든 선택들을 최고의 선택으로 이끄는 게 중요

시스템 구성

  • 프로젝트에 대해서 어떤 시스템을 어느 정도의 규모로 어떻게 구성할 것인지 검토

서버 사양 선정

  • 부품에서 결정할 사항
    • CPU
    • 메모리
    • 디스크
    • RAID (Redundant Array of Inexpensive Disk)
    • NIC
    • PSU의 이중화 필요성
    • 보수 연수
    • 보수 레벨
    • 확장성
    • 물리적 크기 및 중량

네트워크 구성

  • 몇 개의 스위치가 랙에 필요한지
  • 각 스위치의 수용량
  • 채택 업체
  • 보증 기간
  • 네트워크 인터페이스별 통신량 선정 및 이중화 여부 결정

데이터베이스 설계

  • 종류와 요건 검토
    • RDBMS의 선정
    • 필요 용량 계산
    • 데이터 베이스 스키마와 물리적 데이터 배치 결정

운영 시스템

  • 시스템 감시 및 운영 방법 검토

운영 시스템의 예

  1. 시스템 감시 도구를 이용하여 장애 발생 감지, 장애 발생 감지한 경우에만 사원이 직접 대응
  2. 1차 대응 - MSP 업체, 그래도 해결되지 않는 경우 사원에게 문제 전달 및 대응
  3. 별도 조직 생성 후 24시간 365일 감시 시스템 구축

사내에서의 책임 범위

  • 서비스, 기술, 시스템 별로 사내에서의 책임 범위 결정
반응형