본문 바로가기

개발인생다반사/TIL(Today i learned)

TIL - 211125 [컴퓨터 공학] 기초

Achievement Goals

  • 프로그램, 프로세스, 스레드에 대해 기본적인 개념을 설명할 수 있다.
    • 동시성과 병렬성의 차이를 이해할 수 있다.
    • 자바스크립트 엔진(v8)이 어떤 특징을 가지고 있는지 이해할 수 있다.
  • 프로그래밍에서 문자열을 다루는 방법과 유니코드 및 인코딩에 이해할 수 있다.
  • 비트맵 이미지와 벡터 이미지의 차이를 이해할 수 있다.
  • 가비지 컬렉션에 대해 이해할 수 있다.
  • 웹 서비스에서 사용하는 다양한 캐싱의 사례를 이해할 수 있다.

CHAPTER 1 컴퓨터 공학

1. 문자열

유니코드 : 유니코드 협회(Unicode Consortium)에서 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준. ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자 알고리즘을 포함

 

인코딩(부호화) : 어떤 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것. 인코딩은 이 신호를 입력하는 것. 디코딩은 이 신호를 해독하는 것. 입력과 해독은 일정한 기준에 의해서 처리되는데 이 기준을 문자열 세트 또는 문자세(charset)이라고 한다. 이 문자세의 국제 표준이 유니코드이다.

 

ASCII 문자 : 영문 알파벳을 사용하는 대표적인 문자 인코딩. 7비트로 모든 영어 알파벳 표현. 유니코드는 ASCII를 확장한 형태

 

UTF-8과 UTF-16의 차이점

- 인코딩 방식의 차이. Universal Coded Charactore Set + Transformation Format - 8 - bit 약자.

 

1. UTF-8 특징 : 가변 길이 인코딩

유니코드 한 문자를 나타내기 위해 1 byte(=8bits)에서 4bytes까지 사용

'코'라는 문자는 유니코드 U+CF54(16진수, HEX)로 표현. 이진법으로 표시하면

1100-1111-0101-0100

네트워크를 통해 전송되는 텍스트는 주로 UTF-8로 인코딩 된다.

 

3. UTF-16 특징: 코드 그대로 바이트로 표현 가능

UTF-16은 대부분 2 바이트로 표현

 

2. 그래픽

비트맵(래스터)과 벡터 이미지의 차이점

Raster - jpg, gi, png, bmp, psd

Vector -svg, ai. 작은 파일 사이즈 유지. 품질저하 없음. 해상도 영향없음

 

CHAPTER 2 운영체제

1. 운영체제 개요

1. 운영체제

시스템 자원 관리

응용 프로그램(application)은 컴퓨터를 이용해 다양한 작업을 하는 것이 목적.

운영 체제(OS)는 응용 프로그램이 하드웨어에게 일을 시킬 수 있도록 도와준다.

 

응용 프로그램 관리

응용 프로그램은 권한에 대한 관리가 필요. OS는 응용 프로그램이 실행되고 시스템 자원을 사용할 수 있도록 권한과 사용자를 관리한다.

 

2. 응용 프로그램 : 운영체제를 통해 컴퓨터에게 일을 시키는 것

응용 프로그램이 운영체제를 통해 컴퓨터에게 일을 시키리면 컴퓨터를 조작할 수 있는 권한을 운영체제로 부터 부여 받아야 한다.

응용 프로그램이 운영체제와 소통하기 위해서는 운영체제가 응용 프로그램을 위해 인터페이스(API)를 제공해야 한다.

응용 프로그램이 시스템 자원을 사용할 수 있도록 운영체제 차원에서 다양한 함수를 제공하는 것을 시스템 콜이라고 부른다.

 

2. 프로세스, 스레드, 멀티 스레드

1. 프로세스

운영체제에서 실행 중인 하나의 애플리케이션을 프로세스라고 부른다. 예를 들어 Chrome 브라우저를 두 개 실행하면, 두 개의 프로세스가 생성된다.

2. 스레드

스레드는 한 가닥의 실이라는 뜻. 한 가지 작업을 실행하기 위해 순차적으로 실행한 코드를 실처럼 이어 놓았다고 해서 유래된 이름. 하나의 스레드는 코드가 실행되는 하나의 흐름이기 때문에, 한 프로세스 내에 스레드가 두 개라면 코드가 실행되는 흐름이 두 개 생긴다는 의미

3. 멀티 스레드

운영체제는 멀티 태스킹을 할 수 있다.  멀티 프로세스가 애플리케이션 단위의 멀티 태스킹이라고면, 멀티 스레드는 애플리케이션 내부에서의 멀티 태스킹이라고 할 수 있다.

 

멀티 스레드는 다양한 곳에서 사용. 대용량 데이터의 처리시간을 줄이기 위해 데이터를 분할하여 병렬로 처리하는데에 사용할 수 있다. UI를 가진 앱의 네트워크 통신. 여러 클라이언트의 요청을 처리하는 서버 개발

 

3. 멀티 스레드

1. 스레드의 특징

스레드마다 call stack이 존재(call stack: 실행 중인 서브루틴을 저장하는 자료 구조)

스레드는 다른 스레드와 독립적으로 작동

 

2. 멀티 스레딩의 장점

프로세스를 이용하여 동시에 처리하던 일을 스레드로 구현할 경우, 메모리 공간과 시스템 자원의 소모가 줄어든다.

스레드 간의 통신이 필요한 경우에도 별도의 자원을 이용하는 것이 아니라, 전역 변수의 공간 또는 동적으로 할당된 공간인

Heap 영역을 이용. 프로세스간 통신 방법(IPC)에 비해 스레드 간의 통신 방법이 훨씬 간단.

 

3. 멀티 스레딩의 문제점

서로 다른 스레드가 같은 데이터에 접근하고, 힙 영역을 공유하기 때문에 서로 다른 스레드가 서로 사용 중인 변수나 자료구조에 접근하여 엉뚱한 값을 읽어오거나 수정하는 일이 발생할 수 있다.

 

그래서 멀티 스레딩 환경에서는 동기화 작업이 필요. 동기화를 통해 작업 처리 순서를 제어하고, 공유 자원에 대한 접근을 제어 해야 한다.

관련 키워드

  • 데드락(Deadlock, 교착 상태)
  • 뮤텍스(Mutex), 세마포어(Semaphore)

 

4. 동시성과 병렬성의 차이

싱글 코어와 멀티 코어 예시

동시에 돌릴 수 있는 스레드 수는 컴퓨터에 있는 코어 개수로 제한. 

운영체제(또는 가상 머신)는 각 스레드를 시간에 따라 분할하여, 여러 스레드가 일정 시간마다 돌아가면서 실행되도록 합니다.

이런 방식을 시분할이라고 합니다.

  • Concurrency(동시성, 병행성): 여러 개의 스레드가 시분할 방식으로 동시에 수행되는 것처럼 착각을 불러일으킴
  • Parallelism(병렬성): 멀티 코어 환경에서 여러 개의 스레드가 실제로 동시에 수행됨
  • Context Switching : 다른 테스크가 시작할 수 있도록 이미 실행 중인 태스크를 멈추는 것.