본문 바로가기
지식/컴퓨터아키텍쳐

Computer Abstractions and Technology(2)

by 칙칙폭폭 땡땡 2025. 10. 7.
반응형

폰 노이만 병목 현상

폰 노이만 구조

폰 노이만 구조는 프로세서(xPU)와 메모리를 물리적으로 분리하여 구성하는 컴퓨터 구조다 프로세서 내부에는 데이터에 대한 연상을 수행하는 Datapath와 데이터 패스, 메모리 등의 동작 순서를 제어하는 Control Unit이 포함된다.

폰 노이만 병목 현상

이 구조의 한계는 Data Movement에서 발생한다

폰 노이만 구조는 xPU의 많은 연산 데이터 요구때문에 심한 병목 현상이 있다.

  • 프로세서가 연산을 수행할 때마다 명령어와 데이터를 메모리에서 끊임없이 읽어오고 결과를 다시 기록해야 하는데, 이 과정에서 프로세세의 연산 속도와 메모리 간의 데이터 전송 속도 사이에는 큰 차이가 생긴다.
  • 그래서 프로세스가 메모리에 데이터를 가져오거나 메모리로 데이터를 보내느라 대기하는 시간이 길어져서 비효율이 발생한다.

PIM 구조

PIM은 이러한 폰 노이만 병목 현상을 해결하기 위해 등장한 컴퓨터 구조다

PIM 구조는 메모리의 셀 배열에 직접 연산 기능을 추가했다

반복되는 많은 연산을 메모리 내부에서 수행이 가능한 것이다.

  • 연산을 수행하는 곳과 데이터가 저장된 곳의 거리를 물리적으로 아주 줄였기 때문에 프로세서와 메모리 사이의 불필요한 이동이 최소화된다.

성능

CPU의 실행 시간은 아래와 같이 결정된다.

 
기호
설명
주요 영향
명령어 수
Instruction Count
프로그램 실행에 필요한 총 명령어 수
알고리즘 프로그래밍 언 컴파일러
명령어당 사이클 수
Cycles Per Instruction
명령어 하나를 실행하는 데 필요한 평균 클럭 사이클 수
알고리즘 프로그래밍 언어 컴파일러 ISA
클럭 주기 시간
Clock Cycle Time
하나의 클럭 사이클이 걸리는 시간
ISA

예시(1)

컴퓨터
클럭 주기 시간
CPI
A
250ps
2.0
B
500ps
1.2

Q: 누가 더 빠른가??

A: IC * 2.0 * 250ps = IC * 500ps

B: IC * 1.2 * 500ps = IC * 600ps

⇒ A가 더 빠르다

(ps는 Picosecond)

예시(2)

class
A
B
C
CPI for class
1
2
3
IC in sequence 1
2
1
2
IC in sequence 2
4
1
1

Q: Avg CPI for seq1 and seq2??

seq1: 1 * 2 + 2 * 1 + 3 * 2 = 10 ⇒ 10 / 5 = 2

seq2: 1* 4 + 2 * 1 + 3 * 1 = 9 =? 9 / 6 = 1.5

전력과 에너지

트렌지스터가 상태를 전환할 때 소모되는 에너지는 캐패시터와 전압에 의존한다. (C, V)

전환에 필요한 에너지는 다음 식에 비례한다.

성능을 높이기 위해서 클럭 주파수를 증가시키면 이에 따라서 전력 소모가 선형적으로 증가한다.

또한 전력 소모로 인한 전류 누설 문제를 피하기 위해서 전압을 조금이라도 높이면 전력은 그 제곱에 비례해서 증가한다.

전력이 증가하면 따라오는 두 가지 문제가 있다.

발열

칩에서 발생하는 열을 더 이상 효율적으로 제거할 수 없다.

칩이 소비하는 전력은 열로 발산되는데 이 열을 식히는 능력이 프로세서가 요구 하는 최대 전력 소모를 따라잡지 못한다.

전압 감소 한계

위 비례식에서 알 수 있듯이 전압을 낮추는 것이 전력을 줄이는 가장 효과적인 방법인데, 일정 수준 이하로 전압을 낮추면 트렌지스터가 제대로 스위치 되지 않아 전류가 누설된다.

이 누설된 전류는 칩의 전력 소비의 대략 40%를 차지한다.

그래서 전압을 낮출 수는 없다.

해결책은 멀티 프로세서

멀티 프로세서

단일 코어들의 전압과 주파수를 낮춘다. 전압은 조금만 낮아져도 전력 소모가 크게 감소한다.

그리고 코어의 수를 증가시킨다. 이렇게 전력 효율을 높인다.

더 작고 성능 가성비가 좋은 효율적인 코어 여러개를 하나의 칩에 장착한다

그러면 코어당 성능은 느리더라도 여러 코어가 동시에 작동하는 병렬성을 통해서 전체 시스템의 throughput을 높일 수 있다.

반응형

'지식 > 컴퓨터아키텍쳐' 카테고리의 다른 글

Machine Language  (0) 2025.10.16
Instructions(3)  (0) 2025.10.07
Instruction(2)  (0) 2025.10.07
Instructions(1)  (0) 2025.10.07
Computer Abstractions and Technology(1)  (0) 2025.10.07