nand2tetris - 6. hack 기계어와 어셈블리어 1

ggamji 2022. 5. 16. 22:59

2022. 5. 16. 22:59

3장에서 메모리 구현을 마무리하고,

이제 4장에서는 hack의 기계어와 어셈블리어에 관해서 설명한다.

일단 이책 7장 가상 머신 중간까지 완전히 이해했다고 하기는 힘들지만

어느정도 보기는 했는데

4장 부터는 어떻게 정리해야되나 싶다.

전처럼 아예 책을 통째로 번역하는짓은 하고 싶지는 않은데,

기계어와 고급언어

아무튼 이번 장에서는 우리가 구현할 컴퓨터 hack의 기계어와 어셈블리어가 어떻게 되는지

메모리 구조 등에서 간단하게 살펴본다.

일단 기계어에 대해서 설명하고 있는데,

보통 강의에서는 간단하게 컴퓨터가 알아들을 수 있는 2진수를 보고 기계어라고 하는 정도로만 설명한다.

하지만 우리가 할 내용들은 거기서 조금 더 나아가서

기계어란 CPU가 산술 논리 연산을 하고, 메모리에 읽고 쓰기를 할수 있도록 작성한 언어라고 이해하면 된다.

또 보통 강의에서는 기계어와 고급언어 차이를 설명한다면

고급언어는 사람이 보고 이해할수 있고, 기계어는 사람이 이해할수 없는 언어라는 정도로 이야기 하고 넘어가지만.

고급언어의 이식성? 저급언어는 하드웨어 의존적? 무슨소리인가.

기계어와 고급언어의 또 다른 차이점이라 하면

앞서 우리가 만들 컴퓨터 hack은 16비트 컴퓨터로 한번에 16비트 크기의 데이터를 처리하는 만큼

레지스터, 메모리, 프로그램 카운터, ALU 등 모두 16비트 입력을 받고 연산 할수있도록 만들었었다.

또, 메모리의 경우 16K 공간을 차지하도록 4K 메모리를 4개를 붙여서 만들었었는데,

그러면 hack 컴퓨터의 기계어를 다른 컴퓨터의 프로세서에다가 동일하게 쓸수 있을까?

당연히 안된다. 16비트 길이의 기계어 00000000 11001010를

32비트 컴퓨터에는 길이가 다르니 당연히 쓸수 없고

동일한 16비트 컴퓨터라 하더라도 이전에 만든 alu에서 상태 출력으로 zr과 ng가 있었는데,

상태 출력을 없애거나 다른 상태 결과도 출력하도록 혹은 어떻게든간에 수정한다면 기존의 논리 회로가 달라질것이고

(동일한 16비트 기계어에서 동작가능하도록 변경이야 할수는 있겠지만, 기존의 기계어 규칙으로 동작못하게 바꾸면)

우리가 이미 만든 alu로 and 연산을 하든 +1 연산을 하는든 뭔 연산을 할때의 기계어와

수정한 프로세서로하는 and 연산, +1 연산을 하도록 하는 기계어가 다를 것이다.

그래서 한 프로세서의 기계어는 다른 프로세서에서 사용할수 없으며

이를 하드웨어에 의존적이다. 호환되지 않는다는 식으로 표현한다.

x86이니 x64니 arm이니 코어텍스가 뭐니 하는 내용까지는 제대로 정리해본적이 없어서 설명할수는 없지만

이런 이유로 저급언어는 각 프로세스마다 다르기 때문에 하드웨어에 의존적이라고 한다.

하지만 고급언어는 어떨까?

처음 C언어나 Java, 파이썬 같은 언어를 공부할 때 이식성이 좋다,

하나의 코드로 여러 플랫폼에서 사용가능하다는 식으로 설명한다.

나도 처음에 수업 들을때 아무도 이거에 대해서 제대로 설명해주질 않아서

이식성이 좋다는게 무슨 의미인지는 잘 모르지만, 그냥 그러려니 하고 넘어갔었다.

이걸 공부하면서 조금 더 와닿게 이해할수 있는데,

여기서 이식성이 좋다는 말은 어느 환경에서 코드를 작성하던 간에

이 프로그램을 리눅스면 리눅스, 윈도우면 윈도우, x86, atmega이든지

각 프로세서가 뭔지 동작 할 환경을 선택해서 컴파일하기 때문에

하나의 코드로도 사용하는 컴파일러나 가상머신에 따라

해당 프로세서에 적합하게 기계어/바이너리를 만들어내어

똑같은 코드지만 안드로이드에서도 돌아가고 윈도우에서 돌아가고, 다른 MCU 등

다양한 환경에서 실행가능하게 된다는 의미로 이식성, 호환성이 좋다고 하는 거더라

하지만 이런 고급언어와 컴파일러같은걸 생각안하고

직접 어셈블리어든 기계어를 바로 작성 한다면 프로세서 마다 다르게 작성해줘야 할거다.

기계어와 구성 요소

그러면 기계어에는 어떤 것들이 있을까?

이미 알겠지만 이진수로 된 바이너리와 알아볼수 있는 문자로 된(=심볼릭한) 어셈블리어가 있다.

저자가 말하기를 기계어로 직접 코딩하는 사람은 많진 않지만 이런 저수준 프로그래밍을 할 수 있다면

우리가 일반적으로 쓰는 고급 언어의 동작을 더 잘 이해하고 효율적으로 작성할수 있게 된다고 한다.

이미 앞에서 말한거지만 기계어는 단순한 0과 1의 조합에서 조금 더 정확하게 이야기하면

프로세서가 레지스터와 메모리 사이에 값을 읽고 쓰도록 제어하도록 만든 동작 과정인데

메모리는 명령어와 데이터들을 저장하는 장치로, 지난 장에서 메모리를 만들때 봤다시피 한 레지스터마다 고유의 주소를 가지고 있어 우리는 이 주소값을 이용하여 해당 메모리에 접근해 값을 읽거나 덮어씌운다.

프로세서(CPU)의 경우 구성요소 중 하나인 ALU를 구현했을때 봤다시피 산술, 논리 연산뿐만이아니라 기억장치에 접근하고, 분기 연산을 수행가능하도록 만든 장치라 할수 있다. 분기 연산이 어떻게 되는지는 아직 보지는 않았지만 2장 과제를 하면서 이 게이트, 저게이트 합쳐서 만든 ALU가 실제로 산술논리 연산하는것을 시뮬레이션을 돌리면서 봤었다.

프로세서는 레지스터라고 하는 작은 기억장치를 가지고 있는데, 레지스터의 경우 프로세서가 메모리를 접근해서 값을 읽고 쓴다고 했었지만 프로세서와 메모리 사이의 거리는 사람 기준으로 가깝다 해도 컴퓨터의 동작 클럭을 생각하면 너무 먼 거리고 시간도 오래걸릴것이다. 그래서 다양한 이유로 CPU 내부에 사용할수 있도록 만든 작지만 고속의 기억장치를 레지스터라 한다.

잠깐 딴 소리지만 레지스터에 대해서 정리하다가 생각난게 그 동안 이전에 컴공 공부하거나 자격증 준비하면서 SRAM은 정적인 비활성메모리다, DRAM은 동적인 비활성메모리다. 정도로만 이해하고 있다가. 전기 자격증도 준비하고, 폴리텍에서 공부하면서 SRAM과 DRAM에 대해서 조금 더 자세히 알게 되었었는데,

SRAM의 경우 플립플롭을 이용해서 만든 저용량이지만 고속의 기억장치로 케시메모리로 사용되고,

DRAM의 경우 캐패시터를 이용해서 만든 기억장치로 케시메모리에 비해 느리지만 큰 용량이라 메인 메모리로 사용된다고한다.

전처럼 아예 책 번역하는게 아니라 생각 정리하는건데도 생각보다 오래걸린다..

아무튼 다시 레지스터로 돌아와서 다른 cpu도 비슷하겟지만 hack의 레지스터로는 값을 저장하는 데이터 레지스터와 데이터 값 또는 메모리 주소를 저장하는 어드레스 레지스터 두 종류가 있고, 어드레스 레지스터가 가진 주소값에 접근하여 값을 읽고 쓰게 된다. 지난 렘 시뮬레이션때는 어드레스 레지스터의 값은 아니지만 .cmp 파일에서 지정한 주소에 접근해서 값을 읽고 쓰는고 원하는 결과가 나왔는지 비교하는 시뮬레이션을 돌렸었다.

기계어 : 바이너리와 심볼릭

아까 기계어는 2진수 바이너리와 사람이 알아볼 수 있는 심볼릭(=어셈블리어 같은거) 두 가지가 있다고 했다.

R1 + R2한 결과를 R1에다가 저장하라는 연산을 바이너리랑 심볼릭으로 적어본다고 하자.

기계어로 쓸때 덧셈 연산을 6비트로 101011, R1과 R2 레지스터는 각각 5비트로 00001, 00010이라 할때 이들을 합쳐 16비트 바이너리 코드로 만들면 1010110001000001 -> 101011(add)/00010(R2)/00001(R1)이 된다.

심볼릭 하게 쓴다면(어셈블리어는 아니지만, 뭔소린지 알수있게) set R1 = R1 + R2 같은 식으로 될거같다.

심볼릭을 보면 R, 1, 2, + 같은 심볼(상징, 부호, 기호라고 하는데 부호 정도로 해야지)이 여러 차례 나오게 될텐데 이들을 어셈블리어라고 하며, 이런 심볼들을 기계어로 바꾸는 번역기가 어셈블리어가 된다.

아까도 말한거지만 어떤 하드웨어에 상관없이 사용가능한 고급언어와는 다르게 저급 언어는 ALU나 메모리, 레지스터 등에 따라서 다르다지만 비슷한 CPU 제품군 끼리는 동일한 기계어를 쓸수 있도록 되어있다고 한다.

심볼릭 명령어의 예시

1. 산술 논리 연산

load R1, 17 //17을 R1에 넣어라

add R1, R1, R2 //R1, R2를 더해서 R1에 넣어라

load R1, true //R1에다가 true를 넣어라

and R1, R1, R2 //R1에다가 R1, R2 and 연산 결과를 넣어라

2. 메모리 접근 방법

다른 컴퓨터는 어떤지는 모르지만 hack 컴퓨터의 경우 어드레스 레지스터 A를 이용해서 메모리 접근을 한다.

메모리의 15번지에다가 1을 넣고 싶다면,

(1) load A, 15 명령으로 어드레스 레지스터 A에다가 1을 넣고

(어드레스 레지스터 A는 값을 임시로 저장하거나, A에 저장된 값은 메모리 레지스터 M의 주소를 의미한다. A에다가 값을 저장한건지 M의 주소를 담는 건지는 기계어에 따라서 구분하니 뒤에 참고하면 된다.)

(2) load M, 1 명령으로 메모리 레지스터 M에다가 1을 대입하면 된다.

왜 M에 저장이 안되고 15번지에 저장이 되었는지는 어드레스 레지스터 A에 입력된 값이 곧 메모리 레지스터 M의 주소이기 때문이다. (꼭 A에 저장된 값이 M의 주소값으로만 사용되는 건 아니다.)

3. 흐름 제어와 심볼

우리가 C언어를 공부할 때 goto나 어떤 언어를 공부하던간에 반복문을 배웠을거고 정말 자주 사용한다.

goto나 반복문에서는 어떻게든 간에 goto를 만나거나 반복문의 끝에 도달하면 지정한 곳이나

반복문의 앞으로 돌아갔지만 그러면 어셈블리어에서는 어떻게 사용할까?

물리적인 주소를 사용하는 경우와 심볼릭 주소를 사용하는 두가지가 있다.

일단 물리적인 주소를 사용하는 경우는 돌아갈 장소의 줄을 직접 써서 가고

9: add R2, R2, 1

...

13: goto 9

심볼릭을 사용하는 경우는 알아볼 수 있는 심볼을 써서 해당 심볼로 돌아가게 된다.

add r3, r3, 1

...

(LOOP)

...

goto LOOP

그러면 물리적인 주소와 심볼릭한 주소를 사용한 경우의 차이점은 무엇일까? 우리가 프로그래밍 언어를 배우면서 상수보다는 변수 쓰는것과 동일하다고 생각할수 있을거같은데,

간단한 출력 예시를 든다면

print(3)

print(a)

위의 경우는 상수 3을 쓴 만큼 동작 중에는 바뀔수가 없고, 3대신 2를 출력하고 싶을때 기존의 3을 모두 2를 고쳐야 하면서 코드 작성할때 이해하거나 나중에 디버깅하는데 불편하다.

하지만 아래의 심볼릭으로 a를 썻을때는 a 에 3이 들어있더라도 2를 출력하길 원하면 a에 2를 넣으면 전체 a에 반영이 되기도 하고, 프로그램 실행 중에 a를 변경 할 수 이를 재할당 가능하다고 한다. 그래서 이런 재할당 가능한 심볼릭을 쓰면 물리적인 상수 주소를 썻을때보다 조금더 동적으로 변화하는 상황에 알맞게 동작하며 다루기도 좋다.

HACK 컴퓨터 구조

앞에 기계어가 뭐고, 고급언어가 뭐고, 심볼릭이니 어셈블리어니 하느라 말이 많았지만 이번에는 HACK 컴퓨터의 기계어에 대해서 정리하려고 하는데 HACK 컴퓨터에 대해서 잠깐 말하자면 앞서 구현한대로 HACK은 16비트 단위로 처리하는 폰 노이만 구조의 16비트 컴퓨터이다. 렘 파트에서 마지막에 16K 구현하길래 HACK의 메모리가 16K인줄 알았지만 32K였다.. 16K까지만 구현한 이유가 있는 곧 나오니도 하고 컴퓨터 구조를 간단하게 복습하면

* 이책 어딘가에 봤었는데 어딘질 모르겟다.

대표적인 컴퓨터 구조로는 폰 노이만 구조와 하버드 구조가 있다.

두 구조의 가장 큰 차이점이라면 폰 노이만 구조는 데이터메모리와 명령어 메모리가 붙어있어 동일한 통로(버스)로 되어있고, 하버드 구조는 데이터 메모리와 명령어 메모리가 분리되 서로 다른 버스로 읽고 쓴다고 한다.

폰 노이만 구조에서는 이전에 하드웨어로 직접 프로그래밍을 했던 것과는 달리 메모리에 저장하여 사용하게 되었지만(내장 프로그래밍) 통로가 하나 뿐이라 명령어와 데이터를 한번에 가져 올수없어 상대적으로 느리며(병목현상),

하버드 구조에서는 명령어 메모리와 데이터 메모리를 분리하여 한번에 두개를 가지고 올수 있어 상대적으로 빠른 처리가 가능하나 더 많은 메모리와 버스로 많은 공간을 차지한다고 한다.

HACK의 메모리와 레지스터 그리고 주소

아무튼 HACK 컴퓨터는 32K의 메모리를 가지고 있는데 폰 노이만 구조로 데이터 메모리와 명령어 메모리가 각각 16K씩 공간을 차지하고 있다. 그래서 지난번에 16K까지만 구현했나 보다. 데이터 값들을 담는 데이터 메모리는 값을 읽고 쓰니 RAM, 명령어 메모리는 여기에 저장된 명령어들을 읽기만 하니 ROM이라고 한다. 근데 이거 RAM 16K로 구현하였으니 휘발성 이니 이것도 RAM이라 하는게 맞지 않나? 아니면 명령어를 읽기만 해서 ROM이라 한건지는 좀더 봐야알거같다.

메모리와 레지스터 : 위 그림을 보면 데이터 메모리와 명령어 메모리, 아까 레지스터를 설명할 때 이야기한 어드레스 레지스터 A와 데이터 레지스터 D가 있다. 다시 반복하면 어드레스 레지스터 A는 데이터 레지스터와 동일하게 어느 값을 저장하고 있거나 데이터 메모리와 명령어 메모리의 주소를 저장하는 역활을 하는데, A가 주소를 담고 있을때, M = 0을 하면 RAM의 해당 주소에다가 0을 대입하게 된다. 어드레스 레지스터로 지정된 RAM 상의 레지스터를 데이타 메모리 레지스터 M이라 한다. ROM은 이름 그대로 읽기 전용 기억 장치로 차후에 자세히 설명하고, ROM의 레지스터 값은 현재 명령어를 나타낸다.

어드레스 레지스터 A에다가 18을 넣고자 한다면 어셈블리어로 @18(현재 A는 주소가 아닌 값을 저장하는 역할을한다)

이 값을 데이터 레지스터 D에 담고자 한다면 D = A를 하면 된다.

잠깐 뒷 내용을 당겨와서 하면 hack의 심볼릭과 기계어에는 주소와 값을 지정하기 위한 A명령어, 제어 명령을 나타내는 C명령어 두 종류가 있고, 이 hack 컴퓨터는 폰 노이만 구조라 데이터와 명령어 메모리가 하나의 버스를 공유하고 있다보니 hack 컴퓨터의 기계어는 값을 지정하기위해 A 명령어 먼저, 지정한 값을 사용하기 위해 C명령어가 따라와 같이 사용된다.

* hack의 심볼릭 예시 - 데이터 레지스터에다가 18 넣기(A는 값 저장 역할)

@18 // A 명령어

D = A // C 명령어

* 주소 처리 : 어드레스 레지스터를 이용하여 RAM 200번지에다가 값 18을 넣기 예시

@18 // A명령어 - 어드레스 레지스터에다가 데이터 레지스터에 임시로 담을 값을 지정

D=A // C명령어 - 어드레스 레지스터 값을 데이터 레지스터에 대입

@200 // A명령어 - 어드레스 레지스터에 200 대입

M=D // C명령어 - RAM 200번지에다가 데이터레지스터의 값(18) 대입

위의 예시를 보면 A 명령어 다음에 C 명령어에 데이터 메모리(RAM) 레지스터M이 사용되는 경우 A 명령어는 어드레스 역활을 하고, M이 없는 경우 A는 값을 보관하는 역활을 하고 있다.

분기 : hack 심볼릭 언어에서 조건 혹은 무조건적으로 특정 위치로 넘어가기 위해 goto를 하는 JMP 명령이 있으며, 무조건적으로 분기/넘어가고자 한다면 C명렁어로 0;JMP를 사용한다. 만약 무조건 56번지에 간다면 A명령어와 같이사용하여 다음 처럼 쓰면 된다.

@56

0;JMP

하지만 조건에 따라(0과 같거나 JEQ, 크거나 JGT, 작거나JLT) 분기하고자 하는 경우도 가능하며, 조건이 주어질때의 분기는 다음과 같이 할수있다.

@56

D;JEQ //D가 0과 같은 경우 56번지로 점프한다.

변수 이용하기 : 앞서 A 명령어를 사용할때마다 @{숫자}를 넣어서 사용해왔는데, @뒤에는 상수 뿐만이 아니라 심볼도 올수 있다. 예를들어 심볼/변수 x를 26로 지정하여 사용하고자 한다면

@26

D=A

M=D

이렇게 하면 심볼 x에다가 값으로 26을 넣게 된다. 그런데 이 변수 x의 주소가 어디인지는 좀 더 봐야 알수있을거같고 일단 변수에다가 이런 식으로 값을 넣을수있다 정도로만 알고 넘어가자.

빌트인 심볼 : 그리고 hack 어셈블리에는 기본적으로 미리 지정된 빌트인 심볼 16개가 있는데 R0, R1, ..., R15로 R0은 데이터 메모리 0번지, R1는 1번지 ..., R15는 15번지라 할수 있고, 다음 명령어를 수행하면

@14

D=A

@R6

M=D

RAM[6]에다가 14를 넣은것과 같다고 생각하면 된다. 이 빌트인 레지스터들을 가상 레지스터라 한다.

A명렁어와 C명령어

조금 전에 hack 어셈블리어를 설명하기 위해 간단하게 A 명령어와 C 명령어 그리고 두 명령어의 심볼릭에 대해서 설명을 했었는데 어셈블리어는 기계어와 1:1 매칭되는 만큼 심볼릭을 아래와 같이 기계어 바이너리로 바꿀수 있다.

A명령어와 C명령어 구분 : hack은 16비트 컴퓨터라 명령어 길이가 16비트인데, 앞에 시작하는 바이너리 수를 보고 A 명령어인지 C명령어인지 구분할 수 있다. 아 잠깐 놓친건데 기계어 바이너리는 2부분으로 나눌수 있는데 opcode와 오퍼랜드이다. opcode는 이 명령어가 할 동작을 나타내고, 오퍼랜드는 이 명령어의 값 혹은 주소를 나타낸다.

hack 기계어의 MSB, 즉 가장 좌측 비트가 0인 경우 A 명령어로 보고 나머지 15비트는 오퍼랜드가 되겠다. 만약 MSB가 1인 경우에는 C 명령어가 되는데, 뒤의 따라오는 11은 칸을 채워주기 위함이며 나머지 13개 비트가 오퍼랜드가 된다.

A 명령어 : A 명령어는 1비트를 이미 사용하고 있으므로 표현 가능한 숫자는 15비트, 부호없이 0 ~ 32767까지 표현이 가능하며 2^15만큼의 주소에 접근할수 있게 되겠다. RAM32K를 구현했지만 RAM과 ROM은 각각 16K이고, 16K = 2^10 * 2^4인데다가 실제로는 ROM 전체를 다 사용하지 않아 A 명령어를 통해 모든 메모리 주소에 접근 가능하다.

A 명령어의 역할은 다음 3가지로 정리 할 수 있겠다.

(1) 상수를 넣을 떄 ex) @15 D=A

(2) 주소를 지정할 때 ex) @15 D=A @56 M=D

(3) 점프 목적지 지정할때 ex) @15 0;JMP

아아아 차라리 시뮬레이션 돌릴 때가 나았지 그냥 안짚고 넘어갈수도 없고 너무 많다ㅠㅠ

저작자표시

'컴퓨터과학 > 디지털회로' 카테고리의 다른 글

nand2tetris - 8. HACK 어셈블리어로 곱셈 연산, 입출력제어 (0)	2022.05.18
nand2tetris - 7. hack 기계어와 어셈블리어 2 (0)	2022.05.17
nand2tetris - 5. 레지스터와 RAM 구현하기 (0)	2022.05.15
nand2tetris - 4. 반가산기부터 ALU까지 구현하기 (0)	2022.05.15
nand2tetris - 3. 4way/8way 16bit muletiplexer까지 기본논리회로 마무리 (0)	2022.05.15

깜지로 쓰려는 블로그

nand2tetris - 6. hack 기계어와 어셈블리어 1

'컴퓨터과학 > 디지털회로' 카테고리의 다른 글

+ Recent posts

티스토리툴바