post: 배열의 이해 시리즈 3~5

lja3723 · Mar 13, 2024 · e939e4f · e939e4f
1 parent 083a305
commit e939e4f
Show file tree

Hide file tree

Showing 5 changed files with 493 additions and 19 deletions.
diff --git a/_posts/Program-Language/C/2000-01-01-category-introduce.md b/_posts/Program-Language/C/2000-01-01-category-introduce.md
diff --git a/.../C/2024-03-13-understanding-array-3-operator-properties-of-array-and-pointer.md b/.../C/2024-03-13-understanding-array-3-operator-properties-of-array-and-pointer.md
@@ -0,0 +1,93 @@
+---
+title: "[배열의 이해] 3. 배열 및 포인터와 관련된 여러 연산자의 성질"
+date: 2024-03-13 14:09:00 +0900
+categories: [Program-Language, C]
+tags: ["배열의 이해"]
+---
+
+
+이 포스팅은 이전 네이버 블로그의 [해당 게시물](https://blog.naver.com/lja3333/222145277147){: target='_blank'}에서 마이그레이션되었다.
+
+이 글에서 다룰 연산자는 크게 3가지로, 배열 첨자 연산자(`[ ]`), 단항 간접 참조 연산자(`*`), 단항 주소 연산자(`&`)이다. 
+
+## 1. 첨자 연산자(subscript operator): 배열 원소의 접근
+
+배열 선언 후 배열의 원소에 접근하려면 첨자 연산자(subscript operator) `[ ]` 를 사용한다.
+
+### examples
+{: data-toc-skip=''}
+
+```c
+char str[] = "multidimentional array";
+char ch = str[7]; //ch의 값은 'm'
+```
+{: .nolineno }
+
+---
+
+### 1.1. 배열 첨자 연산자와 간접 참조 연산자(indirection operator) 간의 자유로운 변환
+
+첨자 연산자의 정의에 따르면, 표현식 `a[b]`는 표현식 `*((a) + (b))`와 동일한 표현이다. 따라서 `str[7]`은 `*(str + 7)`으로, 또 `*(str + 7)`은 `str[7]`으로 자유롭게 변환이 가능하다.
+
+### a[b] == b[a]
+{: data-toc-skip=''}
+
+`a + b == b + a` 와 같은 덧셈의 교환 법칙에 의해, 표현식 `a[b]`, 즉 `*((a) + (b))`는 `*((b) + (a))`로 쓸 수 있으며 이는 표현식 `b[a]`와 같다. 따라서 아래와 같은 상당히 이상해 보이는 표현도 오류 없이 컴파일이 가능하고, 실제로 잘 동작한다!
+
+### examples
+{: data-toc-skip=''}
+
+```c
+char ch = 7[str]; //str[7]과 동일함, ch의 값은 'm'
+```
+{: .nolineno }
+
+---
+
+## 2. 간접 참조 연산자(역참조 연산자, indirection operator)의 성질
+
+단항 연산자인 간접 참조 연산자(`*`)는 포인터가 가리키는 변수의 값을 읽어오는데 사용하는 연산자이다. 또한 역참조 연산자(dereference operator)라고도 한다. 간접 참조 연산자의 성질은 다음과 같다.
+
+1. 간접 참조 연산자의 피연산자의 형식은 반드시 포인터 형식이이어야 한다. 이때 피연산자는 lvalue, rvalue 모두 가능하다.
+2. 간접 참조 연산자의 연산 결과는 포인터가 가리키는 위치를 지정하는 lvalue이고, 그 형식은 피연산자가 '`T`를 가리키는 포인터'일 경우 `T`이다.
+
+### examples
+{: data-toc-skip=''}
+
+```c
+double num = 2.728182; 
+double* p = &num; 
+double n2 = *p + 5; //역참조 연산자의 사용(*p)
+```
+{: .nolineno }
+
+위 코드에서 `p`는 포인터 형식이므로 간접 참조 연산자 `*`의 피연산자가 될 수 있다. 그리고 `*p`의 연산 결과는 포인터가 가리키는 위치를 지정하는 lvalue이므로 `*p`는 num을 의미하며 그 형식은 `p`가 '`double`을 가리키는 포인터'이므로 `double *`이다.
+
+---
+
+## 3. 주소 연산자(address operator)의 성질
+
+단항 연산자인 주소 연산자(`&`)는 피연산자의 주소를 반환한다. 성질은 다음과 같다.
+
+1. 주소 연산자의 피연산자는 lvalue이어야 한다.
+2. 주소 연산자의 연산 결과는 rvalue이며, 형식은 피연산자의 형식에서 파생된 포인터 형식이다.
+
+### examples
+{: data-toc-skip=''}
+
+```c
+double num = 2.728182; 
+double* p = &num; //주소 연산자의 사용(&num)
+```
+{: .nolineno }
+
+`num`은 lvalue이므로 `&`의 피연산자가 될 수 있다. `&num`의 연산 결과는 rvalue이며, 피연산자의 형식이 `double`이므로 `&num`의 형식은 `double`에서 파생된 포인터 형식인 `double *` 이다.
+
+---
+
+## 참고 문서
+{: data-toc-skip=''}
+
+- [[#] 첨자 연산자의 성질](https://www.ibm.com/support/knowledgecenter/en/ssw_ibm_i_71/rzarg/arsubex.htm){: target='_blank'}
+- [[#] 주소 연산자의 성질](https://docs.microsoft.com/ko-kr/cpp/cpp/address-of-operator-amp?view=msvc-160){: target='_blank'}
+- [[#] 간접 참조 연산자의 성질](https://docs.microsoft.com/ko-kr/cpp/c-language/indirection-and-address-of-operators?view=msvc-160){: target='_blank'}
diff --git a/.../C/2024-03-13-understanding-array-4-operator-properties-of-array-and-pointer.md b/.../C/2024-03-13-understanding-array-4-operator-properties-of-array-and-pointer.md
@@ -0,0 +1,126 @@
+---
+title: "[배열의 이해] 4. 배열의 포인터로의 붕괴(array to pointer decay)"
+date: 2024-03-13 15:58:00 +0900
+categories: [Program-Language, C]
+tags: ["배열의 이해"]
+---
+
+
+이 포스팅은 이전 네이버 블로그의 [해당 게시물](https://blog.naver.com/lja3333/222145547884){: target='_blank'}에서 마이그레이션되었다.
+
+[앞선 글(1. 배열 형식(array type))]({% link _posts/Program-Language/C/2024-03-12-understanding-array-1-array-type.md %})에서 배열은 포인터가 아닌 말 그대로 배열이라고 하였다. 그런데도 왜 보통 배열의 이름은 포인터라고 하는 것일까? 그것은 배열의 포인터로의 붕괴가 일어나면 결과적으로 배열의 이름은 포인터과 같아지기 때문(equivalent)이다. 그러나 이것은 배열의 이름과 포인터가 서로 동등하다(identical)는 것은 아니다.
+
+## 1. 배열의 포인터로의 붕괴(array to pointer decay)
+
+**배열의 포인터로의 붕괴(array to pointer decay)**, 또는 **배열의 붕괴(array decay)**는 배열 형식(array type)이 표현식에 나타날 때 **배열의 첫 번째 원소를 가리키는 포인터로 변환되는 현상**을 말한다. 이때 **포인터의 형식은 배열의 원소의 형식**이며, 변환의 결과는 rvalue이다. 다시 말하면 배열 형식이 표현식에 나타날 때, 그 즉시 값이 배열의 첫 번째 원소의 주소값이고 형식이 배열의 원소 형식에 대한 포인터인 rvalue로 변환된다. 이러한 변환은 C/C++의 암시적 형변환(implicit conversion) 중 하나이다. 또한 변환의 결과가 rvalue이므로, **변환 결과로 생긴 포인터를 위한 별도의 메모리 공간이 따로 할당되는 것은 아니라는 것**을 알 수 있다!
+
+### examples
+{: data-toc-skip=''}
+
+```c
+char str[] = {'d', 'e', 'c', 'a', 'y'};
+char* ptr = str;
+printf("%c", str[2]);
+```
+{: .nolineno }
+
+`str`의 형식은 `char [5]`으로, 배열 원소의 형식은 `char`이고 배열의 길이는 5이다. `char* ptr = str;` 에서 배열 형식 `str`이 표현식에 나타났다. 따라서 `str`은 배열의 포인터로의 붕괴(array to pointer decay) 현상에 의해 형식이 `char *` 이고 값이 배열의 첫 번째 원소의 주소값인 rvalue로 붕괴가 일어난다. 이 값은 곧 대입 연산자에 의해 `char*` 형 변수 `ptr`에 할당된다.
+
+`printf("%c", str[2]);` 표현식에서 `str[2]`가 해석되는 과정을 살펴보자. 
+
+1. 배열 첨자 연산자(subscript operator)가 연산자 정의에 의해 역참조 연산자 표현식 `*((str) + (2))` 으로 대체된다. 
+2. 배열 형식 `str`이 표현식에 나타났으므로 `str`은 배열의 붕괴에 의해 값이 배열의 첫 번째 원소의 주소값이고 형식이 `char *` 인 rvalue로 변환된다.
+3. `str + 2` 표현식에 의해 포인터 덧셈 연산이 수행되어 값이 배열의 세 번째 원소의 주소값이고 형식이 `char *` 인 rvalue가 된다. 
+4. 이 값에 간접 참조 연산자가 적용되어 형식이 `char`이고 배열의 세 번째 원소를 의미하는 lvalue가 된다. 다섯째, lvalue는 lvalue conversion에 의해 값 `'c'`로 대체된다. 
+ 
+따라서 `printf("%c", str[2]);`는 이러한 연쇄적인 연산에 의해 `printf("%c", 99);`가 되어 콘솔창에 `c`가 출력된다.
+
+---
+
+### 1.1. 배열의 붕괴의 3가지 예외
+
+배열의 붕괴는 항상 일어나는 것은 아니다. 3가지 예외가 있는데 그것은 아래와 같다.
+
+1. 배열 형식이 sizeof 연산자의 피연산자로 쓰일 경우
+2. 배열 형식이 단항 주소 연산자 & 의 피연산자로 쓰일 경우
+3. 문자 배열 형식을 문자 리터럴(string literal)으로 초기화(initialize)할 때 
+
+### examples
+{: data-toc-skip=''}
+
+```c
+int arr[5];
+printf("%lu\n", sizeof(arr));
+printf("%lu\n", sizeof(arr + 2));
+```
+{: .nolineno }
+
+두 표현식 `printf("%lu\n", sizeof(arr));` 과 `printf("%lu\n", sizeof(arr + 2));` 를 보자. 이들은 64-bit 운영체제에서 각각 20과 8을 출력한다. 첫 표현식의 `sizeof(arr)` 에서 `arr`은 포인터로 붕괴하지 않고 배열 형식을 유지한다(예외 1번), 반면 두 번째 표현식의 `sizeof(arr + 2)`에서 `arr`은 이미 `arr + 2` 표현식에서 포인터로 붕괴하였고, 덧셈 연산자의 결과도 역시 포인터 형식이다.  따라서 `sizeof`의 결과로 포인터 형식의 크기인 8이 출력된다. (예외 2번에 대한 예시는 추후에 다룰 것이다.)
+
+---
+
+## 2. 배열의 붕괴로 인한 배열의 길이 정보의 손실
+
+배열 형식은 3가지 예외를 제외하고 형식이 배열의 원소에 대한 포인터이고 값이 배열의 원소의 첫 번째의 주소값인 rvalue로 붕괴한다고 하였다. 이런 변환의 결과를 자세히 살펴보면 배열의 원소 형식에 대한 정보는 남아있지만, 배열의 원소의 개수, 즉 **배열의 길이에 대한 정보가 손실되었다**는 것을 알 수 있다. 이러한 이유로 배열이 포인터로 변환하는 현상을 배열의 붕괴(decay)라고 명명한 것이다.
+
+### examples
+{: data-toc-skip=''}
+
+```c
+#include <stdio.h>
+
+void func(unsigned short h[]) {
+    printf("%lu", sizeof(h));
+}
+
+int main(void) {
+    unsigned short k[7];
+    func(k);
+    return 0;
+}
+```
+
+위 프로그램을 컴파일하고 실행시켜 보면 8을 출력한다. `unsigned short [7]` 형식의 `k`가 함수 `func`의 argument로 전달되는데, 이 과정에서 배열의 붕괴가 발생하여 `k`는 형식이 `unsigned short*` 이고 값이 배열의 첫 번째 원소의 주소값인 rvalue가 된다. 따라서 `func` 내부에서 `sizeof(h)`를 하게 되면 포인터의 크기인 8이 출력된다. 배열의 길이 정보가 손실된 것이다.
+
+### 2.1. 배열을 함수의 매개변수로 전달할 때 길이 정보를 전달하는 이유
+
+이처럼 배열의 이름은 배열의 붕괴로 인해 배열의 길이 정보가 손실되므로, 배열을 함수의 매개변수로 전달할 때 배열의 이름과 함께 배열의 길이도 전달해 주는 것이다. 배열 원소 형식이 `T`이고 배열의 원소가 `N`개인 배열 형식 `k`가 있을때, 다음 식은 항상 참이다.
+
+```c
+T k[N];
+sizeof(k) / sizeof(*k) == N; // 값은 항상 참
+```
+{: .nolineno}
+
+`sizeof(k)`는 배열 형식에 대한 `sizeof` 연산에 의해 `sizeof(T) * N` 과 같다. 한편 표현식 `*k` 에서 `k`는 배열의 붕괴에 의해 배열의 첫 번째 원소를 가리키는 형식이 `T *`인 rvalue로 붕괴되고, 여기에 간접 참조 연산자 `*`를 적용하므로 `*k`는 형식이 `T`인 lvalue이다. 따라서` sizeof(*k)`는 `sizeof(T)`와 같다. 즉 `sizeof(k) / sizeof(*k)`는 `(sizeof(T) * N) / sizeof(T)`이며, 배열 원소의 크기 `sizeof(T)`가 상쇄되므로 배열의 길이 `N` 만 남는다. 그래서 `sizeof(k) / sizeof(*k) == N` 은 항상 참이다.
+
+### examples
+{: data-toc-skip=''}
+
+```c
+#include <stdio.h>
+
+void func(unsigned short h[], int size) {
+    for (int i = 0; i < size; i++)
+        printf("%d ", h[i]);
+}
+
+int main(void) {
+    unsigned short k[7] = {1, 2, 3, 4, 5, 6, 7};
+    func(k, sizeof(k) / sizeof(k[0]));
+    return 0;
+}
+```
+
+함수 `func`의 프로토타입(prototype)을 보면 배열 원소에 대한 포인터 매개변수와 배열의 크기 정보를 받기 위한 `int`형 매개변수가 선언되었다는 것을 알 수 있다. 따라서 함수를 호출할 때 배열의 이름과 배열의 길이 정보를 넘겨준다. `sizeof(k) / sizeof(k[0])` 는  `sizeof(k) / sizeof(*k)`와 같고 이는 k의 배열의 길이인 7과 같다. 따라서 함수 `func`의 안의 반복문은 7번 반복하며 배열의 모든 원소를 순서대로 출력한다.
+
+---
+
+## 참고 문서
+{: data-toc-skip=''}
+
+- [[#] 배열의 포인터로의 붕괴(1)](https://cinsk.github.io//cfaqs/html/node8.html#6.3){: target='_blank'}
+- [[#] 배열의 포인터로의 붕괴(2)](https://en.cppreference.com/w/cpp/language/array#Array-to-pointer_decay){: target='_blank'}
+- [[#] 배열의 포인터로의 붕괴의 예외](https://stackoverflow.com/questions/17752978/exceptions-to-array-decaying-into-a-pointer){: target='_blank'}
+- [[#] 배열의 포인터로의 붕괴로 인한 길이 정보의 손실](https://int-i.github.io/cpp/2020-04-12/array-deacy/){: target='_blank'}
+- [[#] 배열의 대한 오해와 답변](https://yeogue.tistory.com/24){: target='_blank'}