■ 다음 표는 미국 표준 학회(ASA) 에서 정한 아스키(ASCII, American Standard Code for Information Interchange) 코드로
    8 비트 
데이타를 이용하여 여러 문자에 번호를 붙인 것 입니다. 표의 내용이 0 부터 127 까지 밖에 없는 이유는 위 표준을
    정할 당시 그 당시
7 비트 만으로 충분하다고 생각했기 때문입니다. 하지만 IBM 에서 좀 더 많은 종류의 문자가 필요하게
    되자 1 비트를 더 추가 시켜서 
확장된 아스키 코드(Extended ASCII Code) 를 만들었습니다.





위 127 개 가지고는 충분하지 못하죠. 왜냐하면 우리 글만 해도 자모음 24 개로 구성되어 있는데, 한 글자당 최대 초성/중성/종성 을 모두 표현해야 합니다. 또한 더욱 심각한 것은 한자와 같은 표의문자의 경우 수만 개가 넘는 한자 데이터들을 가지고 있어야 하는데 이를 256 개 안에 다 표현한다는 것은 불가능하기 때문이죠. 따라서, 컴퓨터가 전세계에 보급되자 좀 더 많은 종류의 문자를 표현해야 한다는 필요성이 대두되었습니다.

  결국에는 유니 코드(Unicode) 라는 새로운 형식의 문자 체계를 도입하게 됩니다. 유니코드는 한 문자를 2 바이트로 처리하였습니다. 이는, 기존 아스키의 1 바이트 체계 보다 대응할 수 있는 숫자의 양이 2 배가 늘어난 것이 아니라 256 배가 늘어나, 총 65536 가지의 문자를 처리할 수 있게 되었습니다. 유니코드는 이렇게 막강하여 현재까지 대부분의 언어의 문자 체계를 모두 표시하고도 2만 개 가량 더 대응시킬 수 있는 숫자가 남았다고 합니다. 따라서, 한글, 한자 등 영어를 제외한 대부분의 문자는 2 바이트를 차지합니다.



※ 출처 : http://itguru.tistory.com/9

'P rogramming > C Language' 카테고리의 다른 글

배열과 포인터의 관계  (0) 2011.10.25
포인터의 const  (0) 2011.10.24
Call by Value & Call by Reference  (0) 2011.10.04
argc & argv - Agument Count & Value  (0) 2011.09.29
#ifdef 와 #ifndef 전처리기  (0) 2011.09.29
by 민트앤라떼 2011. 10. 21. 11:20