본문 바로가기

학교 수업/전공 수업

[멀티미디어 시스템] 멀티미디어의 특성

안녕하세요 소프트웨어 공부하는 레오존입니다.

이번 포스팅에서는 멀티미디어의 특성에 대해 자세히 정리해보도록 하겠습니다.

 

 

저번 포스팅에서 학자들이 정리해 놓은 멀티미디어의 특성에는 media integrity(미디어 통합성), duplex communication(양방향 통신), digital information processing(디지털 정보 처리), media interaction(미디어 상호작용), user interface(사용자 인터페이스), massive storage device (대용량 저장 장치) 가 있다고 언급했었습니다. 각각의 특성에 대해 더 자세히 정리해 보도록 하겠습니다.

 

 

media integrity

멀티미디어의 정의에 따라 두개 이상의 멀티미디어가 결합된 것이기 때문에 media integrity는 당연한 특징으로 여겨집니다. 미디어 정보를 분류를 할 때에 여러가지 방법으로 분류할 수 있는데, 제가 배운 내용에 따라 멀티미디어를 다섯 가지로 분류하도록 하겠습니다. 멀티미디어는 text, image/graphic, video, audio, animation으로 분류될 수 있습니다.

 

image와 graphic이 같은 멀티미디어에 속하긴 하지만 원칙적으로 차이가 존재합니다. graphic은 애초에 컴퓨터에 의해 디지털로 만들어진 것을 의미합니다. 반면에 image같은 경우는 사진을 찍어나온 결과물을 의미합니다. 사진을 찍는 행위 자체는 아날로그입니다. 이를 이해하기 위해서는 스마트폰으로 찍은 사진이 디지털로 전환되는 과정에 대해 간단히 정리해보도록 하겠습니다. 기본적으로 사진을 찍을 때 활용되는 측은 cmos 센서 라는 것입니다. cmos 센서에서 빛을 읽어들이기 때문에 사진을 찍는 행위 자체는 빛을 읽어들이는 것입니다. 즉, cmos 센서로 빛을 읽어들여서 사진을 찍은 후, 스마트폰에서 디지털로 변화하는 처리가 이루어집니다. 따라서 image는 태생이 아날로그, graphic은 태생이 디지털이라고 할 수 있습니다. 태생이 아날로그 라는 말을 born in analog 라고 말하며, 태생이 디지털 이라는 말을 born in digital 이라고 이야기합니다. 

 

audio 같은 경우에도 사람의 목소리, 음악 으로 크게 나눌 수 있습니다. 같은 audio여도 사람의 목소리와 음악도 특성이 다릅니다. 이 부분에 관해서는 나중에 더 자세히 다루도록 하겠습니다.

 

 

duplex communication

duplex communication은 양방향 통신이라는 의미를 지닙니다.

예전에 아날로그 시대에는 방송국에서 방송 신호가 집으로 전송되는 일방적인 흐름이었습니다. 이러한 일방적으로 한 쪽으로만 흐르는 통신을 simplex라고 합니다. 따라서 단방향 통신을 simplex communication 이라고 합니다.

하지만 지금같은 디지털 시대에는 방송국에서 방송 신호를 접하기도 하지만 내가 신호를 보낼 수도 있기 때문에 이러한 소통을 양방향 통신이라고 합니다. 

보통 simplex의 반대말을 duplex라고 이야기합니다.

또한, 양쪽 방향으로 정보를 보낼 수 있으나 한 번에 한 방향으로만 보낼 수 있는 것을 half communication이라고 합니다.

멀티미디어는 기본적으로 양방향 통신이 되어야 하기 때문에, duplex communication 방식을 따르고 있습니다.

 

 

digital information processing

멀티미디어는 기본적으로 디지털이라는 개념이 포함되어 있습니다. 때문에 멀티미디어를 처리한다는 말은 디지털 정보를 처리한다는 말과 동일하다고 할 수 있습니다. 멀티미디어라는 것이 두 개이상의 다른 미디어가 결합된 정보이기 때문에 결합되었다는 것은 분리가 된다는 말을 뜻하기도 합니다. 집에서 수신된 디지털 방송을 볼 때 오디오 데이터와 비디오 데이터의 두 개의 다른 미디어가 같이 결합되어 tv에 수신이 됩니다. 복합된 미디어로 tv에 수신이 되는 것이죠. 그리고 우리가 시청할 때에는 tv안에서 오디오 데이터와 비디어 데이터가 분리가 일어나게 됩니다. 디지털로 구성된 데이터들은 binary로 구성되어 있고 각각의 정보는 앞에 헤더를 두고 있어 헤더로 구분되기 때문에 오디오 데이터, 비디오 데이터 등이 결합과 분리를 할 수 있습니다. 반면에 아날로그는 결합이 일어나면 분리할 방법이 존재하지 않습니다. 

디지털은 전송 상의 손실이 적고, 저장하기 쉽고, 이동성이 좋습니다. 또한, 얼마든지 복사를 해도 원본에 훼손이 일어나지 않습니다. 디지털 정보 처리 중에서도 아날로그 정보 처리보다 디지털 정보 처리의 가장 큰 장점은 결과물이 더 깨끗하고 선명하다는 것입니다. 즉, 디지털이 잡음(noise)에 강하다는 것이죠. 디지털은 아날로그보다 잡음 제거에 탁월합니다.

 

 

 

media interaction

멀티미디어는 두 개이상의 미디어가 결합이 되어 좋은 시너지 효과를 나타내는 애플리케이션을 만들어냅니다.

사람이 하는 말을 기계가 알아들어서 텍스트로 변환하는 기술인 speech recognition(음성 인식)을 예시로 들 수 있습니다. speech recognition은 다른 말로 speech to text(STT)라고 하기도 합니다. 거꾸로 기존에 텍스트를 사람의 음성으로 발성을 해주는 것인 text to speech(TTS)도 존재합니다. 이러한 기술들이 두 개 이상의 미디어가 결합한 멀티미디어의 특징인 media interaction의 예시라고 할 수 있습니다.

참고로 음성인식이라는 기술은 역사가 굉장히 오래된 기술입니다. 1930년대부터 시작되어 1980년대, 90년대에만 하더라도 삼성전자에서 휴대폰을 만들어낼 때 voice dailing이라는 핸드폰을 만들어낸 적이 있었습니다. 우리 집이라고 이야기했을 때 집으로 전화가 가는 기능을 갖고 있었죠. 하지만 나오자마자 바로 사장되어 버렸습니다. 그 이유는 당시에는 음성인식 기술이 많이 발달되어 있지 않아서 연구실과 같이 조용한 환경에서 음성인식을 했을 때는 음성인식률이 90프로 이상으로 괜찮았지만 길거리로 가져나가서 음성인식을 했을 때 주변 잡음 때문에 음성인식이 잘 되지 않았습니다. 90년대 초부터 2000년대 초까지 음성인식 기술이 이론적으로 벽에 부딪혔으나 구글이 이 벽을 부수게 됩니다. 구글은 딥러닝 알고리즘이라는 것을 일부 도입함에 따라 잡음을 효과적으로 제거하여 인식률을 높이도록 만들어냅니다. 

또한, text와 video를 두 개의 미디어가 결합한 기술인 lip leading(독순술) sign language(수화)과 audio와 video를 결합한 기술인 lip synchronization(립싱크)도 존재합니다. 

 

 

 

user interface

멀티미디어에서는 user interface가 굉장히 중요합니다. user interface는 얼마나 사용자가 편리하게 정보를 처리하고 결과를 습득할 수 있느냐를 결정합니다.

전통적으로 user interface를 세가지로 분류합니다. Command-line, menu-driven, GUI입니다. command-line이라는 것은 프롬프트에 입력하는 것을 말하고, menu-driven과 GUI는 마우스로 선택하는 것을 말합니다.

그런데 멀티미디어 정보 처리는 점점 소형 단말기에서 이루어지고 있습니다. 소형 단말기를 사용하면 화면 사이즈가 작아지면서 얼마나 편리하게 데이터를 입력하고 결과를 처리해 보여줄 수 있는지가 중요하기 때문에 user interface의 존재가 중요해지고 있습니다.

따라서 ui분야는 앞으로 굉장히 유망한 분야로 보입니다.

 

 

 

massive storage device

기본적으로 디지털 데이터는 아날로그 데이터에 비해 용량이 엄청 커다랗습니다. 때문에, 파일의 크기를 줄이기 위해서 파일의 대부분이 압축된 형태로 존재합니다.

1990년대, 2000년 초만 하더라도 저장 장치의 가격이 지금처럼 저렴하지 않았습니다. 네트워크 속도 또한 예전에는 매우 속도가 느렸습니다. 디지털 데이터가 용량이 너무 크니까 저장공간을 마련해야 하고 네트워크도 제한이 되어 있었기 때문에 압축할 수밖에 없었습니다. 하지만 지금은 많이 바뀌었죠. 현재는 저장 장치의 가격이 많이 저렴해졌고 네트워크 속도도 빨라졌습니다. 그에 따라 압축 알고리즘의 사용에도 변화가 생기기 시작했습니다. 예를 들어 mp3와 flaq를 예시를 들 수 있습니다.

 mp3는 손실 압축된 오디오 데이터, flaq은 무손실 압축 오디오 데이터입니다. 그럼 무조건 flaq을 사용하지 mp3를 왜 사용할까요? 그 이유는 압축이 가능한 정도에 차이가 있기 때문입니다. mp3 손실 압축 데이터의 경우, 10분의 1로 압축이 가능합니다. 반면에 flaq 무손실 압축 데이터의 경우 최대 압축을 해봐야 3분의 1 정도만 압축이 가능합니다. 따라서 예전에 저장장치가 비쌌던 시대에는 저장공간 때문에 손실 압축 오디오 데이터를 사용했습니다. 저장장치가 저렴해진 요즘엔, 좋은 음질을 지니고 있는 무손실 압축 데이터인 flaq을 선호가 증가하고 있습니다.

 

 

 

 

 

이번 포스팅에서는 멀티미디어의 특성에 대해 자세히 정리해보았습니다.

읽어주셔서 감사합니다.