MODU 직업인 이야기

[MODU 직업인 이야기] 시리야, 빅스비 인공지능을 탄생시키는 사람들

MODU 모두매거진 2023. 5. 22. 18:06
728x90

 

| S P E C I A L _ 직 업 탐 구 ③ | 사람과 기계, 언어로 소통하다 음성처리전문가

사물인터넷에 연결된 홈 스피커를 통해 오늘의 날씨를 물어보고,
녹음된 음성이나 통화 내용을 문자로 바꿔 읽는 것이 가능한 이유는
음성처리기술 덕분이다.

이 분야의 역사는 사실 짧지가 않다.
1990
년대부터 음성인식 제품이 상용화되고,
음성을 인식하는 자동차 내비게이션이나
스마트폰 음성인식 문자 변환이 가능해지면서 관련 분야가 발전해왔다.

그런데 최근 들어 음성처리 기술이 우리 삶에 더 가까워진 이유는
인공지능의 성능이 향상되었기 때문이라고 전문가들은 말한다.

미디어젠은 여러 언어의 음성인식과 합성 기술을 보유한
20
년 경력의 음성 기술 전문 인공지능 기업이다.

이곳에서 음성처리시스템을 개발하는 사람들의 이야기를 들어봤다.

 


 

음성처리전문가에게 듣는 직업 이야기

 

사람의 말소리를 입힌 인공지능으로 밝은 미래를 그려갑니다
- 조영선, 홍연정 박사 / 미디어젠 AI 에듀테크팀 -

 

사람과 기계가 함께하는 세상에서 편리함과 이로움을 선사하다

Q. 음성처리 기술은 무엇이고, 이것이 접목된 시스템이 현재 일상생활에서 어떻게 활용되고 있나요?

A. 홍연정(이하 홍)_ 세상의 모든 소리는 공기 중에 떠다니는 입자들의 파동으로 만들어집니다. 이러한 물리적인 현상을 컴퓨터가 이해할 수 있는 데이터로 변환하는 것이음성처리작업이에요.
음성처리 분야에는 크게 두 가지가 있습니다. 사람의 말소리를 문자로 바꿔주는음성인식’, 단어나 문장 정보를 입력하면 음성으로 내보내는음성합성입니다. 이 기술들은 사람의 목소리를 인식하는 여러가지 앱이나 서비스 개발에 활용되고 있어요.
예를 들면, 우리가 스마트폰에 “OO라고 인공지능의 이름을 부르면 바로 알아듣고 반응을 하죠. “. 말씀해주세요라고요. 이때 사람의 목소리를 문자로 바꾸어 인공지능이 인식하는 과정이음성인식’이에요. 그리고 그 문자를 인식한 인공지능의 대답이 음성으로 출력되는 현상은음성합성인 것이죠.

미디어젠이 자체 개발한 발음평가시스템 ‘스피치프로’에서는 사용자의 외국어 발음 정확도와 억양, 리듬, 강세 등을 종합적으로 평가해 점수를 산출하고, 오각형 그래프로 나타내준다.

 

(중략)

 

인공지능 시대, 사람과 사람이 만나는 일을 찾을 것

Q. 음성처리전문가가 되기 위한 준비를 하려면 어떤 노력을 해야 할까요?

A. _ 음성처리 기술을 연구하고 개발하기 위해서는 오랜 시간 컴퓨터와 함께 일을 해야 해요.
물론 사람들을 대하며 녹음 데이터를 수집하는 경우도 있지만, 우리가 일하는 대부분의 시간은 손에 잡히지 않는 데이터의 구조를 만들고 분석하는 과정의 연속이죠. 개발자가 하는 일과 비슷해요. 컴퓨터로 음성 데이터를 분석하고, 인공지능 모델을 개발하며 이를 실제 상황에 맞는 프로그램으로 만드는 일이다 보니 아무래도 개발 능력이 가장 중요하죠. 꼭 거창한 것이 아니어도 무언가를 만들 줄 아는 능력을 하나쯤 가지고 있으면 도움이 될 거예요.
그래서 이 분야에서 일을 하려면 음성이라는 물리적 신호에 대해 이해할 수 있는 수학적 기반과 공학적 훈련이 필요합니다. 컴퓨터공학과 수학, 물리학 공부를 통해 데이터를 분석하는 사고를 해보길 바라요. 사실 저는 언어와 사람에 대한 관심으로 이 일을 시작했는데요. 음성처리가 언어와 관련된 분야이다 보니 국어와 영어 등 언어 과목에도 관심을 갖는 게 좋아요.

 

(중략)

 

고령층을 위한 AI 돌봄 인형 ‘두리 챗봇’은 음성 인식 기능을 이용해 사람과 감성적인 대화를 하며, 이를 통해 정서적인 교감이 가능하다는 장점이 있다

 

Q. 두 박사님이 현재 고민하고 있는 것과 앞으로의 꿈은 무엇인지 알고 싶어요.

A. _ 기계가 사람을 대체하지 못하면서도 가장 중요한 일이 무엇일까를 고민해봤을 때 저는 사람을 교육하는 일이라고 생각해요.
우리나라 인구가 감소하면서 지방권에서는 학교에 다니는 아이들이 점차 사라지고, 선생님을 채용하는 일도 줄어들고 있어요. 그래서 지역적인, 사회적인 차별 없이 널리 사용할 수 있는 에듀테크 서비스를 만들어보자는 마음으로 현재 여러 프로젝트를 구상하고 개발 중입니다.
, 음성처리와 인공지능 기술을 통해 사람들의디지털 리터러시감각을 깨우는 데도 도움을 주고 싶어요. 인터넷에서 내가 원하는 정보를 빠르게 접하고 이해할 수 있으려면 여전히 언어를 읽고, 말하고, 쓰고, 듣는 능력이 있어야 하거든요.
_ 인공지능, 그리고 최첨단 IT 기술이 우리의 일상에서 점점 당연한 것이 되어갈 때사람은 무엇을 해야 하는지에 대해 더 많이 고민하게 되는데요. 우리를 조금 더 사람답게 만들어주는 것은 역시 교육 분야라고 생각해요.
아무래도일대일 터치가 필요한 분야이기 때문이죠. 사람은 직접 만나고 소통할 때 진정한 행복을 느껴요.
그래서 앞으로 제가 개발하는 음성처리 인공지능 관련 기술과 서비스로 사람과 사람이 더 가까이 닿을 수 있게 하는 것이 목표입니다.

 

CAREER CARD
업무 한 줄 요약
음성신호의 분석, 음성처리 알고리즘의 개발, 음성인식, 음성합성 등과 관련된 응용시스템을 전문적으로 개발하는 전문가.
관련 전공
컴퓨터공학, 소프트웨어공학, 전산 및 정보처리 관련 학과.
관련 자질
데이터 분석 능력과 언어 이해를 바탕으로 한 프로그램을 개발하는 것이 중요.
현직자의 커리어 TIP
인공지능이 대체 불가능한 분야의 선두에서 사람의 언어와 소통 능력을 향상하는 기술을 이끌 것.

 

 

 

글 이은주사진 바림자료 제공 미디어젠

 

 


뒷내용이 궁금하시다면

"네이버쇼핑 - 모두매거진"에서 단권호로 구매 가능합니다.

 

청소년, 잡지, 진로, 입시, MODU, 모두매거진, 매거진, 청소년잡지, 신규발행, 도서관, 진로잡지, 입

청소년, 잡지, 진로, 입시, MODU, 모두매거진, 매거진, 청소년잡지, 신규발행, 도서관, 진로잡지, 입시잡지, 꿈, 미래직업, 교육, 정기구독, 구독, 우주, 교재, 진로교재, 참고서, 필독서

smartstore.naver.com

 

728x90