가우디오랩, 메타버스 AI 오디오 | 쫌아는기자들 신년 픽 (7)

스타트업/스타트업 탐구

가우디오랩, 메타버스 AI 오디오 | 쫌아는기자들 신년 픽 (7)

moozii 2022. 3. 26. 17:50

이 글은 조선일보 쫌아는기자들 프로젝트의 2022년 신년 기사를 토대로 선정된 유망 스타트업들의 현황을 알아보는 시리즈입니다! 자세한 사항은 이 기사를 참고해주세요

@청년작가 정민우님 https://www.chosun.com/economy/smb-venture/2021/12/28/4KHHTFWA6ZCHHN42ISHJMHPJBA/

가우디오랩 (오현오 대표)

가우디오랩은 AI・메타버스 오디오 전문 기술 스타트업으로 ‘혁신적인 오디오 기술을 통해 훌륭한 소리 경험을 제공하는 것’을 목표로 기술 개발에 집중하고 있습니다. 몰입형 오디오(Immersive Audio) 혹은 스페이셜 오디오(Spatial)라 불리는 공간 음향의 원천 기술을 보유하고 있으며, MPEG-H 국제 표준과 한국정보통신기술협회(TTA) 표준으로 기술이 채택되는 등 우수한 기술을 기반으로 저력을 보여주는 팀 입니다.

이번 딥테크 시리즈의 인터뷰이로 가우디오랩 오현오 대표님을 추천한 이유는 총 세 가지 인데요. 첫번째는 당연하게도 가우디오랩의 기술력 때문입니다. 두번째 이유는 개인적인 관심사와 경험 때문인데요. 콘텐츠와 결합하는 기술에 관심이 많은데, 가우디오랩 기술의 확장성이 무척 기대 되어요. 마지막 세 번째 이유는 덕후들의 덕업일치를 응원하기 때문입니다. 이들이 세계 ‘소리’의 표준이 되기 위해 기술에 매진하고 있기 때문이에요.
(황은아 코리아스타트업포럼 팀장)

지분 절반을 팀원에게 주고 재창업한 가우디오랩 오현오

“두번째 창업이 가우디오랩입니다. 윌러스표준기술연구소라고, 통신·음향 관련 IP(지식재산권) 기술 라이센싱을 전문으로 하는 회사입니다. 공학자+변리사+변호사가 함께 일하면서 관련 기술을 발명하거나 특허를 관리하는 회사죠. 지금도 삼성전자와 LG전자 다음으로 많은 통신 특허를 보유하고 있습니다. 제가 창업자이자, 최대주주였고요. 그런데 창업 2년차 쯤, 잘 굴러가던 회사를 제가 박차고 나왔죠.”

“2014년 페이스북이 오큘러스를 2조5000억원에 샀어요. 뭐? 직원 100명도 안 되고 이제 막 시작한 VR기기를 이 돈을 주고 산다고?!. VR에 미래가 있을 것 같았습니다. 가상현실을 현실처럼 느끼게 해주는 핵심이 또 오디오거든요. 헐리우드 콘텐츠 시장은 돌비라는 미국 회사가 오디오 포맷을 완전히 독점했으니, 새로 열리는 VR 시장에선 우리가 1등도 가능할 것 같았습니다. 투자자들에게 설명했습니다. 이 기술를 직접 개발하고, 특허도 만들어서 세계 시장에 나가보겠다고요.” “기존 회사가 다른 특허도 있고 복잡하니, 그러면 아예 기술만 만드는 회사를 따로 해라. 그것이 안전하다. 투자자들이 제2의 창업을 요구했습니다. 그래서 제가 나가겠다고 했습니다. 일종의 스핀오프인 셈이고, 스타크래프트로 치면 본진의 커맨드센터를 하늘 위로 띄운 셈이죠.

오디오 포맷, 그러니까 오디오테크 기술 전쟁이 무엇이길래 1등 싸움에 치열한가요. “혹시 집에 비싼 오디오 기계를 두신 분, 극장에서 관찰력이 좋은 분은 ‘돌비(Dolby)’라는 마크가 구석에 찍혀있거나 어딘가에 숨어있다는 걸 보셨을 겁니다. 1970년대 세워진 미국 회사인데요. 기업가치가 20조원이 넘어요. 무엇으로 돈을 버느냐. 음향기술에 대한 특허로 돈을 법니다. 소리라는 것은 결국 녹음을 해서 압축(인코딩)을 하고, 이것을 우리가 듣는 극장의 여러 스피커로 전달해서 압축을 푸는(디코딩)의 작업을 거치거든요. 이걸 어떤 방식으로 압축하고 푸느냐. 이 기술 포맷을 지난 30년이 넘도록 독점을 해서 매년 로열티로만 2조원 이상을 버는 회사죠. 모든 헐리우드 콘텐츠가 돌비의 포맷을 기반으로 제작해서 배포되니까요. 선두 주자가 시장을 지배하는 곳이죠.” “음악들을 때 쓰는 MP3도 결국 이런 오디오포맷이자 기술특허입니다. 다들 음악이나 영상을 PC로 볼때 ‘지원하지 않는 코덱입니다’라는 오류창을 보였을 수도 있습니다. 그때 말하는 코덱이 바로 이 포맷을 말합니다. 그러니까 우리 눈에 하드웨어로 보이지 않는 오디오 테크인 셈이죠. 저희는 VR의 이런 포맷을 하겠다고 창업했던 회사였고요.”

VR을 위한 오디오 압축 기술이 따로 필요한 이유는요? 결국 실패하고 망할 뻔 했다던데. “돌비라는 한 회사가 모든 엔터테인먼트 콘텐츠의 오디오 포맷을 독점하니 기술 혁신이 거의 일어나지 않았거든요. 디즈니가 돌비 사운드 포맷으로 영화를 만들면, 결국 삼성과 LG TV 모두 돌비 포맷을 지원할 수 밖에 없고, 로열티가 또 돌비에게 지급됩니다. 그런데 VR이라는 새로운 하드웨어가 나왔거든요. 판을 다시 짤 수 있게 됐죠.” “VR을 끼고 들을 수 있는 입체 음향을 만드는 것이죠. 3차원 공간에서 움직일 때 마치 그곳에 있는 것처럼요. 예를 들어 제가 VR을 끼고 가상세계에서 가수 아이유의 콘서트를 보고 있다고 가정할게요. 이 상태에서 고개를 왼쪽으로 돌리면요? 소리가 오른쪽에서 들려야합니다. 고개를 오른쪽으로 돌리면? 소리가 왼쪽 귀에서 들려야 입체공간에 있는 것처럼 들립니다. 그러니까 3차원 공간에서 매칭이 되는 소리기술. 이걸 만들려고 했던 것이죠.” “그렇게 시리즈 A 받고 2017년 미국으로 갔죠. ‘이 기술을 VR의 표준으로 합시다. 돌비가 영화 콘텐츠의 표준 오디오 포맷인것처럼, VR 오디오 포맷은 가우디오랩으로.’ 이 주장을 돌면서 피칭했어요. 아마존, 드림웍스까지 미팅했습니다. 분위기 좋았죠. 금방이라도 계약하고 로열티가 쏟아질 것 같았습니다.” “그런데 2017년 여름쯤인가요? 미국 친구들이 연락을 갑자기 안 받았습니다. 오큘러스가 그해 봄에 나왔었는데, 알고보니 10만대도 안 팔렸던 것입니다. 10만명 유저를 대상으로 디즈니나 드림웍스가 수천억원을 들여서 콘텐츠를 만들 이유가 없었던 것이죠. 갑자기 바보가 됐습니다. 결국 한국 돌아와서 2018년 1월 방에 모든 팀원을 불러모았습니다. ‘회사 잔고가 6개월 어치 남았다’고 알렸습니다. 반전을 만들지 못하면 회사가 망한다고요. 나갈 사람은 지금 나가도 좋다고요. 원망하지 않겠다고 했습니다. 그때 팀원이 22명이었습니다.”

“그 이후 일단 당장 현실에 쓸 수 있는 기술을 만들어야 했습니다. 그렇게 작은 피봇팅을 해서 만든 기술이 ‘음량표준화’였죠. 22명 다 남았습니다. 물론 그 이후에 떠난 팀원도 있었지만, 팀원들 모두 음량표준화 기술을 만들어서 이 기술을 벅스, 플로, 바이브 등 주요 음원서비스에 납품하면서 숨통이 트였죠.” “예전 MP3 쓰셨던 분들 중에 곡에서 곡을 넘어갈 때, 갑자기 볼륨이 커져서 급하게 불륨을 줄이거나 이어폰을 뽑았던 경험. 대부분 있을거예요. 그 작은 페인포인트를 해결해주는 기술입니다. 음량을 균일하게 맞추는 일이요. 단순히 볼륨만 유지하면 되는 것처럼 보이지만, 꽤 난이도가 있는 기술입니다. 소리를 갑자기 줄이거나 하다보면 중요한 음역대가 들리지 않거나, 소리가 작아질 때 노이즈가 생길 수도 있고요. 소리가 울렁거리기도 합니다. 이걸 제대로 만들었기에 스트리밍 서비스 대부분에 기술을 팔았고요. 최근 서비스 이용하시는 분들은 이제 소리가 커지거나 작아지는 경험. 대부분 없으시죠?”

VR 때 만들었던 기술, 그것들은 전부 무용지물이 된 셈이네요. 제로 베이스에서 다시 여기까지? “아뇨. 그래도 여러 기술이 남았습니다. 요새 네이버 영상 콘텐츠에도 저희 기술이 들어가요. 노래방에 있는 것처럼 해주는 오디오 기술입니다. 걸그룹, 보이그룹 모두 멤버가 많잖아요. 그런데 요새는 특정 멤버만 고정으로 볼 수 있는 서비스도 네이버가 하고 있어요. 그러면 소리가 들려야 하는 위치가 다 달라지죠. 내가 시청중인 멤버를 기준으로 왼쪽에서 다른 친구가 말하는가, 오른쪽에서 말하는가. 이걸 파악해서 좌우 이어폰이나 헤드폰에서 나오는 소리의 크기와 디테일을 바꿔줍니다. 촬영 현장에서 멀리 있는 멤버가 하는 목소리가 메아리 처럼 들리도록 바꿔주는 기술도 탑재했고요” “그 외에도 MR을 제거하고 음성만 뽑아내는 기술, 영화에서 대사만 뽑아내고 배경음을 작게 처리하는 기술 등을 개발했고요. 전부 여러분이 쓰는 스트리밍 서비스나 영상 서비스에 숨어있어서 피부로 느끼기엔 쉽지 않을 겁니다. 저희가 돌비처럼 ‘가우디오랩’ 로고를 딱 박고 서비스할 수 있는 회사는 아니니까요. 하하”

2010년에 퇴사하셨는데, 첫 창업은 2012년입니다. 2년 공백이 있었네요. 2년은 백수였던 것인가요. “특허 사업을 하려고 했어요. LG에서 오디오 표준화 일을 했거든요. 오디오 표준화 시장, 보이지 않는 전쟁 같은 곳이죠. 왜 아까 돌비가 표준화를 장악했다고 했잖아요. MP3도 표준화된 포맷이고. 이런 포맷 말고도 통신이면 통신, 오디오면 오디오. 한 분야 안에도 여러 기술들이 ‘표준이 되면 세상 모든 로열티를 먹는 시장’을 두고 싸워요. 그래서 밖에 나가서 직접 발명해서 특허를 내거나, 여러 기술을 모아 특허를 중개하는 일. 이 사업을 하려고 했죠. 10명쯤 도모해서 ‘땡’하고 회사 나오면 시작! 이렇게 정했습니다.” “그런데 투자가 없어지고, 팀이 쪼개지고, 저는 회사를 나왔는데 회사 안 나오신 분들은 계속 다니게 됐죠. 연세대에서 연구교수를 짧게 했고요. 그 뒤에는 개인사업자로 뛰었죠. 당시만 해도 이런 IP를 돈을 주고 사서 모으는 특허 사냥꾼 회사들이 있었거든요. A4에 정말 아이디어만 그려서 줘도 그 자리에서 1000만원을 줬어요.” “그때 돈을 받았던 특허 아이디어 중에 하나가 ‘전화 받기 분포 분석’ 아이디어였죠. 한쪽으로 계속 전화를 받으면 청력이 손상되니까요. 왼쪽으로 몇번, 오른쪽으로 몇번. 스마트폰 내장 센서를 통해 이 분포를 분석해서 알려주는 기술과 특허를 프레젠테이션 하고 돈을 받았습니다. 한 달에 특허 하나를 내면 먹고 살기 충분했어요. 첫번째 창업인 윌러스표준기술연구소의 출발인 셈이죠.” “그러다 통신, 오디오 박사 연구원, 변호사, 변리사 분들이 합류하면서 금방 20명이 넘는 팀이 됐습니다. 직접 발명을 해서 특허를 내는 것이 회사의 주업, 통신 관련 특허 사업도 했고요. 그 중에 한 사업 부문이 오디오 특허 발명이었기 때문에 저는 계속 좋아하는 오디오 연구와 기술 특허 개발도 했었죠. 그러다 VR을 만나면서 떠나게 됐고요.”

오디오, 작은 시장 아닐까요. 승부를 걸 수 있는, 걸만한 시장입니까 “VR, AR 이라는 새로운 콘텐츠 시장이 열리니까요. 돌비가 지금은 헐리우드 스튜디오들을 꽉 잡고 있지만 새로운 콘텐츠 시대의 강자는 누가 될 지 모릅니다. BTS와 하이브, 네이버, CJ의 한류 콘텐츠가 VR 콘텐츠 시장의 선두주자가 될 수도 있고요. 아직 룰이 없는 시장이니 더 빠르게 치고 나가면 승산이 있죠.”

임경업 기자, 2022-02-28. 조선일보
https://www.chosun.com/economy/smb-venture/2022/02/28/34P4EPNTUNDZPK5YXNUD3BWGSQ/

전상배 가우디오랩 CSO “메타버스 시대, 소리로 세계 제패”

“몇 년만 지나면 AI라는 단어를 아무도 사용하지 않을 거예요. 그만큼 AI 기술이 너무나 당연해진다는 뜻이죠. ‘인터넷’이라는 개념이 너무 당연해서 굳이 언급하지 않는 것처럼요.” 가우디오랩의 인공지능(AI) 오디오 기술 연구를 책임지고 있는 전상배 CSO(Chief Science Officer)는 앞으로 오디오에 AI를 접목하는 것은 그리 특별한 일이 아닐 것이라고 내다봤다. 가까운 미래에는 오디오와 AI 기술의 공존이 지극히 자연스러운 일이 될 것이라는 이야기다. 앞으로 다가올 메타버스 시대, AI 오디오는 어떤 역할을 하게 될까. 전 CSO를 만나 이야기를 나눠봤다.

당초 가우디오랩은 VR 분야를 사업 타깃으로 잡았던 것으로 알고 있어요. 꽤 오래전부터 메타버스를 향해 달려온 것 같은데요. "과거에 ‘VR’로 불렸던 분야가 지금은 ‘메타버스’로 불리게 됐을 뿐이지, 사실은 같은 개념이라고 생각해요. 조금 더 리얼하고, 더 많은 인터랙션(상호 소통)이 가능한 미디어를 현재는 메타버스라고 정의하잖아요. 형태만 바뀐 셈이죠. 저희가 2016년에 메타버스의 꿈을 꾸기 시작하면서 가장 먼저 문을 두드린 곳이 미국 할리우드였어요. VR 오디오 시장에 빠르게 깃발을 꽂고 독점적 위치를 확보하자는 생각이었죠. 실제로 할리우드에서 드림웍스, 월트디즈니, 아마존 등과 만나 콘텐츠 제작과 기술 제휴에 대해 논의했습니다. 2017년까지도 VR 오디오 사업화를 활발하게 진행했는데, 이후 VR 시장이 급속도로 가라앉아 버렸어요. 당시 VR 콘텐츠 제작비는 일반 영화의 10배에 달했는데, 시청자는 10분의 1도 되지 않았거든요. 결국 상업적 측면이 가장 큰 원인이었던 것 같아요. 사실상 저희에게 냉혹기가 찾아온 거죠."

미래만 바라볼 수는 없는 게, 저희는 어쨌든 기업이잖아요. 수익이 필요하죠. 2017년부터는 지금 시장에 필요하다고 판단되는 오디오 기술로 PMF(Product Market Fit)를 찾으며 때를 기다렸습니다. 미래 기술을 만들면서도, 그 기술을 현재의 시장에 잘 적용할 수 있는지 염두에 둔 거죠. 시장을 판단할 때도 향후 메타버스로 갈 수 있는 시장이라고 생각되면 뛰어들고, 그게 아니라면 OTT나 스트리밍 영역에서 사업화 기회가 있는 기술인지를 봤습니다. 꼭 메타버스에 필요한 기술만을 개발했다기보다는, 메타버스에 필수적이면서도 다른 OTT 산업에서 쓸 수 있는 기술을 발굴한 거죠. 이런 방식으로 4년을 보내면서, 미래만 보고 달리는 게 아니라 미래와 현재 사이에서 균형을 잡으며 살아남는 법에 대해 배웠다고 생각합니다.

다양한 기업과 협업하고 있는 것 같은데요. 현시점에서 가우디오랩이 가장 주력하고 있는 타깃 분야는 어디인가요.
"사실 특정 산업군에 치중하겠다는 생각은 별로 갖고 있지 않아요. (가우디오랩의 파트너사인) 네이버를 예로 들자면, 기업 내에서도 굉장히 다양한 서비스를 제공하잖아요. 네이버 나우(NOW)는 공연 현장을 라이브 스트리밍으로 현실감 있게 전달하고, 네이버TV는 음량 평준화(loudness normalization) 기술을 적용하는 식이죠. 각각 독립된 분야로 볼 수도 있겠지만, 결국은 ‘좋은 소리 경험을 이뤄간다’는 면에서 하나의 문제를 푸는 거라고 생각하거든요. 고객사가 원하는 기술이 무엇인지 계속해서 파악해 가면서 우리의 내공을 높여 가는 방향을 생각하고 있습니다."

꼭 메타버스가 아니더라도 최근 들어 오디오 기반 서비스가 주목받고 있는 것 같습니다. 배경을 짚어주신다면요. "사실 소리에만 의존하는 커뮤니케이션 방법은 예전부터 존재했죠. 라디오가 대표적이고, 최근에는 오디오북이나 음성 채팅으로 발전했다고 생각하거든요. 언젠가부터 커뮤니케이션을 생각하면 비디오를 이야기하게 됐는데, 생각보다 소리가 중요한 요소였습니다. 그럼 라디오를 즐겨 듣던 시대와는 무엇이 달라졌을까요. 과거보다 조금 더 토픽이 세분화되고 전문화가 이루어진 것 아닌가 싶어요. 오디오북은 내가 골라서 듣는 콘텐츠이고, 팟캐스트도 유사하잖아요. 기존에도 청각 미디어가 있었고, 그게 조금 더 세부적으로 발전해 나가는 단계가 아닌가 싶습니다. 또 줌(Zoom) 같은 비디오 플랫폼에서는 화면을 띄우는 순간 자신이 너무 많이 노출된다고 생각하는 것 같아요. 그런데 목소리만 들어가면 절반의 익명성이 보장되는 느낌이잖아요. 그런 인식이 조금은 영향을 주지 않았을까 하는 생각이 듭니다."

국내뿐만 아니라 해외 시장 공략도 중요할 것 같은데요. 어떤 전략으로 시도할 생각인가요. "저희가 2016년에 미국에 갔던 이유는 당시 할리우드 콘텐츠가 최고라고 생각했기 때문이었어요. 그런데 요즘 <오징어 게임>을 비롯해 한류가 전 세계적으로 굉장히 뜨겁고 힙한 느낌을 주잖아요. 지금이 저희에게는 둘도 없는 좋은 기회라고 생각합니다. 그들의 등에 올라타는 게 제일 좋은 방법이 아닐까 싶어요. 굳이 미국에 가서 도전할 게 아니라, 한국에서도 좋은 콘텐츠들이 많이 나올 거라고 생각하거든요. 영화나 드라마 같은 미디어 형태의 한류도 있겠지만, 저는 메타버스 분야도 한국이 제일 열심인 것 같다는 생각이 들거든요. 어떻게 보면 한국이 선발주자고 나머지는 후발주자라고 할 수 있어요. 후발주자인 글로벌 기업들이 한국 콘텐츠를 레퍼런스로 봤을 때 (가우디오랩의 기술을) 채택하기가 훨씬 더 쉬워진다고 생각해요. 단순히 기술이 좋다는 이야기만으로 설득하는 건 어려워요. 그런데 특정 콘텐츠를 보여주고 ‘거기에서 나오는 소리, 우리가 만든 거야’라고 하면 간단하거든요. 한류가 핵심 기술 그 자체인 것 같다는 생각이 듭니다."

최종 목표가 있다면. "과거에는 VR로 불렸고, 지금은 메타버스라고 부르는 미디어가 있죠. 최고의 리얼리즘을 전해주는 이 미디어가 생겨났을 때, 소리 분야에서는 가우디오랩을 가장 먼저 떠올리도록 하는 게 가장 큰 목표입니다. 이를 통해 결국 세계 정복을 이루고 싶습니다."

정초원 기자, 2021-12-27, 매거진한경
https://magazine.hankyung.com/money/article/202112209988c

1년간 만난 혁신 스타트업...올해 목표 이뤘나 보니

오디오 기술 기업 ‘가우디오랩’은 지난 8월 인터뷰 진행 후 두 달 뒤 네이버 D2SF, LB인베스트먼트 등으로부터 113억원 규모 시리즈 B 투자를 유치했다. 가우디오랩은 증강현실(AR), 가상현실(VR)뿐만 아니라 스트리밍, OTT(Over The Top) 서비스에 필요한 공간음향 기술을 제공한다. 회사는 올해 4월 첫 상용 기술로 AI기반 가사·자막 동기화 솔루션인 GTS(Gaudio Text Sync)를 NHN벅스를 통해 공개했다. 가우디오랩은 내년 공간음향, AI 오디오 기술 고도화와 함께 해외 시장에도 진출할 방침이다. 회사 측은 “다수 국내 플랫폼에 가우디오랩 솔루션이 탑재될 예정”이라며 “해외 시장 진출과 핵심 인력 확보에 집중할 예정”이라고 설명했다.

최다래 기자, 2021-12-21, 지디넷코리아
https://zdnet.co.kr/view/?no=20211220165321

사운드 장인 집단 가우디오랩 전상배 AI 그룹장, 상 받았다

AI 메타버스 오디오 전문 기업 가우디오랩 AI 그룹장 전상배 최고과학책임자(CSO, Chief Science Officer)가 25일 롯데월드타워 스카이 31에서 진행된 정보통신기획평가원(이하 IITP)이 개최한 ‘IITP 우수과제・연구자 시상식 및 성과 교류회’에서 우수 연구자로 선정됐다. 전상배 CSO가 이끄는 가우디오랩 AI 그룹은 ‘스트리밍 미디어 서비스를 위한 오디오 AI 기술 개발’을 연구해 GSEP(Gaudio Source SEParation), GTS(Gaudio Text Synchronization), GCV(Gaudio Clear Voice), GSing 등 4가지 소프트웨어를 상품화하는 성과를 냈다. 2년 미만의 짧은 수행 기간에도 불구하고 5건의 사업 계약을 체결하며 시장성까지 증명했다는 설명이다.

최진홍 기자, 2021-11-26, 이코노믹리뷰
http://www.econovill.com/news/articleView.html?idxno=556914

네이버가 오디오테크 스타트업 ‘가우디오랩’에 투자한 이유

네이버의 스타트업 육성조직 D2SF는 14일 오디오테크 스타트업 ‘가우디오랩’에 신규 투자했다고 밝혔다. 가우디오랩의 이번 시리즈B 투자유치금은 113억원 규모로 LB인베스트먼트가 주도했다.

가우디오랩은 지난 2015년 설립된 AI(인공지능) 음향 스타트업으로, 다양한 콘텐츠 환경에서 몰입감 높은 오디오 경험을 구현하는 기술을 개발하고 있다. 특히 이용자의 움직임, 기기 특성을 고려해 자동으로 입체적인 음향을 구현하는 ‘공간 음향’ 기술은 글로벌 표준으로 인정받았다. OTT(온라인 동영상 서비스), 스트리밍 서비스, 무선 이어폰, 스마트폰 등 이용자의 디바이스와 플랫폼이 다양해짐에 따라 발생하는 오디오 문제를 하나의 SDK(소프트웨어 개발 도구)로 해결해 다수의 파트너사도 확보하고 있다. 음량평준화 기술은 예를 들어 네이버TV 영상을 재생했을 때 광고와 본 영상 음량을 자동으로 맞춰주는 것이다. 이 전엔 광고와 본 영상 음량이 달라 이용자들이 불편을 느끼는 경우가 많았다. 각각 동영상 인코딩 과정이 다르기 때문이다. 이에 두 영상의 음량을 비슷하게 맞추기 위해 인코딩해야 하는 과정이 또 한 번 필요했는데, 음량평준화 기술은 이를 자동으로 조정해준다. 이머시브 오디오 기술 같은 경우 라이브 오디오쇼인 네이버NOW에서 생중계 하고 있는 콘텐츠들에 적용되고 있다. 특히 2021년 펜타포트 락 페스티벌 생중계에 적용됐는데, 이용자들의 콘텐츠 경험을 한 단계 끌어 올리며 많은 호응을 얻었다. 네이버NOW는 생중계 콘텐츠들이 많은데다, 동영상 콘텐츠이지만 음악 중심 플랫폼이라 오디오 기술이 중요하다. 이에 양사의 기술 협력으로 콘텐츠의 질을 끌어 올렸다.

이번 투자를 계기로 양사는 협력을 더 강화해 나갈 계획이다. 특히 네이버 측의 이번 투자엔 메타버스 시장 선점을 노리고 있는 가우디오랩의 성장에 대한 기대감도 담겼다. 현실과 가상세계를 넘나드는 메타버스에서 몰입감을 끌어 올리려면 오디오 기술이 중요하다. 가우디오랩은 앞으로 메타버스 오디오 시장의 표준이 되겠다는 목표를 갖고 있다.

황금빛 기자, 2021-10-14, 블로터
https://www.bloter.net/newsView/blt202110140009

메타버스 오디오의 마지막 퍼즐 가우디오랩, 113억원 투자 유치

AI 메타버스 오디오 테크 스타트업인 가우디오랩이 시리즈 B 113억원의 투자 유치에 성공했다고 14일 밝혔다. LB인베스트먼트 주도의 이번 투자 유치에는 네이버 D2SF도 참여했다.

가우디오랩은 다양한 콘텐츠 환경에서 몰입감 높은 오디오 경험을 구현하는 기술로 정평이 났다. 음량 정규화 기술, AI 텍스트 씽크, AI 음원 분리기술 등이 대표적이다. 특히 음량 정규화 기술은 OTT 등 모바일 플랫폼 콘텐츠의 음량을 일정하게 유지하게 만들어 새로운 가능성을 인정받았다. 오 대표는 <이코노믹리뷰>와의 7월 인터뷰에서 "라우드니스 기술을 바탕으로 이용자들은 콘텐츠마다 볼륨을 조정하지 않아도 일정한 음량을 자동으로 즐길 수 있다"고 설명했다.

AI 음원 분리기술은 다양한 음원을 AI 기술로 나눠 제공할 수 있다. 오 대표는 "콘텐츠에 녹음된 다양한 오디오를 자동으로 분류한다"면서 "이미 다양한 플랫폼에서 우리의 기술을 활용하고 있다"고 말했다. 네이버와의 접점도 많다. 네이버 D2SF는 2015년 출범 당시부터 가우디오랩과 교류하며 접점을 탐색했고, 이는 네이버 동영상 플랫폼과 가우디오랩의 긴밀한 기술 협력으로 이어졌다. 가우디오랩과 네이버는 이용자 환경에 맞춰 최적화된 음량을 자동으로 제공하는 ‘음량평준화(Loudness Normalization) 기술’을 시작으로, 온라인에서도 생생한 현장감과 몰입감을 느낄 수 있는 ‘이머시브 오디오(Immersive Audio) 기술’ 등을 공동 개발 및 연구해 서비스로 구현했다.

한편 가우디오랩은 이번 투자 유치를 통해 공격적인 인재 확보에 나선다는 방침이다. 오현오 대표는 “이번 투자 유치를 통해 핵심 인재를 계속 영입할 계획”이라며, “압도적인 오디오 기술력으로 새로운 시장을 개척해 메타버스 오디오 시장의 표준이 되어, 전 세계 이용자들의 오디오 경험을 향상할 것”이라고 밝혔다.

최진홍 기자, 2021-10-14, 이코노믹리뷰
http://www.econovill.com/news/articleView.html?idxno=551922

가우디오랩 "VC들, 산전수전 경험을 자산으로 봤죠"

오 대표는 “VR 1차 붐이 순식간에 사그라지면서 가우디오랩의 주요 고객이던 드림웍스와 디즈니 등이 시장을 빠져 나갔다”며 “하지만 포기보다는 그간 갈고 닦은 기술을 활용할 수 있는 틈새시장을 찾기 시작했고, 사업 타깃을 VR에서 OTT로 전환했다”고 말했다. 이어 “TV방송은 청력 보호 차원에서 일정한 소리를 내도록 하는 ‘음량 기준값’이 존재하지만, OTT나 유튜브와 같은 인터넷 서비스에는 이러한 기준값이 없었기 때문”이라고 설명했다. 전환 결과는 성공적이었다. OTT를 비롯한 디지털 미디어 특성에 맞는 음향 기술을 구현해내면서 소리 크기나 품질이 다른 영상이 주어지더라도 균일한 품질의 음향을 제공한다는 평가를 받았다. 국내외 OTT 업체들이 가우디오랩에 의견을 공유하고 사업 제휴를 건넨 배경이다. 가우디오랩은 자사 음향기술을 네이버TV와 SK텔레콤 플로, NHN 벅스 등에 공급하고 있다. 넷플릭스, 디즈니, 유튜브 등 해외 서비스사와는 꾸준히 상호 기술에 대한 의견을 교류 중이다. 오현오 대표는 “산전수전 겪고 보니 모든 경험이 회사의 기초 체력을 탄탄하게 다지는 자산이 됐다”며 “VC들은 이번 시리즈B 투자에서 ‘버티는 힘에서 비롯된 기술력과 경험’에 큰 점수를 줬다”고 말했다.

김연지 기자, 2021-10-05, 이데일리
https://www.edaily.co.kr/news/read?newsId=01121766629209968&mediaCodeNo=257

가우디오랩 "돌비 넘어서겠다"

돌비에 도전장을 던진 국내 스타트업(신생 벤처기업)이 있다. 인공지능(AI) 음향 스타트업 ‘가우디오랩’이다. 가우디오랩이 노리는 시장은 최근 화두로 떠오르고 있는 메타버스다. 오현오 가우디오랩 대표는 “현실과 비현실이 혼합된 3차원 가상 세계인 메타버스에서 몰입감을 끌어올리려면 콘텐츠뿐만 아니라 소리도 실제와 같아야 한다”며 “아직 음향 표준 체계가 정립되지 있지 않은 메타버스 시대에서 자체 개발한 ‘공간음향 기술’을 표준화 시키겠다”고 말했다. 오 대표가 언급한 공간음향은 단어 그대로 한 공간에서 들리는 모든 소리를 담는 기술을 뜻한다.
(중략)
오 대표는 “‘BTRS’, ‘바이노럴 렌더링’이라 불리는 이 기술은 메타버스 시대에 적합한 사운드”라며 “영화관은 청자를 둘러싼 여러 대의 스피커 덕분에 자신을 둘러싼 소리를 웅장하고 원금감 있게 들을 수 있는데, 헤드셋만으로 원근감 있는 사운드를 제공한다는 점이 이 기술의 가장 큰 특징”이라고 말했다. 회사 측은 메타버스를 이용하는 개인 크리에이터도 자사 음향 기술을 손 쉽게 사용할 수 있게 소프트웨어(SW) 등의 형태로 상용화시킬 계획이다.

오 대표는 메타버스 시대에서 이러한 기술을 기반으로 표준 음향 체계를 개발해 ‘제2의 돌비’가 될 것이라 자신했다. 연세대학교 전기전자공학 박사 출신인 오 대표는 “창업 이전 LG전자 디지털TV연구소에서 오디오팀장으로 근무하면서 대기업도 꼼짝 못하는 돌비의 독점성에 대해 몸소 깨달았다”며 “가우디오랩엔 대기업에서도 한 명도 보기 힘든 음향공학박사가 7명이나 있고, 20여 명의 오디오 전문가가 모여있다. 음향 기술력만큼은 자신이 있다”고 말했다. 가우디오랩은 현재는 음향 기술력을 앞세워 내실다지기에 나서고 있다. 메타버스의 근간이 되는 가상현실(VR), 혼합현실(AR) 시장이 아직은 성숙되지 않아서다. 가우디오랩은 네이버와 함께 소리를 재생하는 기기나 콘텐츠마다 들쭉날쭉한 음량 편차를 줄이는 기술인 ‘음량 평준화 기술’을 개발했다. 온라인동영상서비스(OTT) 시장에서 활용될 수 있는 여러 영상 간 음량의 차이를 보정하는 기술도 개발해 SK텔레콤의 플로, NHN의 벅스 등에 공급했다. 또한 콘텐츠 오디오에서 사람의 목소리만을 따로 추출하는 인공지능 오디오 기술도 시장에 내놨다.

업계에선 뛰어난 기술력을 갖춘 가우디오랩의 행보에 주목하고 있다. 2015년 창업한 가우디오랩은 현재까지 6억 규모 시드 펀딩, 시리즈 A로는 50억을 투자받았다. 회사 측은 올해 하반기 시리즈 B 투자도 준비 중이라고 밝혔다. 오 대표는 "회사의 궁극적인 목표는 메타버스 시장 선점이다. 다가올 VR, AR 시대를 준비하며 2년 내에 상용화할 수 있는 메타버스 음향 서비스를 선보일 것”이라며 “음향 기술을 활용하기 위해선 전용 장비와 별도의 라이선스 계약이 필요해 일반 소비자들은 접근하기 어려운 돌비와 달리, 개인들도 손 쉽게 활용할 수 있는 서비스로 개발해 메타버스에선 돌비를 밀어내겠다”고 전했다.

배성수 기자, 이관우 기자, 2021-08-19, 한경AI인사이트
https://www.hankyung.com/it/article/202108193267i

가우디오랩 "메타버스 시대, 소리도 진짜 같아야"

공간감·반사음 반영된 VR 음향..."실제 콘서트장에 있는 듯" 이태규 가우디오랩 CTO는 "VR 콘서트에는 BTRS(Being There Recreate system) 음향 기술이 적용된다"며 "소리의 공간감과 반사음을 반영해 직접 그곳에 있는 것처럼 느껴지도록 하는 기술"이라고 설명했다.

방음처리가 된 작은 방으로 기자를 안내했다. 효과음을 들려주고, 기자가 쓰고 있는 헤드셋과 방 안에 놓여 있는 스피커 둘 중 어느 곳에서 소리가 나는지 맞춰보라고 했다. ‘이쯤이면 쉽지’ 생각했지만, 틀렸다. 분명 외부에서 난 소리로 인식했는데, 쓰고 있는 헤드셋에서 난 소리라고 했다. 이태규 CTO는 “이 기술은 ‘바이노럴 렌더링’이다. 현실 세계 소리와 거의 구분이 안 될 정도로 정교한 소리를 구현한다"면서 "이 기술로 가상에 있어도 사람들은 현실인 것처럼 느낄 수 있다. VR과 메타버스 시대에 필요한 음향기술”이라고 설명했다.

올 하반기 가우디오랩은 콘텐츠 출연자의 위치 입력을 자동화해 소리에 반영하는 기술과, 이어폰 착용 시 실시간으로 밖의 소리를 차단하는 소리차단 기술을 개발 중이다.

이 CTO는 가우디오랩의 하반기 목표로 “현재 1일 1천만 명 이상의 이용자들이 매일 가우디오랩의 음향 기술을 경험 중인데, 하반기에는 이 숫자를 두 배까지 늘리고 싶다”고 강조했다.

최다래 기자, 2021-08-11, 지디넷코리아
https://zdnet.co.kr/view/?no=20210810173039

소리에 미친 사람들이 모두 모였다, 여기는 어디?

가우디오랩을 공동창업한 이태규 최고기술책임자(CTO)를 최근 서울 강남 테헤란로에 위치한 이 회사 회의실에서 만났다. 이태규 CTO가 학생이고 오현오 대표가 UHD TV 방송 표준을 위한 오디오 의장이던 시절, 두 사람은 함께 개발해낸 기술이 VR 시장에서도 가능성이 있을 거라고 보고 의기투합해 가우디오랩을 창업했다. 페이스북이 오큘러스를 인수한 이듬해인 2015년이었다.

이태규 가우디오랩 최고기술책임자(CTO) : "창업이전에 엠펙(MPEG)이라는 오디오 표준을 만드는 단체에서 활동했다. ‘엠펙에이치(MPEG-H)’라는, 지금 국내 UHD 방송의 표준으로 최종 채택된 오디오 압축방식이 있는데 거기에 저희가 제안한 헤드폰 재생 기술이 채택됐다. 그때의 기술 미션은 스피커가 스물두대가 배치되어 있는 공간에서 듣는 소리와 헤드폰을 쓰고 듣는 것이 동일한 느낌을 주도록 하는 것이었다. 그 기술은 결국 가상현실(VR) 환경에서도 핵심이더라. 이걸 단순히 표준에서만 끝내지 말자고 오현오 대표와 함께 창업을 하게 됐다. 당시에는 페이스북이 ‘오큘러스’라는 VR 회사를 2조5000억원에 인수하던 타이밍이라, 우리 기술이 분명히 널리 쓰일 것 같았다. 산업화 영역을 고민하면서 기술이 적용되는 부분을 확장하기 위해서 창업하게 됐다."

약간, 소리계의 SI(System Integrator, 시스템 통합)같은 생각이 든다
"맞다. 오디오 업계가 워낙 인재가 부족하다. 예를 들어 삼성이나 카카오 같은 큰 기업들도 오디오 전문 인력이 잘 없다. 그러다보니 저희가 간지러운 부분들을 많이 도와드리는 형태로 일을 하고 있다. 그렇지만 우리 비즈니스 모델은 모두 기술 라이선싱이다."

오디오 인력이 시장에 적어서 대기업도 뽑기 힘든데, 가우디오랩은 어떻게 인재를 확보했나
"아무래도 대기업의 오디오팀이 하는 업무는 그 회사의 메인이 되기 어렵다. 예를 들어 LG전자의 TV 부서에서 오디오 파트는 힘을 가지기 어렵다. 오디오를 전문으로 하는 사람이 가우디오랩에 합류했을 때는, 대기업보다 훨씬 더 액티브하게 오디오에 집중해서 일을 할 수 있다보니 그런 부분을 매력으로 느끼는 것 같다."

국내에는 오디오 솔루션을 전문으로 하는 회사가 많이 없나? 그렇다. 많이 없다. 이유가 무엇인가
"오디오 제품을 만들기 위해서는 오디오 디지털 신호 처리를 전공한 사람들이 필요하다. 그런데 지금 보면, 각 대학에 오디오 전공이 드물뿐더러 관련 교수들도 정년이 되어 연구실 문을 닫는다. 그런데 최근에 더 어렵게 된 것 중 하나는, 오디오 관련 연구를 하던 연구실들이 거의 AI 쪽으로 넘어가고 있기도 하다. 음성인식이나 합성에 집중을 하다보니 더 인력을 구하기 어려운 상황으로 가고 있다."

오디오가 중요해지는 것은 너무나 당연한 일이다. 자동차도 인포테인먼트를 강화하게 되면 오디오에 힘을 써야 하는데 왜 전반적으로 투자가 일어나지 않나?
연구도 트렌드가 있다. 연구실 입장에서는 프로젝트를 잘 딸 수 있어야 되고 논문을 썼을 때 채택이 잘 돼야한다. 우리가 하는 일은 트렌디함과는 조금 거리가 있어서 그런 것 같다. 글로벌하게 인재난이 있다. 기업들에서는 투자를 많이 하고 있지만, AI 기반으로 많이 넘어가고 있다.

VR환경이나 2D 환경 모두에서 현장에 있는 느낌(Being There)을 살려주는 거다. VR 환경에서 보면, 현장의 관객 소리, 공간에서만 느낄 수 있는 소리가 많이 난다. 그런데 이게 2D로 넘어오면, 작은 스크린으로 보기 때문에 내가 그 곳에 있다는 지각을 할 수가 없다. 그래서 VR 환경처럼 소리를 동일하게 들려주면 헤드셋을 쓰고 들을 때만큼 좋은 경험이 되지 않고, 그 현장감 있는 소리가 어색하게 느껴진다. 그래서 2D에는 2D에 적합한 이머시브 오디오를 적용하는 것이 필요하다.
2D에 맞는 이머시브 오디오란 어떤 것인가
멀티뷰 시나리오다. 아이돌 그룹을 전체로 볼 수도 있고, 멤버 중 내가 원하는 스타를 단독 샷으로 볼 수도 있게 여러 영상이 송출되고, 그 영상에 따라 소리의 방향도 달라지는 시나리오다. 예를 들어, 어느 한 멤버를 클릭하면 그 멤버가 정면에 있는 듯한 느낌을 준다. 각 멤버가 분할되어서 나온다면, 그 위치에 맞게 소리가 나고, 풀샷으로 잡힐 때는 시청자가 조금 떨어져서 이들을 관찰하는 듯한 느낌을 준다. 그 상황에서 스페이셜 오디오 기술을 적용한다.

스페이셜 오디오 기술은 무엇인가 고개를 좌우로 움직이면 스크린에 맞게 소리의 방향이 달라진다. 또, 화면이 시간에 따라 바뀌는데 그 화면에 맞게 소리(방향이나 공간감)가 자동으로 바뀌기도 한다. 이런 기술들은 바이노럴 렌더링(오디오 신호를 사람의 귀에 전달되는 신호로 모델링하는 프로세스)이라고 오래전부터 있었던 것이지만, 플랫폼에 맞게 개발하기 위해서는 굉장한 고도화가 필요하다. 만약 모든 콘서트 현장에 이런 이머시브 오디오를 적용하려 한다면 비용 문제가 상당하기 때문에 적용에 고민이 될 수밖에 없다. 새로운 장비를 들여와야 하고, 오디오 신호를 연결하고 이를 처리하는 엔진도 사야 하기 때문에 비용이 증가한다. 그게 현재 이머시브 오디오를 도입하는데 굉장히 큰 장벽이었다. 지금 가우디오랩이 추구하는 것은 기존의 워크 플로우는 그대로 둔채로 저희 기술만 접목해 쉽게 문제를 풀려는 것이다. 고도화를 진행하고 있다. 예를 들면 콘텐츠를 만들 때 출연자들이 (옷에 부착하는 형태의) 라발리에 마이크를 착용하고 있고, 거기에서 들어오는 소리를 사운드 엔지니어가 콘솔에서 적당한 수준으로 들리도록 실시간 에디팅을 한다. 그 콘솔에 가우디오랩의 BTRS가 설치되어 있는 맥북을 연결해 출력하면 자동으로 소리(방향성 등)가 처리되는 것이다. 즉 수많은 장비가 필요했던 것을 소프트웨어가 대체하는 것이다.

남혜현 기자, 2021-08-05, 바이라인네트워크
https://byline.network/2021/08/5-90/

가우디오랩, AI 가사 자동 싱크 솔루션 상용화

가우디오랩이 오디오 인공지능 기술을 활용해 가사와 음원을 자동으로 동기화하여 실시간 가사 보기 기능을 제공할 수 있도록 하는 솔루션인 GTS(Gaudio Text Sync)를 출시하고, 국내 대표 음원 스트리밍 서비스 중 하나인 벅스(Bugs, ㈜NHN벅스)를 통해 상용화했다.

GTS는 가우디오랩의 독자적인 오디오 기술로 개발된 국내외 유일 인공지능 기반 가사 동기화 솔루션이다. 지금껏 ‘타임 코더’라 불리는 인력이 직접 투입돼 매 곡마다 일일이 가사와 음원의 시점(Time sync)을 맞추던 문제를 자체 AI기술을 통해 풀어냈다. 국내는 물론 전 세계적으로도 해당 솔루션을 서비스하는 업체를 찾아보기 어려울 정도이다.

GTS 솔루션은 정확히 싱크된 가사를 빠르게 생성해 서비스할 수 있어, 스트리밍 서비스 담당자는 물론 이용자 만족도 향상에도 기여하고 있다. 하루에 새롭게 발매되는 음반의 수가 수만 장, 트랙 수로는 수십만 곡에 이르는 현 음원시장에서는 수작업으로 모든 곡에 싱크 가사를 생성하는 것이 사실상 불가능하다. 반면, GTS 엔진이 장착된 서버 1대면 하루 약 7만 곡을 처리할 수 있다.

현재 음원 스트리밍 서비스사가 보유한 곡은 각 사 별로 약 4천만에서 7천만 곡 정도의 규모이나, 실시간 가사가 제공되는 곡은 아직 수십만 곡에 그친다. 실시간 가사 입력을 위해 소요되는 수작업 인력과 시간 비용 문제 때문이다. 이번 GTS 상용화를 통해 음원 서비스사가 제공하는 사실상 모든 곡에 대해 실시간 가사 보기가 가능한 시대가 열린 셈이다.

이와 관련해 가우디오랩 전상배 최고과학책임자(CSO)는 “음원 스트리밍 서비스를 이용할 때 동기화에 오류가 있는 가사를 제공하거나 싱크 가사가 아닌 일반 가사를 제공하는 경우가 많은데, 가우디오랩의 기술을 활용하면 빠르고 정확하게 많은 곡에 대한 싱크 가사를 제공할 수 있다”며, “잘못된 가사의 오류를 검출하는 기능 탑재로 가사의 품질 관리도 가능하고, 한국어, 영어, 중국어 등 다양한 언어를 지원하는 만큼, 전 세계 음원 서비스에 적용되어 사용자들의 음악을 듣는 경험을 더욱 향상시킬 수 있을 것”이라고 말했다.

2021-04-27, 플래텀
https://platum.kr/archives/161891

가우디오랩, VR 콘텐츠용 사운드로 세계1위 돌비에 도전장

가우디오랩은 네이버TV, SK텔레콤의 플로, NHN의 벅스 등에 이 기술을 공급했다. 비슷한 수요가 있던 음원 스트리밍 업체들도 가우디오랩을 찾았다. 스마트폰 제조사에도 음향기술을 팔고 있다. LG전자는 올해 전략 스마트폰인 LG벨벳과 LG윙에 가우디오랩의 음향기술 ‘스페이셜 업믹스’를 탑재했다. 음악을 듣는 사용자가 마치 현장에 있는 것과 같은 공간감을 느낄 수 있도록 하는 기술이다. 최근 베트남의 스마트폰 제조사 빈스마트도 자사의 플래그십 스마트폰 ‘아리스’에 이 기술을 적용했다.

최한종 기자, 2020-11-03, 한경 엣지
https://www.hankyung.com/it/article/2020110399561

’소리에 미치다’ 네이버도 반한 가우디오랩

TV 방송은 청력 보호를 위해 프로그램들이 일정한 소리를 내도록 음량 기준값에 맞춰 정부에서 규제하지만 OTT나 유튜브 등 인터넷 서비스는 이런 규제가 없다. “오디오 전문단체인 오디오엔지니어링소사이어티(AES)에서 국제 표준을 만들어 권고하고 있어요. 권장값이 TV 방송은 -24 LUFS(Loudness Unit referenced to Full Scale 오디오 허용 최대치), 휴대(모바일) 기기는 -16 LUFS입니다.” LUFS는 최대치에서 얼마나 줄였는지 마이너스(-) 기호로 표시하므로 숫자가 작을수록 소리가 크다는 뜻이다. 유튜브는 자체적으로 -14 LUFS를 권장값으로 갖고 있지만 영상 제작자가 이를 잘 몰라서 이보다 큰 소리로 만들어도 음량을 낮춰 내보내지 않는다. “-14 LUFS보다 큰 소리를 장시간 들으면 청력 손실이 일어날 수 있습니다.”

문제는 사람의 귀가 음량이 클수록 좋은 소리로 착각하는 점이다. “사람은 20헤르쯔(㎐)에서 2만㎐ 사이의 소리를 듣는데 아주 낮은 주파수와 높은 주파수를 잘 듣지 못하고 중간 소리만 듣습니다. 음량을 키우면 낮은 주파수와 높은 주파수도 잘 들려서 소리가 좋다고 착각하죠. 반면 귀는 혹사당합니다.” 이를 의식해 요즘 나오는 음악들은 아예 음량을 키워 놓았다. “최신 곡들의 음량은 -6, -7 LUFS 정도 됩니다. 반면 1980, 90년대에 나온 조용필, 서태지의 노래들은 이보다 LUFS 수치가 높아서 작게 들립니다.”

따라서 예전 노래와 요즘 노래를 잇따라 재생하면 음량이 서로 다르다. 가우디오랩의 라우드니스 기술은 이를 동일하게 맞춰 준다. 오 대표는 마치 키 높이를 맞추듯 소리 값을 알아서 조정하는 이 기술을 ‘라우드니스 SDK’라는 소프트웨어 로 만들어 기업들에게 판매한다. 오 대표는 새해에 라우드니스 기술을 들고 해외로 나갈 예정이다. “영상메신저 ‘틱톡’으로 유명한 중국의 바이트댄스와 이미 라우드니스 공급 협의에 들어 갔습니다. 일본 업체들과도 접촉할 생각입니다.”

최연진 기자, 2020-01-06, 한국일보
https://m.hankookilbo.com/News/Read/202001030906047004

“6개월 시한부 통장잔고, 기술력이 결국 우릴 살렸다"

탄탄한 기술력을 바탕으로 가우디오랩은 2016년 한국투자파트너스와 LB인베스트먼트, 소프트뱅크벤처스, 캡스톤파트너스 등으로부터 투자를 유치했다. VR콘텐츠가 세계 IT업계에 새로운 혁신으로 꼽히던 때다. 가우디오랩은 이를 발판 삼아 할리우드 제작사 대상 VR사운드 솔루션을 납품하기 위해 미국 LA에 사무실을 마련했다.

승승장구하던 가우디오랩에 겨울이 찾아온 건 VR시장 전체가 휘청이던 2017년이었다. 업계 예상과 달리 VR기기는 일반에는 접근 장벽이 높았다. 생각보다 보급 속도가 느렸던 이유다. 2018년 초가 되자 회사 곳간은 바닥을 보이기 시작했다.

오 대표는 결단을 내려야 했다. VR이 아닌 온라인동영상서비스(OTT) 시장으로 방향을 전환해야 한다고 판단했다. 사업 방향을 전환한 것 보다 조직을 수습하는게 그에겐 더 어려웠다. 오 대표는 "VR시장에 깃발 꽂아보자고 모인 사람들에게 VR을 접자고 했으니 조직이 흔들릴 수 밖에 없었다"고 당시를 회상했다.

오 대표가 과감하게 방향전환을 시도할 수 있던 건 기술이라는 뒷배가 있었기 때문이다. VR콘텐츠와 OTT콘텐츠 음향기술 핵심이 크게 다르지 않았던 덕분이다. 오 대표는 "보유 기술도 많았고 이 중 몇 개를 조합해 조금만 수정하면 바로 OTT시장에 접목할 솔루션을 만들 수 있다고 판단했다"며 "결국 우리가 해왔던 사업과 같은 맥락에 있으니 VR보단 조금 더 가능성이 있는 OTT시장에 집중해보자고 구성원을 설득했다"고 말했다. 동절기 중 가우디오랩이 개발한 OTT오디오 기술 중 하나는 라우드니스 노말라이제이션(Loudness Normalization) SDK다. OTT서비스 내 콘텐츠 간 음량 차이를 자동으로 조율해주는 솔루션이다.

차현아 기자, 2019-11-15, IT조선
http://it.chosun.com/site/data/html_dir/2019/11/14/2019111403489.html

서틴스플로어, 가우디오랩과 업무 계약

VR콘텐츠 전문 기업인 서틴스플로어는 VR 오디오 솔루션 기업인 가우디오랩과 업무 계약을 체결하고 5G 기반 프리미엄 가상현실(VR) 콘텐츠 서비스 플랫폼 공동 개발에 나선다고 5일 밝혔다. 서틴스플로어는 2015년 VR 기술기반 스타트업으로 시작하면서 실사 기반의 360도 영상 촬영 솔루션에 자체 드론 솔루션까지 갖춰 독보적인 VR 콘텐츠 제작, 유통사로 평가받고 있다. 가우디오랩은 한국에 R&D 기반을 두고 북미 캘리포니아에 2016년 말 진출하여, 전 세계 VR, AR, 미디어 스트리밍 오디오 솔루션을 공급하며 세계 기술표준을 주도하고 있는 기업이다. 양사는 2019년 5G 상용화 서비스 원년에 맞추어 서틴스플로어의 실사기반 360도 영상 콘텐츠와 함께 가우디오랩의 오디오 솔루션을 결합해 시각 위주의 VR 콘텐츠에서 벗어나 사실적인 오디오 구현을 통해 한층 몰입감 높은 콘텐츠 경험을 제공한다는 계획이다.

이번 계약을 통해 향후 서틴스플로어가 제작하는 VR 콘텐츠와 플랫폼 서비스에 가우디오랩의 오디오 솔루션을 적용해 글로벌 시장에 내놓는다. 사용자가 원하는 방향으로 움직일 때마다 실시간으로 영상과 음원을 일치시켜 완벽한 몰입감을 선사할 방침이다. 또한 엔터테인먼트 콘텐츠 및 서비스 개발에도 나선다. 오프라인 VR 테마파크 및 VR 극장에서 사용할 수 있는 공동 기술을 개발할 예정이다. 향후 스포츠 중계 등에 사용할 수 있는 라이브 솔루션의 원천 기술 개발도 진행함으로써 사용자의 몰입형 시청각 경험을 극대화 할 예정이다.

이상원 기자, 2018-10-05, 전자신문
https://m.etnews.com/20181005000094

"입체 음향으로 청각을 지배하라"…'VR계의 돌비' 꿈꾸는 오현오 가우디오랩 대표

“2014년 1월 MPEG이 3차원 공간의 소리 재현 기술을 표준으로 채택하고 그해 4월 윌러스표준기술연구소에서 관련 프로젝트를 시작한 것이 지금의 가우디오의 출발이다. 윌러스표준기술연구소는 한국특허청이 지원해 국제 표준 기술을 연구하는 한국 연구법인이다. 2015년 5월 정식 법인인 된 가우디오는 2015년 7월 소프트뱅크, 캡스톤이 실행한 TIPS 프로그램으로 11억원 투자를 유치하고 2016년 9월 LB인베스트먼트, 소프트뱅크 등을 통해 50억원을 추가 유치했다. 본사는 한국 서울에 두고 이후 미국 LA에 지사를 만들어 제작사와 제작들을 상대로 시장 공략에 나섰다.”

가우디오가 개발 중인 제품은?
“‘가우디오 웍스’와 ‘가우디오 솔’ 두 가지 소프트웨어가 대표적이다. 가우디오 웍스는 사운드를 녹음하고 믹싱(효과를 더해서 사용자가 원하는대로 소리를 조정하는 작업)한 후 마스터링(소리를 완성한 후 최종적으로 조율해 콘텐츠에 담아내는 것)을 한 다음, 소리가 나는 ‘위치’를 정해주는 소프트웨어다. 가우디오 솔은 VR헤드셋을 쓴 사용자가 시선을 바꾸면 시선에 맞게 소리 위치값을 계산해 입체적인 소리를 들려 주는 소프트웨어다. 사용자의 시선 방향에 따라 소리의 시간 차이, 크기 차이, 벽·바닥·물체에 반사되는 파동, 귓바퀴를 넘어오는 소리의 크기 값을 빠르게 바꿔주는 것이다.”

가우디오 소프트웨어를 무료로 나눠준다고 들었다.
“시장을 선점하는 게 중요하다고 생각했다. VR 콘텐츠를 제작하는 사람들이 가우디오 소프트웨어를 많이 사용할 수록 하드웨어 제작자, 유튜브 등 거대 사업자들이 가우디오 소프트웨어를 필요로 할 것이다. 우리 기술을 쓸 수 밖에 없도록 만들려면 콘텐츠 제작자들이 사용하기 쉽고 효과적인 소프트웨어를 만드는 것이 중요하다. 가볍게, 사용하기 편하게, 음원 손실이 없는 소프트웨어를 만드는 데 집중한 이유다.”

그러면 돈은 어떻게 버나.
“일반 콘텐츠 제작자에게는 무료로 소프트웨어를 나눠주는 대신에 기기 사업자나 플랫폼 사업자, 영화 제작사 등 대형 사업자들은 정교한 VR 사운드 재생을 위해 우리와 유료 계약을 맺도록 할 계획이다. 유튜브나 디즈니, 드림웍스 등 대형사와 계약을 맺는 것이 목표다.”

김범수 기자, 2017-07-31, 조선비즈
https://biz.chosun.com/site/data/html_dir/2017/06/13/2017061302015.html

“앞으로 전 세계 VR 기업은 ‘가우디오’ 오디오 기술을 쓰게 될 것”

"2002년, 국내 대기업 디지털TV 연구소에 입사했다. 당시에는 한·일 월드컵을 전후로 여러 기업에서 디지털TV를 경쟁적으로 선보이던 때였고, 가정집에서는 아직도 ‘배불뚝이(브라운관) TV’가 가득하던 때였다. 오디오를 전공으로 공부한 팀원이 한 명도 없었기에 ‘물 만난 물고기’처럼 일하기 시작했다. 입사한 지 한 달 만에 구현한 3차원 오디오 기술은 바로 TV에 탑재되어 전 세계로 팔려나갔다. 몇 년 후에는 이를 다시 자체 개발한 기술로 대체하여 매년 200억 원씩 해외로 빠져나가던 기술 로열티를 절감하였으며, 이 기술은 지금도 TV에 탑재되어 왕성하게 사용되고 있다. 2005년부터는 국제 표준화 회의에 참석하여 우리 기술을 국제 표준으로 채택시키기도 하였다. 그러나 오디오가 인정받는 선은 거기까지였다. 오디오 기술이 아무리 세계 1등이어도 소비자가 그 이유로 TV를 사는 건 아니었고, 기업의 평가 지표는 매출을 얼마나 끌어올렸느냐에 맞춰져 있었다. 나는 고민 끝에 8년간의 직장 생활을 마무리하고 ‘굿데이 투 인벤트(GOOD DAY to INVENT)‘라는 표준화 전문 기업으로 사업을 시작했다."

"그러던 중 과거에는 도저히 차별화될 수 없었던 오디오 기술이 VR이라는 가상현실 시장이 열리면서 새롭게 주목받기 시작했다. 적당한 오디오 기술로는 현실감을 구현할 수 없는 문제에 봉착한 시점이었다. 그야말로 오디오 기술이 꼭 필요한 때가 다시 온 셈이었다. VR은 경험에 대한 콘텐츠이다. 기존 미디어를 대체하는 완전히 새로운 미디어이다. 소셜 네트워크 서비스의 경우 텍스트에서 이미지 공유로, 이미지에서 동영상 공유로 진화해왔다. 동영상을 공유하면 경험이 조금 더 현실감 있어졌는데, 이제는 경험 그 자체의 단계까지 왔다. 친구가 360도로 촬영한 영상을 HMD를 끼고 보면 내가 정말 그곳에 있는 것 같다는 느낌을 받는 것이다. 영화도 VR의 영역이다. 스크린 너머에 가상현실이 있었는데, VR은 내가 스크린 안으로 들어가 버린다. ‘Being There’의 경험이라고도 하는데, 내가 정말 거기에 있다는 몰입감을 구현하는 데에서 오감 중 청각을 만족시키는 소리가 예전보다 훨씬 중요해졌다. 2014년 3월, 페이스북이 HMD 제작사 오큘러스를 약 2조 원에 샀다는 소식을 듣고 ‘VR 시장이 뜰 것 같은데, 제대로 해보자.’는 생각에 오디오 분야 시장조사를 해보았다. 내가 생각한 대로 ‘빈 땅’이 맞는지 확인하고 싶었다. 그랬더니 관련 시장 현업에 있는 분들은 이 컨텍스트에 대한 이해가 없거나 기초적인 기술 용어조차 몰랐다. 시장에는 아직 인정 못 받던 오디오 기술을 손에 쥐고 있는 몇 안 되는 ‘선수’들만 있었다. ‘이미 보유한 기술로 들어가도 평정될 시장이겠구나.’ 싶어 머릿속 콘셉트를 빨리 프로토타입으로 만들기 시작했다."

"VR에서 소리는 경험의 절반을 차지한다. ‘가우디오(GAUDIO)‘는 VR 콘텐츠를 만드는 데 있어 필요한 오디오 기술로써, MPEG 국제 표준회의에서 표준으로 채택된 기술로부터 출발했다. 기존 음향 스튜디오에서 사용하는 사운드 저작 툴에 가우디오 플러그인(지웍스; G-Works) 하나만 얹으면 VR 사운드가 완성된 VR 콘텐츠를 만들 수 있다. 또한, HMD와 같은 엔드 기기에 가우디오 플레이어(지플레이어; G-Player)를 적용하면 원하는 소리가 포함된 VR 콘텐츠를 경험할 수 있다. 국내에서는 VR에 관심 있는 사실상 거의 모든 회사와 미팅을 하고 협업을 진행하고 있다. 한 예로, 국내 유명 광고 제작사에서 360도 영상 콘텐츠로 만든 소주 광고가 있다. 원래는 기존의 스테레오 오디오 방식으로 제작되었던 작품인데, 우리와 협업을 통해 VR 오디오가 적용된 콘텐츠로 탈바꿈했다. 고개를 돌리거나 움직일 때마다 소리가 영상에 맞추어 같이 움직이므로 사용자 입장에서는 정말 내가 ‘박보영 남자친구’라는 느낌을 받는다."

"영화/방송과 같은 고품질 콘텐츠의 VR 오디오 적용에 관심 있는 전 세계 소수의 전문가가 주로 모이는 커뮤니티가 있다. 여기 올린 데모 영상이 입소문이 나면서 프랑스의 유명 스튜디오에서 VR 콘텐츠 제작 협업 제안이 들어오기도 하고, 북미 소재 스튜디오 몇 곳에서도 지웍스의 베타 테스터를 자처하며 우리 제품이 완성되기를 기다리고 있다. 전 세계적으로도 오디오 기술이 메말라 있기 때문에 당장 무엇을 해보자고 하는 상황이다. 우리는 올해 10월 미국 할리우드에 진출할 계획이다. 그곳에서 VR 사운드 스튜디오와 협업을 진행하고, 칸 영화제에 우리 회사 로고가 뜨는 VR 영화를 출품하는 게 목표이다. 내년 말이 되면 VR 콘텐츠에는 우리 회사 로고를 많이 보게 될 것이다. 그리하여 최종적으로는 ‘VR 오디오 = 가우디오‘라는 등식을 성립하게 하는 게 목표이다. VR을 완성시키는 회사가 되고자 한다."

앱센터 안경은, 2016-07-11, 플래텀
https://platum.kr/archives/62991

가상현실용 오디오 솔루션 전문기업 ‘가우디오랩’, ‘VR·AR 챌린지 2016′ 대상 수상

17일 가상현실용 오디오 솔루션 전문기업 ‘가우디오랩(GAUDIO LAB, inc.)‘이 ‘VR&AR 챌린지 2016’에서 대상에 해당하는 미래창조과학부 장관상의 영예를 안았다. MPEG 국제 표준회의에서 세계적 기업들과의 경쟁을 뚫고 국제표준으로 채택된 오디오 기술을 보유한 가우디오랩 오현오 대표는 시상식에서 대상 수상 소감을 묻는 사회자의 말에 먼저 “음향은 경험의 절반(Sound is half the experience)이라고 생각한다.”는 자신만의 서비스 철학을 밝혔다. 이어 “본격적인 세계 시장 진출에 앞서 받은 이 상을 ‘격려의 상’이라고 받아들이겠다.”고 말하며 감사의 인사를 전했다.

앱센터 안경은, 2016-05-17, 플래텀
https://platum.kr/archives/59755

가우디오랩 솔루션(제품) 소개

Music Streaming / Video Streaming / AR VR and Immersive

Loudness Normalization / Spatial Upmix / Smart EQ / AI Source Separation / ELEQ / Works Plug-In / VR360 Audio / Interactive Binaural

SMART EQ (G’MASTER)
AI 기반의 음원별 자동 음질 보정 기능이 있는 스튜디오급 고음질 EQ(Equalizer)
Gaudio Smart EQ is a versatile, high quality audio equalizer that can be applied in any applications without worrying about the inherent artifacts. Smart EQ never makes unwanted side effects of altering the source’s loudness and/or making annoying clipping distortions.
Gaudio Smart EQ consists of three processing blocks: analysis, equalization, and compensation.
1. It first analyzes an input audio signal and measures loudness per frequency band. It equalizes the audio signal following any user-set EQ curves.
2. It anticipates and compensates the changes in loudness of the equalized audio signal based on the measured loudness per band.
3. During the process, as it understands the dynamic characteristics range of the output audio signal and the clipping problems potentially caused by the equalizer are resolved.
Where to apply?
1. Media Platforms : Immersive sound quality for music, movie, broadcasting, sports live-streaming, and OTT. Video Streaming(OTT), Music Streaming, Live Streaming, Broadcasting e.g) Youtube, Spotify, Twitch, Sinclair
2. Hardware Devices : For built in-audio mode on smartphones, tablets, laptops, TVs, earphones/headphones, speakers.
https://gaudiolab.com/tech-smart-eq/

SPATIAL UPMIX
국제 표준 채택으로 확인된 세계 최고의 입체 음향 기술을 이용한 음악 전용 음장 기술
스페이셜 업믹스는 영화와 드라마를 볼 때는 주인공들과 함께 공간에 있는 듯한 공간감을 느낄 수 있습니다. 음악을 들을 때는 음악에 생동감이 더해지고, 이전에 밴드가 한 점에 뭉쳐서 연주하는 것 같은 답답함을 느꼈다면 이제는 음악이 주변을 에워싸는 몰입감 있는 경험을 제공합니다.
Gaudio Lab Spatial Upmix 가우디오랩 스페이셜 업믹스는 기존과 다르게 신호를 분석하여 3차원 공간에 재구성(Blind Upmixer)합니다. 재구성된 신호를 국제표준채택된 가우디오랩의 바이노럴 렌더링 기술로 헤드폰에서도 공간감있는 소리를 재현합니다.
Where to apply?
1. 미디어 플랫폼 : 음악, 영화, 방송, 스포츠 라이브 스트리밍, OTT를 위한 몰입형 음질. 비디오 스트리밍(OTT), 음악 스트리밍, 라이브 스트리밍, 방송 예) Youtube, Spotify, Twitch, Sinclair
2. 하드웨어 디바이스 : 스마트폰, 태블릿, 노트북, TV, 이어폰/헤드폰, 스피커에 내장된 오디오 모드용.
3. 라이브 스트리밍 플랫폼 : 실시간 생중계 및 스마트 기기, 자동차 오디오 등 서버가 없는 하드웨어용.
4. 헤드폰&스피커 : 스테레오 스피커를 탑재한 최신 스마트폰과 스피커 재생의 일관된 사운드 경험.
https://gaudiolab.com/ko/tech-spatial-upmix/

LOUDNESS NORMALIZATION
70/80년대 올드팝과 최신 KPOP을 하나의 플레이리스트에 담아도 일관된 음량
OTT/뮤직 스트리밍을 위해 준비된 완벽한 음량 제어 솔루션
콘텐츠 간의 음량 편차는 줄이고 균형 잡힌 플랫폼 청취 환경을 제공하세요.
라우드니스 문제란? 시청자는 라우드니스의 차이로 발생되는 채널과 채널, 프로그램과 광고 사이의 큰 볼륨을 원하지 않습니다. 라우드니스란 인간 청각의 지각 정도에 의해 느끼는 소리의 크기를 뜻합니다. 라우드니스 편차가 발생하는 이유는, 나라별로 음량 평준화에 대한 규제가 있는 TV 방송과는 달리, OTT, 음원서비스는 정해진 규정이 없기 때문에 플랫폼마다 제각각 입니다. TV용으로 제작된 콘텐츠를 모바일에도 그대로 재전송하기 때문에 목표 음량 자체가 스마트폰 사용환경에 맞지 않습니다. 1인 창작자 콘텐츠의 경우 음량제어를 위한 전문적인 오디오 툴을 사용하기 힘듭니다. 광고주는 더 큰 소리로 제품의 이목을 끌고 홍보하길 원합니다.
가우디오랩의 솔루션은 모든 콘텐츠간의 음량을 정규화하여 청력손실을 유발할 수 있는 갑작스러운 소음으로 부터 청취자의 청력을 보호할 수 있습니다. 모바일로 플랫폼을 이용하는 청취자의 ‘안전한 청취’를 조력하며, 콘텐츠가 재생될 때 발생하는 불만족스러운 라우드니스의 편차를 없애줍니다.
1. Loudness Server-Tools
서버에서 모든 콘텐츠 대한 사전 일치된 라우드니스를 전송하는 솔루션.
2. Loudness Server-Client
“서버-클라이언트 아키텍처“를 통해 서버가 라우드니스를 측정한 메타데이터를 생성하고,클라이언트의 플랫폼이 이 메타데이터를 이용해 콘텐츠의 타겟 라우드니스에 맞게 라우드니스를 정규화 하는 솔루션.
3. Loudness Stand-alone
메타데이터가 적용될 수 없는 라이브 스트리밍, 라이브 방송, 및 하드웨어 장치를 위한 라우드니스 솔루션.
Where to apply?
1. 미디어 플랫폼 : 음악, 영화, 방송, 스포츠 라이브 스트리밍, OTT를 위한 몰입형 음질. 비디오 스트리밍(OTT), 음악 스트리밍, 라이브 스트리밍, 방송 예) Youtube, Spotify, Twitch, Sinclair
2. 하드웨어 디바이스 : 스마트폰, 태블릿, 노트북, TV, 이어폰/헤드폰, 스피커에 내장된 오디오 모드용.
https://gaudiolab.com/ko/tech-loudness-normalization/

ELEQ
원본에 담긴 풍부한 저음과 섬세한 고음을 조용한 음량으로 감상할 수 있게 하는 혁신적인 기술
가우디오랩의 ELEQ(Equal-Loudness-based dynamic Equalizer)는 심리음향 원리를 이용하여 재생 음량에 관계 없이 항상 원음의 주파수 밸런스와 공간감을 재현합니다.
리스너는 왜 큰 소리를 선호 하나요? 사람의 귀는 주파수에 따라 들을 수 있는 음량이 다릅니다. 이를 등청감 곡선(Equal-loudness contour)이라고 하며, 깊은 저음과 선명한 고음은 매우 큰 음량일때 비로소 우리가 인지할 수 있습니다. 때문에 음악을 제대로 감상하고자 하는 리스너들은 콘서트와 같은 큰 볼륨을 선호합니다.
가우디오의 ELEQ는 리스너가 낮은 볼륨에서도 깊은 저음과 하이햇을 포함한 자세하고 선명한 사운드를 감상할 수 있게 구현합니다. 따라서 귀사의 플랫폼 유저는 볼륨을 높이지 않고, 청력손상을 방지하며 안전하게 콘텐츠를 즐길 수 있습니다. 가우디오랩의 ELEQ필터는 입력 신호의 음량을 분석하여 반영하고, 고해상도 디지털 EQ로 Equal-loudness contour를 재현하여 왜곡없이 매우 자연스러운 상태로 고음질을 재현할 수 있습니다.
Where to apply?
1. 미디어 플랫폼 : 음악, 영화, 방송, 스포츠 라이브 스트리밍, OTT를 위한 몰입형 음질. 비디오 스트리밍(OTT), 음악 스트리밍, 라이브 스트리밍, 방송 예) Youtube, Spotify, Twitch, Sinclair
2. 하드웨어 디바이스 : 실시간 생중계 및 스마트 기기, 자동차 오디오 등 서버가 없는 하드웨어용.
https://gaudiolab.com/ko/tech-eleq/

AI Source Separation
파일에서 목소리와 배경음을 AI 기술로 분리 할 수 있습니다. 보컬을 제거하여 MR을 만들거나 원치않는 잡음을 제거하는데 활용해보세요.
음원 분리란, 여러 음원이 섞여있는 오디오 신호로부터 개별 음원을 추출하는 것을 말합니다. 영화 속 다양한 소리들 사이에서 배우의 목소리 만을 추출하거나, 연주곡에서 한 악기의 소리만을 추출하는 것, 라이브 공연의 MR 제거 영상 등이 모두 음원 분리의 사례가 됩니다.
가우디오랩의 음원 분리 기술은 무엇이 다른가요?
1. 높은 분리도
가우디오랩의 음원 분리 기술 GSEP(Gaudio source SEParation)은 세계 최고 수준의 높은 분리도를 보입니다. 학계에서는 분리도에 대한 성능으로 SDR (Signal-to-Distortion Ratio)를 사용하는데, 음성 분리의 경우에 있어, Sony, Facebook, Deezer 등의 기술 대비 뛰어난 성능을 보입니다.
2. 저연산
GSEP은 다양한 어플리케이션에서 사용될 수 있도록 저연산 구조를 가지고 있습니다. 일반적인 GPU 서버 환경 (Intel Xeon Gold 5120, NVDIA V100)에서 아래 그림과 같은 Processing Time을 가집니다. 무거운 GPU 서버 환경은 물론, iPhone이나 Android Phone에서도 사용할 수 있는 가벼운 구조로 다양한 어플리케이션에 쉽게 통합됩니다.
3. 고음질
GSEP은 스트리밍 시장의 음악과 영화에 최적화되어 보다 높은 음질을 제공합니다. Music Streaming 서비스의 부가 기능으로 Voice Reduction 기능을 사용하는 노래방 반주 생성 시나리오와, OTT Streaming 서비스의 부가 기능인 음성 강조 시나리오 모두에서 압도적인 음질을 제공하고 있습니다.
Where to apply?
1. Text Sync : Time-sync 작업, 직접하지 마세요. ‘음악 가사‘나 ‘영화 자막’의 텍스트와 음성을 자동으로 맞춰줍니다.
2. 음성인식 성능향상 : 잡음이 많은 음성데이터도 전처리 한 번이면 깨끗하게! 인식률이 얼마나 향상되는지 확인해보세요.
3. Clear Voice : 주변 소음을 제거하고 음성만 강화하여 영상통화의 사용자 경험을 향상시키고, 영화 속 대사도 더 잘 들을 수 있습니다.
4. Karaoke : 노래방 기능 참 쉽죠? 음악에서 보컬을 제거하여 MR로 만들어드립니다. #모바일 #실시간
https://gaudiolab.com/ko/source-separation/
‘음원 분리’는 여러 음원이 섞인 오디오 신호에서 개별 음원을 추출하는 과정을 말합니다. 영화에서 배우의 목소리만을 추출하거나 음악에서 특정 악기의 소리만을 추출하는 거죠. 메타버스에서 궁극의 리얼리즘을 표현하기 위해서는 깨끗한 음원을 추출할 필요가 있거든요. 마치 그 공간에 실제로 가 있는 듯한 환경, 즉 ‘빙 데어(being there: 마치 내가 그곳에 가 있는 듯한 착각)’와 ‘빙 히어(being here: 원격의 상대방이 마치 여기 와 있는 듯한 착각)’를 구현하는 게 중요합니다. 특히 사용자끼리 현실감 있는 커뮤니케이션을 하도록 만들기 위해서는 상대방의 주변 환경 소음을 지워주는 작업이 필요한데요. 예를 들어 제페토 월드에 접속한 사람들끼리 대화하는 상황을 생각해봅시다. 참여자 중 한 명의 음성에 엄마가 청소기를 돌리는 소리까지 함께 빨려 들어갈 수 있잖아요. 이렇게 되면 청소기 소리만 들릴 뿐 상대방이 무슨 말을 하는지 못 알아듣는 상황이 발생합니다. 이런 측면에서 GSEP 기술은 메타버스 시대 오디오 AI의 핵심이라고 할 수 있어요.
https://magazine.hankyung.com/money/article/202112209988c
GSEP의 파생 기술 중 ‘AI 기반 가사 동기화 솔루션’이라고 불리는 ‘GTS(Gaudio Text Sync)’도 있다고 들었는데요. "오디오 AI 기술을 활용해 가사와 음원을 자동으로 동기화해주는 기술이라고 생각하면 됩니다. 2021년 4월에 국내 음원 스트리밍 플랫폼인 ‘벅스’의 ‘실시간 가사보기 서비스’에 적용돼 상용화에 성공했죠. 그동안은 ‘타임 코더’라 불리는 인력이 직접 투입돼 곡마다 일일이 가사와 음원의 시점을 맞춰야 했어요. 국내는 물론이고 전 세계적으로도 이 서비스를 상용화한 업체를 찾아보기 어렵습니다. 현재 GTS는 일반적 환경에서 5초에 1곡씩 싱크를 맞출 수 있는데요. 음원 스트리밍 서비스의 실시간 가사보기 서비스에 탑재됐고, 영화 등 영상 콘텐츠 자막 생성, 어학 학습 활용, 노래방 기능 등에 활용되고 있습니다."
https://magazine.hankyung.com/money/article/202112209988c

WORKS PLUGIN
직관적이고 시각적인 UI를 갖춘 DAW(Digital Audio Workstation)용 공간 오디오 플러그인으로 VR, 360, 3D 몰입형 공간 오디오 컨텐츠를 생성하고 마스터링 할 수 있습니다.
Works(웍스)는 3D 오디오 편집 및 믹싱 기능을 제공하며 다양한 3D 오디오 형식(유튜브, 페이스북, 가우디오)을 통해 모니터가 가능합니다. 제작된 오디오는 가우디오의 독자 포맷인 GA5 포맷으로 저장이 되고, 장면 기반 오디오와 객체 기반 오디오, 채널기반 오디오를 모두 지원합니다. WORKS의 혁신적이고 직관적인 기능으로 VR 어워즈 2017에서 올해의 Innovation Company 상을 수상.
https://gaudiolab.com/ko/tech-works-plugin/

VR360 AUDIO
당신의 OTT 플랫폼에 VR 서비스를 장착할 때 반드시 고려해야하는 오디오 솔루션
가우디오랩의 VR360 Audio 기술은 OTT, 미디어 스트리밍 플랫폼의 서버와 클라이언트에 각각 장착되는 VR Audio Packager 와 VR Audio (Client) SDK로 구성되어 있습니다.
01. VR 서비스의 사용자 호환성을 극대화 하는 포맷.
VR Audio Packager는 다양한 형태의 입력 오디오 신호에 대해 스트리밍에 적합한 오디오 포맷 및 패킷으로 변환하는 역할을 수행합니다. 이때 전송 포맷은 기존 대부분의 미디어 스트리밍 Eco-system에서 호환 가능한 AAC 5.1 채널 형식으로 구현가능합니다. 이는 Immersive Audio가 지원되는 VR 서비스의 사용자 호환성을 극대화합니다. 이 포맷을 GA3라고 부릅니다.
02. 스테레오 사운드 트랙이여도 걱정마세요.
만일 VR 오디오 포맷으로 제작되지 않은 일반 스테레오로 사운드트랙을 제작한 콘텐츠를 보유한 경우라도 걱정하지 마세요. 가우디오랩만의 Interactive Binaural 기술을 쓰면 해결할 수 있습니다.
03. 어떤 디바이스로 시청을 해도 생생한 Immersive Audio!
VR Audio Client SDK는 HMD, 스마트폰, 스마트TV 등 사용자 단말에 장착되어 VR을 위한 입체음향을 실현하는 실시간 렌더링 소프트웨어입니다. 단말로부터 사용자의 시점 (Head Orientation)을 입력받아 영상정보에 정합된 실감나는 Immersive Audio를 생성합니다. 그림으로 보는 것과 같이 일반 헤드폰은 물론 사운드바나 AV Receiver, 심지어 스마트폰이나 TV에 장착된 Built-in 스피커를 통해서도 일관된 소리 경험을 제공할 수 있습니다.
Where to apply?
1. VR360를 도입하는 OTT서비스
2. 라이브 음악 공연 중심의 VR 360°, 180° 영상 서비스
3. 앱 형태의 프리미엄 VR 콘텐츠 배포
4. HMD 단말 제조사
5. Audio-only VR 플랫폼
https://gaudiolab.com/ko/tech-vr-360-audio/

INTERACTIVE BINAURAL
VR 영상의 시점이 바뀌어도 반응하지 않는 정지된 오디오가 몰입을 방해하나요? 가우디오랩의 Interactive Binaural 기술이 해결해드립니다.
VR 영상 제작시 바이노럴 레코딩으로 사운드트랙을 제작하면, 특정 위치에서의 현장감은 극대화될 수 있지만, Head Orientation에 따라 사용자의 시점이 변경되면 음상과 불일치하는 문제로 몰입감을 심각하게 저해합니다. 그렇다고, 음원을 모두 새로 제작하는건 이미 불가능한 상황이 됩니다.
가우디오랩의 독자적인 실시간 Interactive 변환기술은 Static이던 원본을 감쪽같이 반응형 바이노럴 음원으로 변경합니다. Client-side에만 장착하면 되는 SDK이기 때문에 서비스에 적용하는 과정도 아주 간편합니다.
Where to apply?
1. Binaural Recording으로 제작된 360° 영상을 보유한 동영상 플랫폼
2. 일반 스테레오로 제작된 360° 영상을 보유한 동영상 플랫폼
3. HMD 하드웨어용 오디오 솔루션
4. 그 외 일반 스테레오 음원에 대해 Interactivity를 제공해야하는 시나리오
https://gaudiolab.com/ko/tech-interactive-binaural/

https://gaudiolab.com/ko/

가우디오랩 | Audio for VR, AR and Media Streaming

가우디오랩은 혁신적인 오디오 기술로 가상/증강현실, 미디어 스트리밍을 비롯한 우리 주변에 소리가 필요한 다양한 곳에서 훌륭한 소리 경험을 제공합니다.

gaudiolab.com

추가 링크

https://thevc.kr/gaudiolab

가우디오랩(라우드니스 SDK) - 4건의 투자 정보 - THE VC

*삼성벤처투자 투자 포트폴리오 지난해 삼성벤처투자는 국내에서는 의식주컴퍼니, 에이치엠씨네트웍스, 눔, 몰로코, 가우디오랩 등 기업에 투자했다. 국내뿐 아니라 해외 스타트업 투자 활동도

thevc.kr

http://www.fortunekorea.co.kr/news/articleView.html?idxno=20592

메타버스, 오디오 기술이 승패 가른다 - 포춘코리아(FORTUNE KOREA)

[포춘코리아(FORTUNE KOREA)=홍승해 기자] 가상현실의 메타버스 세계에서 저 멀리서 사람이 걸어오는 소리, 마치 콘서트 현장에 온 것 같은 생동감 넘치는 음향기술을 구현해내는 데 성공한 신생기

www.fortunekorea.co.kr

https://www.hankyung.com/economy/article/2021090786581

"원근감 살린 사운드로 메타버스를 현실처럼"

"원근감 살린 사운드로 메타버스를 현실처럼", 라이징 AI스타트업 (17) 가우디오랩 다양한 소리, 각각 다른 크기로 헤드셋만으로 '공간 음향' 제공

www.hankyung.com

저작자표시 비영리 변경금지

'스타트업 > 스타트업 탐구' 카테고리의 다른 글

실크로드소프트, DB 동기화 CDC \| 쫌아는기자들 신년 픽 (9) (0)	2022.03.27
리브스메드, 복강경 수술기구 \| 쫌아는기자들 신년 픽 (8) (0)	2022.03.26
씨엔테크, 동산 담보 관리 IoT \| 쫌아는기자들 신년 픽 (6) (0)	2022.03.26
리벨리온, AI 반도체 팹리스 \| 쫌아는기자들 신년 픽 (5) (0)	2022.02.02
올거나이즈, 인지 검색 기반 AI 챗봇 \| 쫌아는기자들 신년 픽 (4) (0)	2022.01.18

현재글가우디오랩, 메타버스 AI 오디오 | 쫌아는기자들 신년 픽 (7)

무지의 공부 일기