헤드라인
[ KT, AI원팀 2차 기술성과 공개… 4종의 인공지능 기술로 로봇 혁신 ]
요약 :
AI원팀은 지난 20년 2월 출범 이후 40여명의 국내 AI 전문가 그룹인 'AI 구루(Guru) 그룹'을 구성해 현안 해결 프로세스 '라운드 테이블' 에서 기업의 난제 해결을 논의해왔다.
그 결과 지난해 무빙 픽처, E2E 딥러닝 음성합성, AI기반 로봇 고장 진단 기술, 딥러닝 음성합성(P-TTS) 를 성과물로 내놓았다. AI 원 팀은 14일, 4종의 2차 기술 성과를 밝혔다. 4종의 기술은 로봇 실내 공간지능 기술, 로봇 소셜 인터랙션(Social Interaction) 기술, 보이스 클로닝(Voice Cloning) 기술, 한국어 E2E 음성인식 트랜스퍼 러닝(Transfer learning) 기술이 이에 해당한다.
1. 로봇 실내 공간지능 기술 (KT, KAIST 명현 교수 연구진)
로봇이 실내 공간의 사물을 식별하고 사물의 위치를 기억토록 해 3D 지도를 생성하고 실시간 업데이트를 할 수 있게 해준다.
2. 로봇 소셜 인터랙션 기술 (KT, KAIST 윤성의 교수 연구진)
로봇이 사용자의 얼굴 및 행동을 인식한 뒤 수행할 행동을 추천한다.
3. 보이스 클로닝 기술 (KT, KAIST 김회린 교수 연구진)
개인화 음성합성을 위한 목소리 복원 알고리즘으로, 개인의 오디오 샘플을 딥러닝으로 학습해 커스텀 보이스를 제공하는 개인화 TTS 서비스의 핵심 기술이다.
연구진은 지난해 비용은 1/4 수준으로 줄이고, 속도는 10배 가량 향상 시키는 CPU 기반 음성합성 알고리즘 개발에 성공한 바 있다. ( 추가 조사 참고 )
이번 연구에서는 커스텀 보이스 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축한 것이다.
4. 한국어 E2E 음성인식 트랜스퍼 러닝 기술 (KT, 한양대 장준혁 교수)
KT에 따르면 학습에 필요한 데이터는 줄이고 세계 최고 수준의 음성인식 성능을 갖췄다고 한다.
기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율이 13.7% 감소해 세계 최고 수준의 음성인식 성능을 검증한 것이다. 또한 모델을 처음부터 다시 학습하는 것이 아닌 기존 모델을 재사용하는 방식으로 소량의 도메인 데이터를 활용한 음성인식 개선이 가능해졌다.
본문
본문 링크
전미준 기자 (2022, 04, 14). KT, AI원팀 2차 기술성과 공개… 4종의 인공지능 기술로 로봇 혁신. <인공지능신문>. URL: http://www.aitimes.kr/news/articleView.html?idxno=24794
본문의 근거
- KT 자료를 바탕으로 추가 조사가 필요할 것 같다.
추가 조사 내용
- AI원팀이란?
20년 2월 출범한 AI 산.학.연. 협력체, 대한민국 AI 역량 강화를 위한 인재양성 플랫폼 조성, 실제 산업현장에서의 AI 성공 사례를 발굴하고 확산시키기 위한 산업간 협업 강화, 중소 벤쳐기업들이 참여할 수 있는 AI 오픈 생태계 조성 등 추진하고 있다. 현재 한양대를 비롯해 KAIST, ETRI, 현대중공업그룹, LG전자, 한국투자증권, KT, 동원, 우리은행, 한진 가 협업하고 있다.
출처 한양위키 및 KT 홈페이지 : https://hyu.wiki/AI_%EC%9B%90%ED%8C%80, https://corp.kt.com/html/promote/aioneteam/aioneteam.html
- 1차 기술성과 관련 기사
김정현 기자 (2021, 01, 07). AI원팀, 첫 성과 내놨다…음성합성·무빙픽처·AI로봇 고장진단 등 4종. <news 1뉴스>. URL: https://www.news1.kr/articles/?4173426
1. 딥러닝 음성합성(P-TTS, Personalized-Text To Speech)기술 ( KT, 김회린 카이스트 교수 연구진)
기존 대비 비용을 4분의 1 수준으로 줄이고, 속도는 10배 가량 향상시켰다.
순서대로 음성을 만드는 방식에서 동시에 음성을 만들어내는 방식으로 구조를 변경해 속도향상시킨 것이다.
2. E2E(End-to-End) 음성인식 트랜스퍼 러닝(Transfer learning) 기술 ( KT, 장준혁 한양대 교수 연구진 )
인식 정확도를 크게 높일 수 있고, 적은 양의 학습 데이터로 도메인 확장이 가능하다.
사양 증강(Spec Augmentation), 데이터 증강(Data Augmentation) 등 최신 학습기술을 적용해 기존 하이브리드 방식에 비해 단어 오류율(WER)을 7% 이상 향상시켰다.
3. 무빙 픽처(Moving Picture) 솔루션 ( KT, 한양대 김태현 교수 연구진 )
영상 분할, 객체 검출, 모션 추정, 초해상도 이미지 복원(인페인팅)과 같은 최신 AI 기술을 적용됐다.
무빙 픽처 솔루션에 적용된 핵심 기술은 이미 국내에서 2건의 특허를 확보했으며, 국제학술지 'IEEE Access' 등재를 위한 심사도 진행 중이다.
4. AI 기반 로봇 고장 진단 기술 ( 현대 중공업 그룹, 한양대 장준혁 교수 연구진 )
AI가 산업용 로봇의 고장을 진단할 수 있는 기술로, 진동 신호에 음성처리 기술과 딥러닝 기술을 적용해 핵심 구동부품인 감속기의 이상을 탐지할 수 있다. 운전 조건에 관계 없이 적용 가능하고, 정상상태와 고장상태의 데이터 불균형을 해결해 진단의 정확도를 높였다.
현직자에게 물어볼 점
- 라운드 테이블이 어떠한 협상 프로세스를 의미하는건지.
- 30여개의 아이디어가 테이블을 거쳐갔다는데 활용되지 않은 아이디어는 어떻게 쓰이는건지
- 기술 성과로 내지 않았으나 기술 성과를 가져올 것으로 기대되는 기술에는 어떠한 것들이 있는지
'신문 스크랩' 카테고리의 다른 글
[신문스크랩] 머신러닝 기술을 활용한 신용평가 모형 (0) | 2022.05.02 |
---|---|
[신문스크랩] 데이터 과학자는 어떠한 경험적인 영역에 집중해야 하는가 (0) | 2022.04.30 |
[신문스크랩] 기존 증권사의 디지털 트렌스포메이션 (DT) (0) | 2022.04.28 |
[신문 스크랩] 운전습관을 분석해 차량사고 막는 AI (0) | 2022.04.27 |
[신문 스크랩] 일상 생활 속의 AI, 12가지 사례 (0) | 2022.04.27 |