헤드라인
[ [AI 신뢰성] AIIA, 민간 주도의 AI 신뢰성 인증 제시 ]
요약 :
AI 는 완전한 기술이 아니다. 만약 AI가 오작동을 일으킨다면 심각한 사회적 문제로 이어질 수 있다.전세계 주요국에서는 AI의 신뢰성 확보를 위한 정책을 앞다투어 내놓고 있다.우리나라의 경우, 과학기술정보통신부는 지난해 5월 '신뢰할 수 있는 AI 실현전략'을 발표했다.
AI의 신뢰성을 확보한다는 것은 학습용 데이터의 신뢰성을 확보해야한다는 것을 의미한다.
학습용 데이터의 신뢰성이란 데이터에 누락되거나 잘못된 값이 없고, 충분한 양을 갖추고 있어야 한다는 것을 의미한다. 또한 학습용 데이터의 편향성을 점검하고, 다양한 데이터를 학습할 수 있도록 해야한다.
다만, 이루다에서의 예시처럼, AI가 사회적 물의를 일으키지 않게 하기 위해서는 착한 말만 하도록 편향되게 학습할 필요도 있을 수 있다.
박지환 씽크 포비엘 대표의 말을 한번 봐보자. 아래는 기사에 소개된 대표의 말을 내 식대로 다시 요약 정리한 내용이다.
" 약 5만장의 사진 데이터를 보유하고 있다는 기관에 찾아가보니 사실은 5만장 처럼 보이는 260장에 불과했다. 데이터의 다양성을 표현할 기준 자체가 없는 기업이 많다. 데이터를 모을 때는 양이나 정확성 만큼이나 다양성과 밸런스를 갖추는 것도 중요하다. 더 똑똑한 AI를 만들고 지능 정보 사회를 만들기 위해서는 더 번거롭더라도 모으는 단계부터 제대로 쓰이기 위한 조건을 생각해야한다."
기업이 가장 접근성이 좋고, 유용하게 접근할 수 있는 데이터에는 공공데이터가 있다.
공공데이터의 가장 큰 장점 중 하나는 축적된 방대한 양인데, 문제는 과거의 데이터들에 대해서는 신뢰성을 장담할 수 없다는 점이 있다. 동일한 항목에 대해서도 부처별로 수치가 다르고, 통계 연보로 모아놓은 것을 확인해도 해당 데이터의 근거가 무엇인지, 어떻게 집계된 수치인지 확인할 수가 없다. 한 관계자는 "2006년도에 국가 재정법이 나오면서 그나마 정리가 된 것이지, 그 전의 데이터는 믿을 수 없다" 라고 한다.
데이터 댐에도 정부의 지원을 받아 민간기업들이 모아온 데이터들이 다량으로 들어가 있지만, 그 과정에서 기준 없이 제각기 가져온 데이터들이 덤핑되어 있기 때문에 활용이 어렵다는 말이 있다. 데이터를 가져가려는 기업은 방대한 데이터 풀 한가운데서 각 데이터들의 신뢰성을 검증해가며 옥석을 가려내야한다.
데이터 댐은 무작정 비용을 지불해 데이터를 사다가 쌓아놓기 전에, 어떤 데이터를 가져다가 어떤 형태로 쌓아놓겠다는 가이드라인을 먼저 세웠어야 했다. AI 신뢰성 측면에서 현재 국내 데이터 생태계 신뢰성 수준은 기대치에 못 미치는게 사실이다.
최근 민간에서도 AI 신뢰성 확보를 위한 체계를 마련하기 위한 노력이 이어지고 있다. 지난 3월, 지능 정보 산업 협회 (AIIA) 는 민간 주도의 AI 신뢰성 인증 (Trustworthy AI)을 내놓았다. EU 에서 고안한 '고위험 AI 시스템 요구사항'을 기반으로 AI 기반 제품 서비스의 신뢰성을 평가하는 제도이다. AI 기술이 적용된 디바이스, SW, 서비스 등 AI와 관련된 모든 시스템을 포함한다. AI 성능과 결과물의 정확성은 물론, 해당 AI를 개발한 기업이 AI 워크플로우 전 과정에서 적절한 관리체계를 갖추고 있는지를 점검한다.
민간기업들을 주축으로 AI 산업계와 실제 현장을 고려한 AI 신뢰성 요구 수준을 선제적으로 만들 수 있게 됐기 때문에 업계 관계자들은 긍정적인 반응을 내놓고 있다.
AIIA 정책 사업부에 따르면, AI 신뢰성 인증은 인증을 획득하는 과정에서 협회가 적절한 지원과 컨설팅을 제공해 서비스의 완성도를 높이고 부작용을 미연에 방지하기 위해 마련된 것이라 한다.
AIIA는 현장에서 실제 AI 제품의 신뢰성 확보 과정을 지원하면서, 시행착오를 거치는 바텀업 방식으로 AI 신뢰성 인증체계를 완성해나갈 계획이라고 한다.
본문
본문 링크
김성수 기자 (2022, 5, 13). [AI 신뢰성①] AIIA, 민간 주도의 AI 신뢰성 인증 제시. <IT DAILY>. URL: http://www.itdaily.kr/news/articleView.html?idxno=207822
김성수 기자 (2022, 5, 16). [AI 신뢰성②] AIIA, 민간 주도의 AI 신뢰성 인증 제시. <IT DAILY>. URL: http://www.itdaily.kr/news/articleView.html?idxno=207824
본문의 근거
- AI가 사회적 물의를 일으킨 사례
이루다는 정식 출시 이후 성소수자와 장애인에 대한 혐오 발언, 남녀 차별적인 표현, 20대 여성으로 설정된 이루다에 대한 성희롱 등 수많은 물의를 일으켰다. 여기에 학습에 사용한 데이터를 제대로 정제하지 않아 개인정보 유출 문제까지 발생하면서 비난의 목소리는 더욱 높아졌다. 이에 스캐터랩은 아직 이루다의 수준이 부족하다는 것을 인정하고 서비스를 잠정 중단했다.
- 데이터 댐, 데이터 덤핑 문제
가령 사진을 통해 특정 지역의 식생을 파악하기 위해서는 그 주변의 모든 환경들을 다양하게 촬영한 데이터가 있어야 한다. 식물은 물론이거니와 주변의 날씨 변화나 토양 조건, 수원, 동물 등 식생에 영향을 미칠 수 있는 요소들에 대한 정보들이 갖춰져야 한다. 가능하다면 다른 날씨와 토양에서 자라는 식물에 대한 정보까지 갖춰져야 비로소 원하는 지역에 대한 식생 파악과 분석이 가능하다. 하지만 데이터 댐에 있는 데이터들은 어디에서 찍었는지도 알 수 없는 식물 사진만 덩그러니 있는 셈이다. 이런 사진들은 아무리 많아도 주변 환경이 해당 식생이 만들어지는 데에 어떤 영향을 미쳤는지 알 수 없으니 유용한 인사이트를 얻을 수가 없다.
- 정부가, 정부가 만든 AI 인증 획득을 강제함으로써 기술 개발에 제동을 거는 것은 아닌가?
과기정통부 역시 이러한 우려를 인식하고 있는지 ‘신뢰할 수 있는 AI 실현전략’에서 “AI 신뢰성 인증 단계에서는 민간 자율 인증과 공시를 추진한다”고 밝힌 바 있다.
추가 조사 내용
출처 url : https://eiec.kdi.re.kr/policy/materialView.do?num=213860
- 이번 전략은 “누구나 신뢰할 수 있는 인공지능, 모두가 누릴 수 있는 인공지능 구현”을 비전으로 하여, 기술·제도·윤리 측면의 3대 전략과 10대 실행과제를 통해 ‘25년까지 단계적으로 추진 계획
- 민간의 인공지능 서비스 구현을 체계적으로 지원하고, 이용자가 믿고 안전하게 사용할 수 있도록 제도를 보완하며, 사회 전반에 건전한 인공지능 윤리를 확산하는 것을 중점 방향으로 함.
- 신뢰 가능한 인공지능 구현 환경 조성을 위해 ▲인공지능 제품·서비스 구현단계별 신뢰 확보 체계를 마련하고, ▲민간의 인공지능 신뢰성 확보를 지원하며, ▲인공지능 신뢰성 원천기술을 개발을 추진함.
- 안전한 인공지능 활용을 위한 기반 마련을 위해 ▲인공지능 학습용 데이터의 신뢰성을 제고하고, ▲고위험 인공지능에 대한 신뢰 확보를 추진하며, ▲인공지능 영향평가를 실시, ▲인공지능 신뢰 강화를 위한 제도를 개선할 계획임.
- 또한, 사회 전반 건전한 인공지능 의식 확산을 위해 ▲인공지능 윤리 교육을 강화하고, ▲인공지능 윤리기준에 대한 구체적인 행위지침으로, 연구·개발자, 이용자 등이 윤리 준수 여부를 자율적으로 점검 할 수 있는 체크리스트 개발하여 보급하며, ▲윤리 정책 플랫폼을 운영할 계획임.
- 아울러, 과학기술정보통신부는 기업·연구자 등이 인공지능 제품·서비스 개발 과정에서 혼란을 겪거나 이로 인해 국민이 피해 보지 않도록 인공지능 신뢰 확보 기준을 명확화하고, 기술적·재정적으로 부족한 중소기업 등이 신뢰성 기준을 준수하는 데 어려움이 없도록 지원 방안을 마련하는 등 사람이 중심이 되는 인공지능 강국 실현을 위해 동 전략을 차질 없이 추진해나갈 계획이라 밝힘.
현직자에게 물어볼 점
- 정부가 발표한 '신뢰할 수 있는 인공지능 실현전략'이 산업에 가져올 영향이 얼마나될 것으로 보는지.
- 데이터 덤핑 문제에 대해 각 기업은 어떻게 대처하고 있는지.
'신문 스크랩' 카테고리의 다른 글
[신문스크랩] 선택이 아닌 필수, 데이터 복원 (0) | 2022.05.19 |
---|---|
[신문 스크랩] 카카오, 프라이버시 보호 원칙 (0) | 2022.05.15 |
[신문스크랩] CUBOX, 금융사에 AI 얼굴인식 솔루션 제공 (0) | 2022.05.11 |
[신문스크랩] 카카오브레인, '스무스-스왑' (0) | 2022.05.09 |
[신문스크랩] 마이데이터 사업 그리고 플랫폼 경쟁 (0) | 2022.05.07 |