You can edit almost every page by Creating an account. Otherwise, see the FAQ.

합성 데이터(중소기업 기술로드맵)

EverybodyWiki Bios & Wiki

스크립트 오류: "Unsubst" 모듈이 없습니다. package.lua 80번째 줄에서 Lua 오류: module 'Module:Namespace detect/data' not found. 실제 측정으로 획득하지 않고 필요에 의해 인공적으로 생성한 학습 데이터이며 현실 제약으로 인해 실제 데이터를 직접 활용하기 어렵거나 데이터의 수집 비용이 높은 경우에 효과적이다

개요[편집]

정의 및 필요성[편집]

  • (정의) 직접 획득한 데이터가 아닌, 인공적으로 데이터를 합성하는 기술
  • (필요성) 데이터 보안 이슈

범위 및 분류[편집]

가치사슬[편집]

  • 합성 데이터 기술은 현실 제약 상황에서 데이터의 효과적 활용을 위한 기반 기술로서, 다양한 산업 분야에 대해 광범위한 용도로 활용될 수 있음

합성 데이터(Synthetic Data) 분야 산업구조[편집]

분류 주요내용
후방산업 데이터 수집/저장/관리, 시뮬레이션, 가상 검증, 머신러닝/딥러닝 기술, 머신러닝/딥러닝 개발 플랫폼
합성 데이터 데이터 비식별화 기술, 데이터 증대 기술, 데이터 도메인 변환 기술, 합성 데이터 식별 기술
전방산업 제조, 금융/보험, 의료, 보안, 정보/인터넷, 유통 등

용도별 분류[편집]

  • 합성 데이터 기술은 데이터의 활용이 요구되는 다양한 산업 분야에서 효과적으로 활용될 수 있음
분류 상세내용(예시)
제조분야 상대적으로 발생 빈도가 낮은 불량 케이스에 대한 합성 데이터 생성을 통한 효과적인 불량 분석 및 탐지 모델링 수행
금융/보험 분야 고객 데이터의 외부 반출 및 활용 시, 개인식별이 불가능하도록 민감한 개인정보를 비식별화한 합성 데이터를 활용
의료분야 실제 사례 데이터 확보가 어려운 영역에 대해서, 기존 사례 데이터의 도메인 변환을 통한 시뮬레이션
보안분야 개인정보 식별 방지 및 데이터 위/변조에 기반한 사기행위의 탐지
인터넷분야 이미지 보정, 음성/합성 등 사용자 맞춤형 서비스 개발
미디어분야 연출이나 재현이 어려운 장면을 인위적으로 생성 및 보정

전략 제품 관련 동향[편집]

시장 현황 및 전망[편집]

  • (세계) 2018년 약 77억 2,700만 달러 규모에서 연평균 22.5%로 성장하여 2024년 261억 1,000만 달러 규모로 성장 전망
  • (국내) 2018년 약 1,629억 원 규모에서 연평균 9.4%로 성장하여 2024년 5,752억 원 규모로 성장 전망

제품 산업 특징[편집]

  • 데이터에 개인을 식별할 수 있는 민감한 정보가 담긴 경우, 데이터 보안 및 프라이버시 이슈는 데이터 활용의 활성화를 저해하며, 이를 극복하기 위한 데이터 비식별화 기술 개발 노력이 이어져 오면서 합성 데이터 기술이 관심을 받는 중

정책 동향[편집]

  • 정부는 경제-사회 전반의 혁신 프로젝트로서 과학기술 정보통신부를 비롯한 전 부처가 참여해서 마련한 ‘인공지능(AI) 국가전략’을 발표(‘19.12.17.)
  • 인공지능(AI) 분야 ‘포괄적 최소(네거티브) 규제’ 단계별 계획 수립(‘20)

기술 동향[편집]

  • 데이터 보안 및 프라이버시 보호를 위한 기술개발
  • 인공지능 제품/서비스의 성능 개선을 위한 기술 개발
  • 합성 데이터의 왜곡 및 편향성 극복을 위한 기술 개발
  • 데이터 도메인 변환 기술 개발
  • 합성 데이터의 악용 방지를 위한 기술 개발발

핵심 플레이어[편집]

  • (해외) Google, Twitter, Amazon, Microsoft, Neuromation, Facebook, Laan Labs, Manheim
  • (국내) Naver, SK C&C, NC, LG, FASOO, Desilo, 셀바스, 머니브레인

핵심요소기술[편집]

특허 분석을 통한, 요소기술, 기술수요와 각정 문헌을 기반으로 한 요소기술, 전문가 추천 요소기술을 종합하여 요소기술을 도출한 후, 핵심기술 선정위원회 평가과정 밑 검토/보완을 거쳐 핵심기술 확정

합성 데이터(Synthetic data)분야 핵심기술
핵심기술 개요
이미지 데이터 합성 기술* 기존 이미지 데이터의 특성을 고려하여 새로운 이미지 데이터를 가상으로 합성하는 기술
머신러닝 학습 데이터 증대기술 머신러닝 모델 성능 개선을 목적으로. 모델 학습과정에서 활용될 수 있는 추가 학습 데이터를 합성하는 기술
합성 데이터 탐지 기술 실제 데이터와 합성 데이터를 구별하는 기술
데이터 비식별화 기술 원본 데이터의 활용을 저해하지 않으면서 민감한 정보의 식별이 불가능하도록 하는 합성 데이터 생성
시계열 데이터 합성 기술 기존 시계열 데이터의 특성을 고려하여 새로운 시계열 데이터를 가상으로 합성하는 기술

*표시는 생태계 취약 기술을 의미

중소기업 기술개발 전략[편집]

  • 여러 산업의 다양한 도메인에 대해서, 각 도메인의 데이터 특성을 고려하여 특화된 합성 데이터 생성 기술 개발
  • 실제 제품 및 서비스와 연계한 맞춤형 합성 데이터 생성 기술 개발
  • 데이터 보안 및 프라이버시 보호, 데이터 악용 방지를 위한 데이터 비식별화 및 합성 데이터 탐지 기술 개발

생태계 강화방안[편집]

  • 합성 데이터기술은 아직 초기단계로 국가적 기술경쟁력 확보를 위한 스타트업 및 중소기업에 대한 지원 필요
  • 기술의 확산을 촉진하기 위해서는 합성 데이터 기술의 플랫폼화 및 활용 실증 연구 사업 및 정부 정책 지원 필요
  • 합성 데이터의 악용 및 사회적 문제에 대해 어떻게 대응할지 국가적인 관점에서의 해결책 논의 필요

외부 링크[편집]

  • package.lua 80번째 줄에서 Lua 오류: module 'Module:URL' not found.


분류:중소기업 기술로드맵


This article "합성 데이터(중소기업 기술로드맵)" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:합성 데이터(중소기업 기술로드맵). Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.



Read or create/edit this page in another language[편집]