합성 데이터(중소기업 기술로드맵)
EverybodyWiki Bios & Wiki
스크립트 오류: "Unsubst" 모듈이 없습니다. package.lua 80번째 줄에서 Lua 오류: module 'Module:Namespace detect/data' not found. 실제 측정으로 획득하지 않고 필요에 의해 인공적으로 생성한 학습 데이터이며 현실 제약으로 인해 실제 데이터를 직접 활용하기 어렵거나 데이터의 수집 비용이 높은 경우에 효과적이다
개요[편집]
정의 및 필요성[편집]
- (정의) 직접 획득한 데이터가 아닌, 인공적으로 데이터를 합성하는 기술
- (필요성) 데이터 보안 이슈
범위 및 분류[편집]
가치사슬[편집]
- 합성 데이터 기술은 현실 제약 상황에서 데이터의 효과적 활용을 위한 기반 기술로서, 다양한 산업 분야에 대해 광범위한 용도로 활용될 수 있음
합성 데이터(Synthetic Data) 분야 산업구조[편집]
분류 | 주요내용 |
---|---|
후방산업 | 데이터 수집/저장/관리, 시뮬레이션, 가상 검증, 머신러닝/딥러닝 기술, 머신러닝/딥러닝 개발 플랫폼 |
합성 데이터 | 데이터 비식별화 기술, 데이터 증대 기술, 데이터 도메인 변환 기술, 합성 데이터 식별 기술 |
전방산업 | 제조, 금융/보험, 의료, 보안, 정보/인터넷, 유통 등 |
용도별 분류[편집]
- 합성 데이터 기술은 데이터의 활용이 요구되는 다양한 산업 분야에서 효과적으로 활용될 수 있음
분류 | 상세내용(예시) |
---|---|
제조분야 | 상대적으로 발생 빈도가 낮은 불량 케이스에 대한 합성 데이터 생성을 통한 효과적인 불량 분석 및 탐지 모델링 수행 |
금융/보험 분야 | 고객 데이터의 외부 반출 및 활용 시, 개인식별이 불가능하도록 민감한 개인정보를 비식별화한 합성 데이터를 활용 |
의료분야 | 실제 사례 데이터 확보가 어려운 영역에 대해서, 기존 사례 데이터의 도메인 변환을 통한 시뮬레이션 |
보안분야 | 개인정보 식별 방지 및 데이터 위/변조에 기반한 사기행위의 탐지 |
인터넷분야 | 이미지 보정, 음성/합성 등 사용자 맞춤형 서비스 개발 |
미디어분야 | 연출이나 재현이 어려운 장면을 인위적으로 생성 및 보정 |
전략 제품 관련 동향[편집]
시장 현황 및 전망[편집]
- (세계) 2018년 약 77억 2,700만 달러 규모에서 연평균 22.5%로 성장하여 2024년 261억 1,000만 달러 규모로 성장 전망
- (국내) 2018년 약 1,629억 원 규모에서 연평균 9.4%로 성장하여 2024년 5,752억 원 규모로 성장 전망
제품 산업 특징[편집]
- 데이터에 개인을 식별할 수 있는 민감한 정보가 담긴 경우, 데이터 보안 및 프라이버시 이슈는 데이터 활용의 활성화를 저해하며, 이를 극복하기 위한 데이터 비식별화 기술 개발 노력이 이어져 오면서 합성 데이터 기술이 관심을 받는 중
정책 동향[편집]
- 정부는 경제-사회 전반의 혁신 프로젝트로서 과학기술 정보통신부를 비롯한 전 부처가 참여해서 마련한 ‘인공지능(AI) 국가전략’을 발표(‘19.12.17.)
- 인공지능(AI) 분야 ‘포괄적 최소(네거티브) 규제’ 단계별 계획 수립(‘20)
기술 동향[편집]
- 데이터 보안 및 프라이버시 보호를 위한 기술개발
- 인공지능 제품/서비스의 성능 개선을 위한 기술 개발
- 합성 데이터의 왜곡 및 편향성 극복을 위한 기술 개발
- 데이터 도메인 변환 기술 개발
- 합성 데이터의 악용 방지를 위한 기술 개발발
핵심 플레이어[편집]
- (해외) Google, Twitter, Amazon, Microsoft, Neuromation, Facebook, Laan Labs, Manheim
- (국내) Naver, SK C&C, NC, LG, FASOO, Desilo, 셀바스, 머니브레인
핵심요소기술[편집]
특허 분석을 통한, 요소기술, 기술수요와 각정 문헌을 기반으로 한 요소기술, 전문가 추천 요소기술을 종합하여 요소기술을 도출한 후, 핵심기술 선정위원회 평가과정 밑 검토/보완을 거쳐 핵심기술 확정
핵심기술 | 개요 |
---|---|
이미지 데이터 합성 기술* | 기존 이미지 데이터의 특성을 고려하여 새로운 이미지 데이터를 가상으로 합성하는 기술 |
머신러닝 학습 데이터 증대기술 | 머신러닝 모델 성능 개선을 목적으로. 모델 학습과정에서 활용될 수 있는 추가 학습 데이터를 합성하는 기술 |
합성 데이터 탐지 기술 | 실제 데이터와 합성 데이터를 구별하는 기술 |
데이터 비식별화 기술 | 원본 데이터의 활용을 저해하지 않으면서 민감한 정보의 식별이 불가능하도록 하는 합성 데이터 생성 |
시계열 데이터 합성 기술 | 기존 시계열 데이터의 특성을 고려하여 새로운 시계열 데이터를 가상으로 합성하는 기술 |
*표시는 생태계 취약 기술을 의미
중소기업 기술개발 전략[편집]
- 여러 산업의 다양한 도메인에 대해서, 각 도메인의 데이터 특성을 고려하여 특화된 합성 데이터 생성 기술 개발
- 실제 제품 및 서비스와 연계한 맞춤형 합성 데이터 생성 기술 개발
- 데이터 보안 및 프라이버시 보호, 데이터 악용 방지를 위한 데이터 비식별화 및 합성 데이터 탐지 기술 개발
생태계 강화방안[편집]
- 합성 데이터기술은 아직 초기단계로 국가적 기술경쟁력 확보를 위한 스타트업 및 중소기업에 대한 지원 필요
- 기술의 확산을 촉진하기 위해서는 합성 데이터 기술의 플랫폼화 및 활용 실증 연구 사업 및 정부 정책 지원 필요
- 합성 데이터의 악용 및 사회적 문제에 대해 어떻게 대응할지 국가적인 관점에서의 해결책 논의 필요
외부 링크[편집]
- package.lua 80번째 줄에서 Lua 오류: module 'Module:URL' not found.
This article "합성 데이터(중소기업 기술로드맵)" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:합성 데이터(중소기업 기술로드맵). Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.