목록Synthetic (4)
R을 사랑한 느림보 데이터 분석가

안녕하세요. 재현 데이터 생성에 대한 마지막 글이 될 포스팅이 되겠습니다. 재현 데이터를 생성하는데 필요한 통계와 ML 지식에 대한 주제를 생성 기법이라는 것으로 소개하려고 합니다. 1. 재현 데이터(Synthetic Data) 생성 - 개념 2. 재현 데이터(Synthetic Data) 생성 - 라이브러리 3. 재현 데이터(Synthetic Data) 생성 - 생성 기법 재현 데이터를 생성하기 위해선 단순 복제, 집단 기준 평균 등 가볍게 재현 자료를 생성할 수 있으며, 통계나 알고리즘 구현만 가능하다면 생성할 수 있는 방법은 많이 있다. 그중에서도 과거 포스팅에서도 자주 언급했었던 CART, GAN과 검증하기 위해 사용했던 KS통계량, MSE에 대한 설명이다. CART(Classification An..

안녕하세요, 이번에 소개해드릴 라이브러리는 재현 데이터 생성에 자주 활용되는 py-synthpop(또는 synthpop)입니다. 1. 재현 데이터(Synthetic Data) 생성 - 개념 2. 재현 데이터(Synthetic Data) 생성 - 라이브러리 3. 재현 데이터(Synthetic Data) 생성 - 생성 기법 지난 포스팅 재현 데이터 개념과 SDV 라이브러리 글을 참고하면 도움이 됩니다. SDV 라이브러리와 마찬가지로 정형 데이터를 가지고 재현하는 것으로 synthpop 소개 및 실습 예제를 보여드리겠습니다. py-synthpop py-synthpop는 R에 있는 패키지(라이브러리) synthpop을 파이썬에서 구현한 라이브러리이다. 재현 데이터 생성에서 꾸준히 활용되고 성능이 좋다고 알려진 ..

안녕하세요, 이번 포스팅에서는 재현 데이터를 생성하는데 사용할 라이브러리를 알려드리려고 합니다. 1. 재현 데이터(Synthetic Data) 생성 - 개념 2. 재현 데이터(Synthetic Data) 생성 - 라이브러리 3. 재현 데이터(Synthetic Data) 생성 - 생성 기법 혹시나 재현 데이터가 무엇인지 궁금하신 분은 지난 포스팅글을 읽어보면 좋습니다. 간단하게 설명하자면, 재현 데이터는 실제 데이터를 참고하여 비슷한 구조를 가진 임의 데이터를 생성하는 것입니다. 알고리즘을 이용하여 실제 데이터를 학습하고 임의 데이터를 도출하는 과정이라고 생각하면 됩니다. 재현 데이터 생성 과정 재현 데이터는 실제 데이터를 가져와 모델 학습을 통해 생성한다. 아래 그림은 재현 데이터 생성 과정을 도식화한 ..

안녕하세요. 이번 포스팅은 재현 데이터에 대한 시리즈를 준비했습니다. 글이 3개 이상이 될지 모르지만 개념, 라이브러리, 생성 기법에 대한 내용을 정리하려 합니다. 1. 재현 데이터(Synthetic Data) 생성 - 개념 2. 재현 데이터(Synthetic Data) 생성 - 라이브러리 3. 재현 데이터(Synthetic Data) 생성 - 생성 기법 재현 데이터를 사용하는 데이터 범위는 정형 데이터를 중심으로 기술했습니다. 재현 데이터 정의 재현 데이터(Synthetic Data)는 실제로 측정된 데이터(Real Data)가 아닌 인위적으로 새롭게 생성한 데이터 "합성 데이터라는 건 뭘까?" Synthetic라는 영어 뜻이 '합성한, 인조의'라는 의미를 가지고 있어, 번역을 거쳐 합성 데이터 또는 ..