목록분류 전체보기 (27)
R을 사랑한 느림보 데이터 분석가

기술 블로그 읽어보고 키워드도 적어보고 기술적인 글과 친해지기 TIL #240107 다국어 서비스 개발자가 마주친 7가지 어려움 📌프론트 키워드 i18next 자바스크립트 프레임워크 복수형, 단수형 표기 -> plurals 수량사 표기 -> interpolation 어순 -> interpolation 한국어 조사 표기 -> i18next-korean-postposition-processor 플러그인 문장 길이로 UI가 깨지는 경우 -> tooltip + ellipsis 동적 스타일 처리 -> Trans 컴포넌트 이미지 번역 -> 문구 미포함 초보 개발자도 오픈소스에 기여할 수 있다 - Notion Avatar Maker 한국어 버전 개발기 📌프론트 키워드 Notion Avatar Maker README ..

안녕하세요, 이번에 소개해드릴 라이브러리는 재현 데이터 생성에 자주 활용되는 py-synthpop(또는 synthpop)입니다. 1. 재현 데이터(Synthetic Data) 생성 - 개념 2. 재현 데이터(Synthetic Data) 생성 - 라이브러리 3. 재현 데이터(Synthetic Data) 생성 - 생성 기법 지난 포스팅 재현 데이터 개념과 SDV 라이브러리 글을 참고하면 도움이 됩니다. SDV 라이브러리와 마찬가지로 정형 데이터를 가지고 재현하는 것으로 synthpop 소개 및 실습 예제를 보여드리겠습니다. py-synthpop py-synthpop는 R에 있는 패키지(라이브러리) synthpop을 파이썬에서 구현한 라이브러리이다. 재현 데이터 생성에서 꾸준히 활용되고 성능이 좋다고 알려진 ..

안녕하세요, 이번 포스팅에서는 재현 데이터를 생성하는데 사용할 라이브러리를 알려드리려고 합니다. 1. 재현 데이터(Synthetic Data) 생성 - 개념 2. 재현 데이터(Synthetic Data) 생성 - 라이브러리 3. 재현 데이터(Synthetic Data) 생성 - 생성 기법 혹시나 재현 데이터가 무엇인지 궁금하신 분은 지난 포스팅글을 읽어보면 좋습니다. 간단하게 설명하자면, 재현 데이터는 실제 데이터를 참고하여 비슷한 구조를 가진 임의 데이터를 생성하는 것입니다. 알고리즘을 이용하여 실제 데이터를 학습하고 임의 데이터를 도출하는 과정이라고 생각하면 됩니다. 재현 데이터 생성 과정 재현 데이터는 실제 데이터를 가져와 모델 학습을 통해 생성한다. 아래 그림은 재현 데이터 생성 과정을 도식화한 ..
기술 블로그 읽어보고 키워드도 적어보고 기술적인 글과 친해지기 TIL #231214 MLOps 란? 💬키워드 Flask API 데이터 드리프트 데이터 버전 관리, 학습모델 파일 관리 ML모델 배포, 실험 기록 DevOPs 방법론 AWS(Sagemaker)/GCP(VertexAI)/Azure(Azure machine learning studio)/kubeflow(k8s) 버저닝: 여러 버전(version)으로 작성하는 것. 버전 관리 아티팩트(artifact) Text Generation Inference(TGI)를 활용한 프로덕션 레벨 LLM 추론 가속화 💬키워드 Tensor Parallelism, MegaTron-LM 양자화(Quantization): 실수형 변수를 정수형 변수로 변환하는 것 오버헤드(..

안녕하세요. 이번 포스팅은 재현 데이터에 대한 시리즈를 준비했습니다. 글이 3개 이상이 될지 모르지만 개념, 라이브러리, 생성 기법에 대한 내용을 정리하려 합니다. 1. 재현 데이터(Synthetic Data) 생성 - 개념 2. 재현 데이터(Synthetic Data) 생성 - 라이브러리 3. 재현 데이터(Synthetic Data) 생성 - 생성 기법 재현 데이터를 사용하는 데이터 범위는 정형 데이터를 중심으로 기술했습니다. 재현 데이터 정의 재현 데이터(Synthetic Data)는 실제로 측정된 데이터(Real Data)가 아닌 인위적으로 새롭게 생성한 데이터 "합성 데이터라는 건 뭘까?" Synthetic라는 영어 뜻이 '합성한, 인조의'라는 의미를 가지고 있어, 번역을 거쳐 합성 데이터 또는 ..
가장 인기 있는 머신러닝 알고리즘이며, 실무에서 주로 쓰는 알고리즘입니다. 알고리즘을 소개할 때 분류하는 방식이 2가지 있습니다. 학습 스타일에 따른 알고리즘 분류 형태나 기능 유사성에 따른 알고리즘 분류 학습 스타일에 따른 알고리즘 분류는 서적, 강의에서 많이 보는 분류입니다. 지도 학습, 비지도 학습, 반지도 학습, 강화학습 형태나 기능 유사성에 따른 알고리즘 분류는 통계, 기술적인 지식이 있는 사람이라면 이해하기 쉬운 방식입니다. 모든 알고리즘이 딱 들어맞게 분류되는 것은 아니며 가장 적합하다고 생각하는 방식으로 분류되었습니다. 분류 및 회귀에 사용되는 머신러닝 알고리즘 위주로 작성되었습니다. ※ 원문이 영어인 점으로 용어에 어색함이 있을 수 있습니다. ※ 모든 내용을 번역한 것이 아닌 일부만 발췌..