보조 적용 영역 — 로봇 Fleet 운영
동일한 핵심 기술(Primitives)은 로봇 Fleet 운영에도 그대로 적용됩니다. 제1 목표인 제조 AI 데이터 시스템 구축 외에도, 다음 영역에 즉시 투입 가능합니다: 이기종(휴머노이드 / AMR / 협동로봇) Fleet의 통합 텔레메트리 파이프라인 · 모터 및 관절 예지보전 (RUL 회귀) · 운영 중 모션 이상 탐지 (Autoencoder / GMM). (의존: P1 + P2 + P3)
비동기·파편화된 산업 현장 데이터를 운영 가능한 시계열 데이터와 AI 학습 데이터로 정규화합니다.1년 5개월간 700+ 차량 규모의 산업 차량 Fleet 텔레메트리 파이프라인을 운영하며 CAN ISO-TP 재조립, 4팩 BMS 비동기 정렬, InfluxDB 기반 landing/replay 구조를 다뤘습니다.별도로 LLM 제품 untamedai.me를 1인 풀스택으로 기획·개발·배포·운영하며 세션·메모리·안전·비용·결제까지 제품 운영 루프를 직접 책임졌습니다.
많은 제조 AI 프로젝트에서 모델보다 오래 걸리는 부분은 현장 데이터를 안정적으로 수집·정렬·정규화·재처리하는 파이프라인입니다.현장 데이터는 비동기·파편·벤더별 스키마로 들어옵니다. 이를 운영 대시보드와 학습 데이터 양쪽에서 재사용 가능한 형태로 바꾸는 일이 제 핵심 경험입니다.
각 패턴은 실제 경험, 구현 포인트, 전이 대상이 분리되어야 신뢰도가 생깁니다.
산업 차량 Fleet 텔레메트리 파이프라인 (700+ 차량)현대 산업 차량 Fleet(700+ 차량)을 위한 4-Tier 분산 텔레메트리 시스템 구축 프로젝트에 팀 일원으로 참여하여 핵심 데이터 처리 모듈을 담당했습니다.
[차량 단말] → Webhook → Bridge InfluxDB → V2InfluxConverterProcess (multi-process) → Measurement InfluxDB → Celery batch → Avro/GCS
Bridge InfluxDB는 message broker의 완전한 대체재가 아니라, raw hex payload를 보존하고 장애 후 재처리를 가능하게 하는 time-series landing / replay layer로 운영했습니다. 이후 Converter가 이를 measurement InfluxDB로 정규화했습니다. 부하 테스트는 합성 이기종 텔레메트리 기준 7k events/sec에서 parser crash 없이 bounded memory와 replay path를 검증하는 방식으로 수행했습니다.
| 산업 차량 Fleet | 로봇 제조 / 제조업 |
|---|---|
| 차량당 4팩 BMS 비동기 신호 | 로봇당 30+ 관절 + F/T + 비전 / 라인당 N대 머신 |
| CAN ISO-TP 멀티프레임 | ROS2 chunked / OPC-UA chunked |
| 차종별 .dbc / Excel DSL | 로봇 모델별 URDF / PLC 벤더별 protocol |
LLM 기반 대화형 AI 제품 untamedai.meuntamedai.me — 기획부터 시스템 설계 · 개발 · 배포까지 1인 풀스택으로 전담하며 LLM 프로덕트 구축 역량을 쌓았습니다.
만들고 싶은 것 — 로봇 제조 + 기존 제조업의 AI 워크플로우.산업 데이터 인프라 구축 및 LLM 서비스 운영 경험을 바탕으로, 로봇 제조를 위한 파운데이션 모델 데이터 시스템과 기존 제조업의 AI 워크플로우 고도화에 기여하고자 합니다.
원격 조작(Teleoperation) 데모 데이터로부터 RLDS · Parquet · MCAP 학습 포맷을 자동 생성합니다 — Open X-Embodiment 등 공개 데이터셋이 채택한 표준. 다중 소스(vision · proprio · action · language)의 시간 동기화부터 품질 필터링, 세그멘테이션, 데이터 증강까지의 파이프라인을 구축합니다. 학습 데이터의 품질이 곧 파운데이션 모델의 성능 한계를 결정하므로, 이를 극대화할 수 있는 견고한 데이터 인프라가 필수적입니다. (의존: P1 + P2 + P3)목표 영역 · target area
시뮬레이터 출력 vs 실제 로봇 텔레메트리의 시간·단위·분포 정합. Domain randomization의 파라미터 분포를 실측에서 자동 sourcing. Reality gap 메트릭 대시보드. sim-to-real의 실패는 거의 항상 데이터 정렬 문제에서 기인합니다. (의존: P2)목표 영역 · target area
Vision-Language-Action triplet 시간 정확 동기, failure / success의 mining 비율 관리, long-horizon task 자동 segmentation. 언어 instruction의 의미 단위 분할과 LLM 운영의 비용·안전·반복 개선 사이클은 untamedai.me에서 매일 다루었던 핵심 영역입니다. (의존: P2 + P3 + LLM 제품 운영)부분 전이 · partially transferred
로봇 한 대가 라인을 통과할 때 station 별 측정값 + 출하 후 field 텔레메트리의 인과 매칭. end-of-line QC 결과 → field failure를 추적 가능한 시스템으로 구축합니다. (의존: P2 + P3)설계됨 · designed, not built
반도체, 제철, 배터리 셀, 디스플레이 라인의 멀티-벤더 PLC 및 OPC-UA, MTConnect 통합 텔레메트리 파이프라인입니다. 실시간 프로덕션 운영 환경과 AI 모델 학습 데이터를 동일한 데이터 인프라(Substrate) 위에서 일관되게 처리합니다. (의존: P1 + P2 + P3)
머신 텔레메트리 시계열 → 끝단 검사 결과 사전 예측. Gradient Boosting 베이스라인 → Temporal Fusion Transformer / Patch-TST. 모델 구조 자체보다 공정 사이클(Cycle) 정의에 따른 정교한 시간 축 동기화가 실질적인 기술 난제임에 주목합니다. (의존: P2)
운영팀이 자연어로 묻는 인터페이스 — 어제 02시 라인 3 알람의 원인 분석 같은 질의에 답하는, machine logs · SOP · 이력 데이터 위의 RAG. 기획부터 배포까지의 전 과정을 1인 풀스택으로 리드한 경험(§5 untamedai.me)이 이식될 수 있습니다. (의존: P3 + LLM 제품 운영)
라인 어느 머신이 불량의 원인인가 — SHAP 기반 기여도 분해, drift monitoring, 학습 분포 가드를 구축합니다. (의존: P2 + P3)
동일한 핵심 기술(Primitives)은 로봇 Fleet 운영에도 그대로 적용됩니다. 제1 목표인 제조 AI 데이터 시스템 구축 외에도, 다음 영역에 즉시 투입 가능합니다: 이기종(휴머노이드 / AMR / 협동로봇) Fleet의 통합 텔레메트리 파이프라인 · 모터 및 관절 예지보전 (RUL 회귀) · 운영 중 모션 이상 탐지 (Autoencoder / GMM). (의존: P1 + P2 + P3)
동일한 데이터 substrate에서 나오는 AI 적용 영역을 3개 묶음으로 압축했습니다. 핵심은 많은 키워드가 아니라, 각 워크로드가 어떤 검증 경험에 의존하는지 명확히 보이는 것입니다.
| 묶음 | 대표 워크로드 | 전이되는 실무 경험 |
|---|---|---|
| Foundation Model Data | teleop demo 정렬 · VLA triplet curation · sim-to-real telemetry | P1/P2/P3: 재조립, 동기화, canonical event |
| Manufacturing Intelligence | cycle-level 품질 예측 · anomaly localization · drift monitoring | P2/P3: 시간축 feature build, schema versioning, quality flag |
| LLM Workflow | RAG over logs/SOP · instruction quality eval · operator assistant | untamedai.me: memory/session/safety/cost 운영 루프 |
어떻게 일하는가 — Process 시그널. 결과만큼이나 일하는 방식이 중요하다는 것을, untamedai.me 1인 운영과 산업 데이터 시스템 팀 작업 양쪽에서 깊이 익혔습니다. 실무에 임하며 다음 세 가지 작업 자세를 견지합니다.
각 행의 왼쪽은 실제 운영 경험, 오른쪽은 동일한 문제 구조에 적용 가능한 전이 대상입니다. 프로덕션 코드는 NDA에 따라 비공개입니다.
| Ingestion / Bus | Production: Django · Flask webhook · MQTT / Transfer: ROS2 · DDS · Kafka · OPC-UA · MQTT |
|---|---|
| Time-series store | Production: InfluxDB / Transfer: TimescaleDB · ClickHouse · MCAP |
| Metadata DB | Production: MySQL MHA / Transfer: PostgreSQL · schema registry |
| Batch / Task | Production: Celery + django-celery-beat / Transfer: Celery · Airflow · Dagster · Ray |
| Processing | Production: single-node multiprocessing converter / Transfer: Ray · Dask when distributed scale is required |
| Replay / Dataset | Production: raw hex landing · Avro / Transfer: MCAP · Parquet · RLDS |
| Storage | Production: GCS / Transfer: S3 · Azure Blob |
| LLM product stack | Production: Next.js · FastAPI · Supabase/PostgreSQL · Cloudflare · Claude/GPT · Polar(결제 flow 구축·검증 완료, 거래 미발생) / Transfer: manufacturing RAG · operator assistant |
2026.05 기준 인터뷰 중 · Currently interviewingWoon · Aspiring Manufacturing AI Data Systems Engineer.산업 차량 Fleet 텔레메트리 파이프라인 팀 멤버 → LLM 기반 제품 (untamedai.me) 1인 운영까지, RAW telemetry를 프로덕션 수준의 제품 데이터로 바꾸는 시스템을 구축했습니다.