P-03 — 비정형 데이터 태깅·라벨링¶
표준 정보¶
| 항목 | 내용 |
|---|---|
| 표준번호 | TTAK.KO-10.1343-Part2 |
| 표준명 | 데이터 가공 공정 직무 구성 - 제2부 비정형 데이터 태깅 및 라벨링 |
| 소관 | TTA · PG606 |
| 연계 | NIA AI Hub (600종 AI 학습 데이터셋) |
| 상태 | 9월 착수 예정 |
핵심 차별점¶
- PyTorch DataLoader 한 줄 로딩 — Croissant 1.0 호환
- 라벨 품질 자동 검증 — SHACL + 통계적 일관성 검사 결합
- DUO 어휘 사용 제약 — 의료·민감 데이터의 사용 가능 범위를 기계화
일정¶
WBS C-7 (수행계획서 2.3절). 정식 착수: 2026년 9월.