개요 › 01. 학습 기술군
LAM · Learning
01. 학습 기술군
LAM의 L. AI 직원이 “일할수록 똑똑해지는” 능력을 만드는 기술군이다. 다루는 기술 set: TS-L1·L2·L3·L4.
1기술군 종합 설명 (왜 이 기술이 회사의 핵심인가)
1.1 한 문장
학습 기술군은 사람이 모든 절차를 짜주지 않아도, AI 직원이 대화·관찰·실제 실행에서 일하는 방법을 스스로 익혀 누적하게 만드는 기술이다.
1.2 무슨 문제를 푸는가
대부분의 AI는 출고 시점의 지능에 고정된다. 학습하려면 별도 모델 재학습(fine-tuning)이 필요하고, 이는 느리고 비싸며 운영 중 일어나지 않는다. 그 결과 “한 달 전에 알려준 회사 방식을 다음 달에도 모른다.”
AI 직원은 반대여야 한다 — 운영하는 동안 계속 똑똑해져야 한다. 사용자의 방식, 회사의 예외 처리, 매니저의 수정 습관을 흡수해 다음 업무에 즉시 반영해야 한다. 사업적으로는 “일할수록 똑똑해지는 AI” 약속의 본체다.
1.3 핵심 아이디어 — 학습 플라이휠
우리 학습은 단발 모델 학습이 아니라 운영 중 도는 플라이휠이다. 4개 기술 set이 하나의 순환을 이룬다.
flowchart TB C1["C1 대화"]:::sig --> L1 C2["C2 사람실행 관찰"]:::sig --> L1 C3["C3 자기실행"]:::sig --> L1 L1["TS-L1
3채널 관찰 학습
(신호 통합)"]:::step --> L2["TS-L2
절차지식 자동 추출
(Skill 후보)"]:::step L2 --> L3["TS-L3
승인형 거버넌스
(사람 승인 → 활성)"]:::step L3 --> USE["더 잘 실행
(활성 Skill 재사용)"]:::good USE -. 반복 실패·수정 반영 .-> L4["TS-L4
실패·교정 패턴 학습"]:::step L4 --> L3 USE -. 새 신호 .-> L1 classDef sig fill:#ecfeff,color:#0e7490,stroke:#06b6d4,rx:8,ry:8; classDef step fill:#eef2ff,color:#1a2233,stroke:#4f46e5,rx:8,ry:8; classDef good fill:#ecfdf5,color:#065f46,stroke:#10b981,rx:8,ry:8;
플라이휠이 한 바퀴 돌 때마다 AI 직원은 그 회사에서만 더 유능해진다.
1.4 왜 이기는가 (투자 관점)
| 차별 | 의미 |
|---|---|
| 정적 학습(경쟁사) → 운영 중 자가 개선 | 시간이 갈수록 정확도↑·처리시간↓ |
| 모델 재학습 의존 → 모델과 무관한 절차 학습 | 모델을 바꿔도 학습 자산 유지 |
| 누적 절차의 테넌트 격리 | 고객별 노하우가 복리로 쌓여 이탈 방지(lock-in) |
학습 자산은 고객 안에 쌓인다. 경쟁사가 모델을 따라잡아도 고객사별로 축적된 절차·교정 지식은 복제되지 않는다.
2기술 Set 상세
TS-L1
3채널 관찰 학습
★★★기술 개요대화(C1)·사람 업무 수행 관찰(C2)·AI 자기실행(C3) 세 신호를 하나의 학습 입력 체계로 통합한다.
종래 방식의 한계학습이 정적 코퍼스·사람 라벨에 의존하고, 사람이 일하는 모습·대화 맥락은 버려진다.
핵심 기술 구성① 채널·실행기 이벤트 캡처 ② 신호 정규화·시간 정렬 ③ 통합 타임라인 ④ 학습 가치 판별기.
동작·데이터 흐름대화/행동/실행 이벤트 → 정규화 → 통합 타임라인 → 학습 후보 큐(→ TS-L2).
차별성·기술 난이도텍스트 대화·UI 행동 이벤트·실행 trace라는 이종 신호의 의미 정렬·융합이 난제.
성숙도·입증 지표학습 후보 생성률, 채널 신호 커버리지, 노이즈 비율.
기술 리스크·의존성C2 관찰은 협업표면(05)의 Mirror 구조에 의존. 관찰 데이터의 프라이버시·동의 관리 필요.
TS-L2
절차지식 자동 추출·증류
★★★기술 개요통합 신호에서 반복 가능한 절차(Skill)를 자동 도출·일반화한다. (“환불 처리: 고객확인→정책조회→승인→처리”)
종래 방식의 한계기존 메모리는 사실만 저장하고 절차는 학습하지 않으며, 전통 RPA는 고정 스크립트라 변화에 깨진다.
핵심 기술 구성① 행동 패턴 마이너 ② 절차 그래프 생성기 ③ 일반화·증류기 ④ 파라미터화.
동작·데이터 흐름반복 trace → 공통 시퀀스 추출 → 절차 템플릿 → 후보 Skill(→ TS-L3).
차별성·기술 난이도일회성·우연 행위와 재사용 절차를 판별하고, 변이를 허용하는 일반화가 핵심 난제.
성숙도·입증 지표추출 정확도, 일반화 성공률, 절차 재현율.
기술 리스크·의존성잘못된 절차 추출 위험 → TS-L3 승인 게이트로 방어. 기억(02) 절차기억과 연동.
TS-L3
승인형 학습 거버넌스
★★★기술 개요자동 발견 절차를 사람 승인 큐 → 신뢰도 누적 승격 → 미사용 시 아카이브로 관리하는 Skill 라이프사이클.
종래 방식의 한계자동학습은 환각·잘못된 자동화를 그대로 누적할 위험이 있어, 통제 없이는 엔터프라이즈 투입 불가.
핵심 기술 구성① 후보 큐 ② 승인 워크플로우(승인/수정/거절) ③ 신뢰도 스코어러 ④ 활성/아카이브 수명관리.
동작·데이터 흐름후보 → 검토 → 활성화 → 사용 추적 → 신뢰 상승(또는 미사용 아카이브).
차별성·기술 난이도“검증 가능한 학습” — 학습성과 안전성을 동시에 달성하는 폐루프.
성숙도·입증 지표승인율, 승인 후 성공률, 롤백율, 평균 검토 시간.
기술 리스크·의존성승인 병목 가능성 → 신뢰도 기반 자동 가중으로 경감. 감사(06)와 연동.
TS-L4
실패·교정 패턴 학습
★★기술 개요반복되는 실패와 사람의 반복 수정에서 제약·예외 규칙을 자동 보강한다. (“100만원 이상 환불은 매니저 승인 필수”)
종래 방식의 한계같은 실수를 반복하고, 사람의 교정이 일회성으로 소비되어 누적되지 않는다.
핵심 기술 구성① 실패 클러스터링 ② 사람 교정 캡처 ③ 제약 규칙 생성기.
동작·데이터 흐름실패/수정 이벤트 누적 → 패턴 임계 도달 → 규칙 후보 → TS-L3 승인.
차별성·기술 난이도“같은 실수 안 함”의 메커니즘화. 실패의 근본 원인 패턴화가 난제.
성숙도·입증 지표재발 실패 감소율, 교정 반영까지 걸린 시간.
기술 리스크·의존성특정 케이스 과적합 위험 → 일반화(L2)·승인(L3)과 균형.