문서 최신화를 위해서 변경된 부분 또는 수정할 부분이 발견되면 발견자가 꼭! 수정해주시기 바랍니다. !!!
TA Manual
개요
MOTA (MOARA AI Platform / MOARA Text Analytics) 사용법.
정의 : AI기계가 텍스트를 분석하는 플랫폼.
목적 : 1) 분류(Classification), 2) 요약(Summarization)
결과 : 1) 장문/단문 텍스트를 n개의 분류체계 중 1개로 분류함, 2) 장문 텍스트를 몇 줄로 요약함.
목차
본 글은 개발팀 기록을 보충하기 위한 설명입니다
https://wigoai.atlassian.net/wiki/spaces/WIGO/pages/327692
https://wigoai.atlassian.net/wiki/spaces/~295842159/pages/457540365
1. TA 설명
TA 정의
Text Analytics(텍스트 분석)의 줄임말. 인공지능이 사람의 언어를 이해, 해석하여 의미 있는 정보를 추출하는 일.TA 목적
상담콜이 어느 유형에 해당되는지 분류(Classify) 및 판단한다.TA 용어
3.1. 분류체계 : 상담 유형들의 명칭.
3.2. 레이블링 : 개별 상담콜의 분류체계를 각 상담콜에 표시하는 일.
3.3. 모델 : 인공지능의 두뇌.
3.4. 학습 : 인공지능이 핵심 키워드를 추출하는 일 (=모의고사).
3.5. 테스트 : 인공지능이 핵심 키워드를 잘 학습했는지 스스로를 평가하는 일 (=수능).(기존) TA 작업 프로세스
4.1. 사전 정비 : 문서를 신조어학습, 토픽학습하여 새 단어들을 사전에 등록한다.
* 구축해야 하는 사전
- 요약 사전
- 불용어 사전
4.2. 분류체계 등록 : 상담유형 명칭들을 등록한다. 해당 상담유형들은 인공지능이 내놓을 결과값이다.
4.3. 문서 레이블링 : 상담콜 1개가 어느 분류체계에 해당되는지 표시한다. 이후 '레이블링'과 '인공지능 모델의 결과값'을 비교하며 인공지능 모델을 보완시킨다.
4.4. 모델 생성 : 인공지능이 1) 상담유형들의 핵심 키워드를 추출한 후, 2) 스스로 테스트할 수 있도록, 지원한다. 위고는 7가지 텍스트 분석(TA) 기술을 활용한다.
4.5. 모델 보완 : 분류율 100%를 목표로, 분류모델을 재학습시키고 재테스트한다.(IBK 한정) 유지보수 기간 동안 하는 일
5.1. 문서 재레이블링 : 과거에 잘못 레이블링된 상담콜에 대해 올바른 분류체계로 레이블링한다. 특히 다중분류(한 상담콜에 복수 유형이 존재하는 상황에서의 분류 작업)와 달리, 단일분류(한 상담콜에 1개 유형만 존재하는 상황에서의 분류 작업)을 위해 현업분들께서 문서를 유형별로 나누는 등 수정하고 계십니다.
5.2. 새 문서 등록 : 지금까지 모델이 정답으로 맞추지 못한 상담콜을 등록하여, 모델을 재학습시킨다.
5.3. 모델 보완 : 분류율 100%를 목표로, 분류모델을 재학습시키고 재테스트한다.
2. 모아라 URL
모아라 이름 | url | 아이디 | 비밀번호 | 설명 | |
---|---|---|---|---|---|
1 | 9011 wigo2 | admin | dnlrh | 옛날 표준 MOARA | |
2 | 9011 sc | admin | dnlrh | 키오스크(챗봇)용 | |
3 | 30050(표준) | admin | dnlrh | (2022-10-01 기준) | |
4 | 30150 | admin | dnlrh | 허령회 수석님 30050 작업 반영 전의 테스트용 | |
5 | 30040 | admin | bike0806!@# | TA 테스트용 | |
6 | 30060 | admin | dnlrh | 엣지에서 접속 필요 | |
7 | 28080 | http://demo.moara.org:28080/screen/BCO0001.ub?login_flag=timeout | admin | Dnlrh1240!@ | 데모용 |
8 | 20080 | http://demo.moara.org:28080/screen/BCO0001.ub?login_flag=timeout | admin | Dnlrh1240!@ | 데모용 |
9 | 8280 | admin | Dnlrh1240!@ | ||
10 | 8680 | admin | dnlrh |
|