By i2max in ai — 15 2월 2024

[AI 교육자료] AI와 생성형 AI 개념 정리

2024 ICT 산업전망컨퍼런스에 따르면 내년 정보통신기술(ICT) 핵심 트렌드는 AI 범용화와 디지털전환(DX) 가속화가 될 것이란 전망이 나왔습니다.

9월에 진행된 Dreamforce 2023에도 AI와 DX 관련 세션이 많이 등장했으며, Salesforce 또한 업무 효율을 높이고 생산성을 제고할 수 있도록 여러 솔루션에 AI 적용을 확대하고 있습니다. 또한 Dreamforce Wrap-up Session에서 AI Associate와 Data Cloud등 AI 관련 Certification 취득을 독려하기도 했습니다.

아이투맥스 SE팀에서 직접 정리한 AI 교육자료를 공유합니다. 총 2회에 걸쳐 업로드될 예정입니다.

AI 기초

AI의 정의

AI는 하나로 정의되지는 않고, 어떤 기능을 하는가에 따라 각기 달리 정의할 수 있습니다.

아래에서는 4가지 정의를 살펴보겠습니다.

1. 수치 예측(Numeric Predictions)으로서의 AI

개념
- A의 확률, 미래 수치 등을 계산하는 것
예시
- 고객이 구독을 갱신할 것인가?
- 의료 처치가 필요한 상황에 놓여 있는가?
- 오늘 저녁에 전력 수요가 높을 것인가?
형태
- 확률: 0 ~ 1
- 수치: 달러 등

2. 분류(Classifications)로서의 AI

개념
- A가 1인가 0인가를 구분하는 것
예시
- 이 식물은 먹을 수 있는가 독성이 있는가
- 이 이메일이 스팸메일인가 아닌가
분류로서의 AI는 이후 다른 업무를 수행하기 위한 단계

3. 로봇 주행(Robotic Navigation)으로서의 AI

개념
- 다양한 조건, 주변 상황에서 최적의 주행을 하는 것
- 여기서 주행은 단순히 운전 뿐만 아니라 기업이 제품 생산/배달 시 최적화 방법 등도 포함
- 예를 들어, 사용가능한 원자재 수, 제조 능력, 재고 수, 운송비용, 교통상황 등에 대한 조건을 고려하여 최적화
예시
- 로봇 자율주행

4. 언어처리(Language Processing)로서의 AI

개념
- 주어진 언어를 분석하여 사람이 쓴 답변처럼 대답하는 것
예시
- ChatGPT (Natural Language Processing; NLP)
NLP는 Generative AI의 한 범주

사람이 아닌 컴퓨터가 알고리즘을 만든다

이전에는 사람이 알고리즘을 만들고 컴퓨터로 하여금 예측하도록 하였습니다.

하지만 이제 머신 러닝은 컴퓨터로 하여금 알고리즘을 만들도록 하여 더욱 정교하고 복잡한 예측을 가능하도록 합니다.

1. 알고리즘

Input을 Output으로 변화시킬 수 있게 하는 일정한 규칙을 의미합니다.
예
- Input: 5, 8, 2, 9
- Process: 5, 8, 2, 9를 각각 더한 후 4로 나누기
- Output: 6
기존에는 알고리즘을 사람이 직접 만들었지만, 컴퓨터로 하여금 알고리즘을 만들도록 하여 아주 복잡하더라도 처리할 수 있게 하는 것이 머신 러닝 Machine Learning(ML)입니다.
즉, 많은 양의 데이터를 처리하여 예측할 수 있는 모델을 생성하도록 트레이닝하는 것이라 할 수 있습니다.

2. 데이터와 학습

데이터
- 정형화된 데이터(Structured Data): 컴퓨터가 이해할 수 있는 정리된 데이터(스프레드시트 또는 데이터베이스에서 볼 수 있는 데이터). 정형 데이터에 포함된 정보와 데이터 형식은 궁극적으로 필요한 최종 애플리케이션에서 사용하는 알고리즘에 따라 결정됩니다.
- 비정형화된 데이터(Unstructured Data): 뉴스 기사, 이미지 파일 등의 데이터.
- 인간의 실제 소통 수단인 자연어
학습 내용
- 지도 학습(Supervised Learning): 정형화된 데이터를 통해 컴퓨터에 학습합니다.
- 비지도 학습(Upsupervised Learning): 비정형화된 데이터를 통해 컴퓨터가 직접 어떤 규칙인지 알지 못한 채로 연결고리(Connections)를 찾는 것입니다.
학습의 개념
- Neural Network: 많은 연결고리의 집합. 더 많은 연결고리를 찾는다는 것은 곧 더 나은 예측을 의미합니다. 마치 우리 뇌의 뉴론들이 연결되어 있는 것에 비유한 것입니다.
- Node/Layer: 요인(Factor)들의 조합을 Node라고 칭합니다. Node가 얼마나 되어야 예측에 최적화되는지에 대해서는 정해진 것이 없지만 너무 많아서도, 너무 적어서도 안됩니다. 또한 우리의 뇌는 때로 연관되어 보이지 않는 두 개의 아이디어로부터 연결고리를 찾는 경우가 있습니다. 이러한 개념을 적용한 것이 더 많은 Node를 Layer로 더하여 예측의 정확성을 높입니다.

[생성형 AI 기초]

생성형 AI의 기능 살펴보기

생성형 AI란?

숫자를 기반으로 작동하는 기존의 AI와 다르게 이전에 읽고, 보거나 들어본 경험이 없는 매우 다양한 텍스트, 이미지, 소리를 생성할 수 있는 AI
대규모 언어 모델(LLM)을 기반으로 한 언어모델의 기능은?
- 요약
- 번역
- 오류 수정
- 안내 이미지 생성
- 텍스트 음성 변환
- 질문 답변: ChatGPT와 같이 질문 및 요청의 의도를 해석, 요청에 따라 대량 텍스트 생성

생성형 AI의 기술 협력체계 이해하기

생성형 AI 학습 강화요인
- 인터넷을 활용한 방대한 양의 학습 데이터 사용
- 학습의 개선: 정교한 수학을 사용하여 AI 모델을 학습시키는 신경망을 설계, 신경망의 아키텍처는 지속적으로 발전 >새로운 아키텍처 트랜스포머 등장
- 계산 능력 향상: 병렬 컴퓨팅을 이용한 동시 계산 가능

새로운 협력체계
- 컴퓨터 하드웨어 공급업체: AI 모델 학습 및 실제 사용에 높은 수준의 컴퓨팅 성능 필요
- 클라우드 플랫폼: 클라우드 배포 모델에서 컴퓨팅 하드웨어 활용 가능
- 기본 모델(학습 및 액세스 가능한 AI 모델): 기본 모델은 API를 통해 액세스할 수 있으므로 개발자는 필요에 따라 한 기본 모델에서 다른 기본 모델로 간편하게 전환 할 수 있고 애플리케이션 프로그래밍 인터페이스(API)를 통해 LLM에 연결할 수 있으므로 자체 애플리케이션에서 NLP의 모든 기능을 활용 가능
- 인프라 최적화: 더 효율적인 고품질 모델 학습을 위한 도구와 서비스를 제공
- 애플리케이션: 앱의 최적화 서비스와 기본 모델을 활용
생성형 AI에 대한 일반적인 우려
- 환각: 생성형 AI는 예측의 또 다른 형태이며, 예측은 정확하지 않을 수 있음을 고려해야함
- 데이터 보안: 기업은 다음과 같은 경우 독점 데이터를 공유할 수 있음
  - 기본 모델을 세부적으로 조정하는 경우
  - 민감 데이터가 포함된 요청을 처리하기 위해 실제 모델을 사용하는 경우
- 표절: LLM과 AI 모델은 일반적으로 공개적으로 사용 가능한 데이터를 기반으로 학습, 모델이 특정 스타일을 학습하고 복제할 가능성이 있어 콘텐츠에 변형을 추가하는 등 조치가 필요할 수 있음
- 사용자 스푸핑: AI가 생성한 가짜 프로필 등으로 인한 피해
- 지속 가능성: AI 모델을 학습시키는 데는 엄청난 컴퓨팅 성능이 필요하며, 연산을 수행하는 프로세서를 실행하려면 많은 전력이 소비됨.

[자연어 처리 기초]

자연어 처리 Natural Language Processsing 기초

자연어 처리(NLP)란?

컴퓨터 과학과 언어학을 결합하여 컴퓨터가 인간에게 의미 있고 유용한 방식으로 인간의 언어를 이해하고 해석하며 생성할 수 있는 능력을 제공하는 인공 지능(AI) 분야 중 하나입니다.
NLP를 사용하면 컴퓨터가 문장의 의미 이해, 텍스트의 중요한 세부 사항 인식, 문장에 담긴 감정 판단, 언어 번역, 질문에 대한 답변, 텍스트 요약, 사람의 반응과 유사한 응답 생성 등의 작업이 가능합니다.
NLP는 단어를 고유한 이미지, 음성, 다른 단어로 변환하는 AI의 하위 범주인 생성형 AI의 큰 부분을 차지합니다.
자연어 생성(NLG): 구조화된 데이터에서 구조화되지 않은 데이터로 처리되는 것
자연어 처리의 역사
- 1950s: 처음으로 컴퓨터를 사용하여 인간 언어를 이해하고 생성하기 시작, 튜링 테스트(기계가 질문에 대해 인간과 구별할 수 없는 수준으로 대답을 할 수 있는지를 측정하는 실험), 최초의 기계 번역 시스템 개발
- 1960s: 사용자가 컴퓨터에게 작업을 완료하도록 하거나 대화를 요청할 수 있는 규칙 기반 시스템을 실험
- 1970-80s: 언어 규칙, 규칙 기반 추론, 분야별 지식을 활용하여 명령 실행 및 질병 진단과 같은 작업을 수행하는 보다 정교한 지식 기반 접근 방식 등장
- 1990-2000s: NLP에 통계적 접근 방식(데이터 기반 학습)의 활용으로 음성 인식, 기계 번역 및 기계 알고리즘 발전, 신경망과 딥러닝이 NLP 연구 개발의 주축

자연어 구문 분석 알아보기

자연어 구문 분석하기
- 구문 분석: NLP는 통계 모델, 머신 러닝, 딥러닝, 규칙 기반 시스템과 같은 알고리즘과 방법을 사용하여 텍스트를 처리하고 분석합니다. 텍스트나 음성을 쪼개 NLP에 사용하기 위한 용도로 분류하는 작업이 여기에 포함됩니다.
- 구문론적 구문 분석: 자연어의 요소를 분석하여 기본적인 문법 구조를 파악합니다.
- 의미론적 구문 분석: 의미를 도출합니다.

구문 분석의 종류

세분화: 긴 텍스트가 더 작고 의미 있는 덩어리로 나뉩니다.
토큰화: 문장이 토큰(개별 단어)으로 분할됩니다.
스테밍: 단어를 어간으로 축소합니다.
표제어 추출: 단어를 어간으로 줄이되 품사를 고려하여 어근에 도달하도록 합니다.
품사 태깅: 품사에 따라 각 단어에 문법적 레이블 또는 태그를 할당합니다.
개체명 인식(NER): 알고리즘을 사용하여 사람, 날짜, 장소, 조직 등과 같은 이름이 정의된 개체를 텍스트에서 식별하고 분류합니다.

의미 분석의 종류

감정 분석: 텍스트가 긍정적, 부정적 또는 중립적 감성 중 어떤 것을 표현하는지 판단합니다. 감성은 텍스트에서 감정이나 의견을 식별하고 분류하여 제품, 서비스 또는 경험에 대한 사람들의 감정을 기업이 이해하는 데 도움이 됩니다.
의도 분석: 말 뒤에 숨겨진 목적이나 의도를 해석합니다. 가상 비서, 고객 지원 시스템 또는 챗봇 사용자가 요청하는 바를 이해하고 적절한 응답이나 조치를 제공 합니다.
문맥(담화 분석): 주변 정보를 이해하여 텍스트를 이해합니다. 더 넓은 문맥, 단어 간의 관계를 비롯한 기타 관련 정보를 고려하여 NLP 시스템이 단어를 더 정확하게 해석합니다.

[고객 서비스를 위한 AI]

머신 러닝의 작동 방식

Natural language understanding (NLU)
Natural language processing (NLP)
Named entity recognition (NER): 단어의 순서를 라벨링하며 이름, 날짜, 시간과 같은 중요한 것을 뽑아냅니다. 또는 문장을 기계가 이해하기 쉽도록 나눕니다.
Deep learning: 대규모 데이터베이스의 데이터 포인트 간에 개발되는 인공 신경망입니다. 알고리즘을 사용하여 데이터를 조사하고 결론을 도출하며 성능을 향상시킵니다.

모든 것은 데이터에 달려 있습니다!

모델에 더 많은 데이터를 입력할 수록 더 정확하고 유용한 결과를 얻을 수 있습니다.

같은 맥락에서 데이터 상태는 매우 중요합니다. 깨끗하고 잘 조직된 데이터를 입력할수록 더 원활한 AI 배포가 가능합니다. 그렇지 않을 경우에는 데이터를 사용하기 전 수동으로 데이터 클렌징에 많은 시간을 소모해야 합니다.

아인슈타인으로 더욱 스마트한 고객 서비스를 제공하세요.

Increase deflection and reduce handle time.
- Einstein Bots은 반복적인 고객 문의를 해결하고 사람의 해결이 필요하다면 담당자에게 인계합니다.
Turbocharge agent productivity.
- Einstein Agent는 에이전트에게 고객에게 할 수 있는 최선의 서비스를 맥락에 맞게 제공합니다.
Rapid deployment and time-to-value.
- Service Cloud Einstein은 Salesforce 및 기존 서비스 채널과 사전 통합되어 있으며 즉시 사용 가능한 직관적인 사용자 인터페이스와 함께 제공됩니다.
Einstein Bots
- 자동으로 주요 고객 문제를 해결, 적합한 고객 정보를 수집, 고객을 상담원에게 원활하게 전달합니다.
- 결과적으로, 고객 센터의 사례 편향이 늘어나고 상담원의 처리 시간이 단축됩니다.
Einstein Agent
- 지능형 케이스 라우팅, 자동 분류 및 케이스 필드 예측을 통해 문제 해결 속도를 크게 높이고 콜센터 전체의 효율성을 향상합니다.
Einstein Discovery
- 관리자가 예측 서비스 KPI를 통해 조치를 취하는 데 도움을 주며, 이탈이나 CSAT 등 KPI에 영향을 미치는 동인에 대한 실시간 분석과 제안된 권장 사항 및 설명을 제공합니다.
Einstein Vision for Field Service
- 이미지 분류를 자동화하여 현장에서 문제를 더 빠르게 해결합니다. 물체의 사진을 찍는 것만으로도 즉시 부품을 식별할 수 있어 기술자의 정확성을 보장하고 최초 수정률을 높일 수 있습니다.
Einstein Language
- 사전 학습된 모델을 사용하여 텍스트를 긍정적, 중립 또는 부정적으로 분류한 다음 텍스트 본문에 기본 의도를 분류합니다. 모든 앱의 구조화되지 않은 데이터에서 언어를 처리합니다.

챗봇 성격

투명성: 챗봇은 고객에게 자신이 무엇을 할 수 있는지 명시합니다. 고객의 주요 요청을 팝업으로 제공합니다.
개성: 챗봇에는 브랜드를 표현하는 목소리와 톤이 있어야 합니다. (언어 유형 혹은 이모지가 될 수도 있음)
철저함: 챗봇은 고객에게 완전한 정보와 그 정보를 받아들일 충분한 시간을 제공해야합니다.
반복성: 문제 해결을 위해 지속적으로 개선되어야 합니다. 일회성 사용은 지양되어야 합니다.

[비즈니스용 AI]

AI를 통한 결과물

예/아니오 예측 or 답
- AI는 시스템에 쌓여있는 데이터를 분석함으로써 다음과 같은 질문들에 대한 예/아니오 대답을 할 수 있습니다.
- 이 리드가 사업을 위해 좋은 리드인가? 이 잠재고객(Prospect)가 이메일을 볼 것인가?
수치 예측
- 과거 데이터를 이용하여 미래의 수치를 예상합니다.
- 미래에 대한 예측의 경우, “이 새로운 고객을 통해 얼마나 많은 이익을 창출할 수 있을 것인가”
- 그 외 맥락의 경우, “고객센터에서 이 고객의 요청을 해결하는 데에는 얼마의 기간이 소요될 것인가"
분류
- 줄글(Free Text)이나 이미지 같은 비정형화된 데이터(Unstructured Data)를 기반으로 주로 딥러닝(Deep Learning) 기술을 이용합니다.
- 비정형화된 데이터로부터 유용한 정보를 끌어내고 다음과 같은 질문에 대한 답을 제시: “이 사진에 얼마나 많은 음료수 캔이 있는가”
- “같은 신발을 줘", "지난 번과 같은 신발이 필요해" 등 각기 다른 표현을 하더라도 딥러닝 기술로 AI가 같은 내용임을 이해하도록 함
추천
- 유저가 선호할 것 같은 아이템을 제시합니다.
- 추천은 제품에만 한정되는 것이 아니라, 비즈니스 유저들이 참고할 문서, 구직자들이 지원할 구직 공고, 이메일 작성 시 내용 등 다양한 분야에 적용됨
요약
- 긴 줄글이나 강연을 짧게 핵심적인 내용만 간추립니다.
- 1시간의 녹음자료나 10장의 문서를 간단히 요약하고 싶을 때 AI를 이용할 수 있음

비즈니스에서 AI를 활용하는 순서

무엇을 예측할 것인지 결정하기

AI가 무엇을 예측했으면 하는지에 대하여 명확하게 정의하고 계산할 수 있는 단위로 이야기해야 합니다.
고객 이탈(Customer Attrition)에 대해 걱정하는 은행의 경우, 다음과 같은 질문을 통해서 “고객 이탈"을 정확하게 정의해야 합니다.
“고객을 잃는다는 것은 무엇인가? 입출금 계좌와 예금 계좌를 둘 다 갖고 있는데, 예금 계좌만 닫는다면 그것은 이탈인가? 계좌는 그대로 가지고 있는데 금액의 90%를 인출한다면 그것은 이탈인가?

과거 데이터 수집하기

“과거 행동이 미래 행동의 가장 좋은 예측치이다”라는 이야기가 있듯이, AI에게도 동일하게 적용됩니다.
과거의 많은 데이터들이 필요한데, 때로 회사들은 많은 데이터를 각기 다른 시스템에 저장해두기도 하므로, AI를 제대로 이용하기 위해서는 이러한 시스템 통합이 필요합니다.

예측을 행동으로 바꾸기

예측을 통해 어떤 고객은 15% 이탈 확률이 있고, 다른 고객은 30% 이탈 확률이 있다는 결과를 받을 수 있습니다.
이러한 정보를 바탕으로 25% 이상의 이탈 확률을 가진 고객들에 대하여 스페셜 할인 쿠폰을 제공하는 정책을 고안할 수 있습니다.

행동 개선하기

쿠폰 정책을 실행하기 위해서는 이메일 발송을 해야하는데, 이때 AI의 도움을 받을 수 있습니다.
AI를 통해 보다 개인화된 이메일 내용을 구성하여 작성할 수 있고, 이메일을 열거나/열지 않을 경우 그 이후 액션에 대해서도 도움을 받을 수 있습니다.

출처

번역 및 검수

아이투맥스 SE팀 박지은 프로

[AI 교육자료] AI와 생성형 AI 개념 정리

AI 기초