일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 영상처리
- sort
- 컴퓨팅사고
- 그리디
- MCU 딥러닝
- 초소형머신러닝
- bfs문제
- 코테 문제
- 포스코 교육
- 포스코 AI교육
- 코테
- 삼성역테
- 삼성역량테스트
- 코딩테스트
- DP
- dfs
- 삼성코테
- 삼성코딩테스트
- 자료구조
- DP문제
- 포스코 ai 교육
- 임베디드 딥러닝
- BFS
- 다이나믹프로그래밍
- 딥러닝
- TensorFlow Lite
- 알고리즘
- tflite
- tinyml
- dfs문제
- Today
- Total
코딩뚠뚠
[기타] ChatGPT 란, 간단한 활용법과 한계 본문
Chat GPT가 출시된지 벌써 몇 개월이 됐지만 아직도 업계와 사회에 큰 화제가 되고있다.
몇몇, 아니 이 글을 읽고있다면 한번쯤은 Chat GPT를 사용해봤을것이라고 생각한다.
이 글에서는 아래와 같은 목차로 Chat GPT에 대해 풀이해보려 한다.
1. 소개
2. 작동원리
3. 활용분야
4. 사용법
5. 한계점
1. 소개
Chat GPT는 OpenAI가 개발한 GPT-3.5 엔진 기반의 인공지능 챗봇이다.
- GPT 엔진 : Generative Pre-trained Transformer 로 자연어 처리를 위한 인공지능 모델
문장에서 단어들간의 관계를 이해하고 출력문장을 생성할 수 있다.
<GPT엔진의 발전>
GPT-1 : 2018.6
GPT-2 : 2019.2
GPT-3 : 2020.6
GPT-3.5 : 2021.10
> Chat GPT : 2022.11
GPT-4 : 2023.3.14
2. 작동원리
Chat GPT 모델은 다른 GPT 모델과 마찬가지로 여러 개의 Transformer 블록으로 구성된 아키텍처를 사용한다.
GPT-1 : 117M
GPT-2 : 1.5B
GPT-3 : 175B (1750억)
Chat GPT : 6B (기존 아키텍처 기반이나 대화형 작업에 특화되도록 수정됨)
GPT-4 : 파라미트 개수 발표X (1조~100조 추정)
<모델의 간략 순서>
1. 입력 : 텍스트 시퀀스
- 임베딩 레이어를 통해 연속된 vector space 로 변환된다.
2. 트랜스포머 블록 : 문맥 의존성 반영하는 표현을 생성
- multi-head self-attention 과 feedforward layer로 구성됨
3. 출력 : 예측된 텍스트 생성
아래 사진은 모델의 핵심인 Transformer 블럭과, Chat GPT에게 물어본 자신의 구조에 대한 답변이다.
3. 활용분야
Chat GPT의 활용분야는 기존 AI 생성모델의 활용분야와 다르게 일반인의 관점에서도 무궁무진해 보인다.
1. 대화형 챗봇 : 가장 기본적인 활용방법이다. 주로 검색을 위해 사용가능하며 상담, 추천 등의 방법으로도 활용 가능하다.
2. 컨텐츠 생성 : 블로그 글 작성, 뉴스 기사, 소설, 시 등의 다양한 업무를 처리할 수 있다.
3. 언어 모델 : 기계번역, 질답시스템, 요약, 문서분류 등이 가능하다.
물론 이미 있는 자료를 논리적으로 재배치하여 출력하는 모델이지만
물흐르듯 자연스러운 단어 배치로 대화하듯이 출력하기 때문에
활용 방안은 생각하는대로 계속 생겨날 수 있다.
23/3 기준 ChatGPT를 이용한 몇몇 사이트들을 정리해봤다.
1. chatpdf : 보고서, 논문, 자소서 등의 PDF를 업로드후 chat gpt에게 이 자료들을 기반으로 질문 가능
2. 엑셀+chatGPT 활용
3. Vrew와 Chat GPT를 통한 온라인 마케팅
4. Chat GPT 이용 언어 학습
등등 매우 많은 서비스들이 쏟아져 나오고 있다.
4. 사용법
사실 활용하는 아이디어의 문제이지 API 자체는 매우 쉽게 활용할 수 있다.
1. OpenAI CLI 설치
pip install openai
2. OpenAI API Key 요청
아래 사이트에서 API 키를 발급 받을 수 있다.
키는 최초 1회만 공개되니 잘 기억하거나 보관하고 있어야 한다.
3. 사용
간단히 파이썬에서 질문을 하면 답변을 내도록 해봤다.
어떤 기업이라도 이 간편한 사용을 보면 자신의 서비스에 빠르게 붙여보고 싶어할 거라고 생각한다.
- 라고 생각했는데 바로 겉핥기 식으로 만들어서 튀어나왔다. ex) 토스, 마이리얼트립
5. 한계점
지식범위의 한계
- 2021년 까지의 정보 밖에 업데이트 되지 않아 실시간 정보에 취약하다.
인간 감정 이해의 한계
- 가끔 엉뚱한 대답을 할 때가 있다. 이전 대화의 문맥을 놓친다거나, 감정에 대한 이해가 잘 되지 않는 경우이다.
편향성
- 생성모델이긴 하지만 엄연히말하면 새로운 것을 생성해내는것이 아닌 기존의 것을 찾아 나타내는 것이다.
- 따라서 다수의 데이터가 편향되어있다면 답변도 편향되어있을 가능성이 높다.
마치며
AI기술의 주요 엔지니어들은 2년 내에 큰 변곡점이 올 것이라고 입을 모아 말한다.
그 기술이 일반인들에게 풀어지지 않았을 뿐이지 이미 내부적으로는 완성단계일 수 있어 궁금하기도 하면서 두렵기도 하다.
인터넷 컨텐츠의 대부분이 AI생성모델로 만들어 지는 세상,
창작에 대한 고민을 하지 않는 사람들
그런 사회가 된다면 당장 2년후 나는 무엇을 하고 있을까 생각하게 된다.
References :
https://keep-steady.tistory.com/52
https://github.com/airobotlab/lecture_NLP_GPT
http://jalammar.github.io/illustrated-gpt2/
https://medium.com/analytics-vidhya/openai-gpt-3-language-models-are-few-shot-learners-82531b3d3122
https://papers.nips.cc/paper/2020/file/1457c0d6bfcb4967418bfb8ac142f64a-Paper.pdf
https://youtu.be/MV1l2JPAxVY
http://dsba.korea.ac.kr/seminar/?pageid=2&mod=document&keyword=nlp&uid=247
'공부 > 기타' 카테고리의 다른 글
[Git] GitHub's file size limit of 100.00 MB 에러 해결 (1) | 2023.12.01 |
---|---|
[기타] 메일서버 및 웹호스팅 위한 네임서버 설정 (0) | 2023.05.22 |
[기타] AI-900 시험 후기 (0) | 2023.02.12 |
[기타] AZ-900 시험 후기 (0) | 2023.01.29 |
git diff 정리하기 (0) | 2022.10.09 |