1. GPT open API 란?
openAI 의 ChatGPT API는 개발자가 자신의 애플리케이션이나 서비스에 chatGPT 를 통합할 수 있는 도구다. ChatGPT는 고급언어 모델로 개발자는 이 API 를 사용하여 다양한 작업을 수행할 수 있다.
개발자들은 ChatGPT API를 사용하여 애플리케이션의 기능을 향상하고 사용자 경험을 개선할 수 있다 .
2. 비용계산방법!
OpenAI API 비용은 대부분 1,000(1K) 토큰 기준. 1,000토큰은 영단어 약 750단어 (1토큰: 약 0.75단어)에 해당하는 것으로 OpenAI 홈페이지에 언급되어 있다.
3. 파인튜닝(fine-tunning) 이란?
쉽게 말하면~~~~ 기본 모델을 파인 튜닝(Fine-tuning)하여 자신의 서비스에 최적화된 맞춤형 모델을 만들기 위해 파인튜닝을 한다.!
- 파인튜닝은 특정 작업이나 도메인에 높은 적합성을 확보하기 위해, 이미 훈련된 대규모 언어 모델에 특정 데이터셋을 사용하여 추가적인 학습을 수행하는 작업
- 즉 예를들어 LLM 은 다양한 언어 정보를 포함하고 유창한 대화에 참여할 수 있다. 그러나 의료분야에서는 환자의 질문에 효과적으로 응답할 수 있는 애플리케이션을 구축하기 위해 대규모 언어모델을 새로운 의료 데이터에 노출시켜야 한다.
- => 예를들어 "해열제를 감기약과 함께 복용할 수 있남?" 라는 의료질문에 정확한 답을 제공하기 위해 언어 모델을 파인튜닝하여 해당 도메인의 특정 내용에 적용시켜야 한다.
4. 파인튜닝 지원 모델
5. 파인튜닝의 단계
1. 데이터셋 준비
- 대상 작업과 관련된 학습 데이터셋을 수집하고 준비.
- 데이터 세트의 품질과 정확성을 보장하고 필요한 데이터 정리 및 전처리를 수행해야한다.
2. 사전 학습 및 파운데이션 모델 선택
- 대상 작업의 성격과 데이터셋의 특성을 기반으로 적합한 사전 학습 모델을 선택한다.
3. 파인튜닝 전략 정의
- 작업 요구 사항 및 사용 가능한 리소스를 기반으로 적절한 파인튜닝 전략을 선택한다.
- 전체 미세 조정을 수행할지 혹은 부분 미세 조정을 수행할지 여부와 파인튜닝 수준 및 범위를 고려한다.
4. 하이퍼파라미터 설정
- 학습률, 배치 크기, 훈련 에포크 수 등과 같은 파인튜닝 프로세스를 위한 하이퍼파라미터를 결정한다.
- 이러한 하이퍼파라미터의 선택은 미세 조정의 성능과 수렴 속도에 상당한 영향을 미칠 수 있다.
5. 모델 매개변수 초기화
- 사전 학습된 모델의 가중치를 기반으로 파인튜닝된 모델의 매개변수를 초기화한다.
- 완전한 미세 조정을 위해 모든 모델 매개변수가 무작위로 초기화된다.
- 부분 파인튜닝의 경우 최상위 레이어 또는 일부 레이어의 매개변수만 무작위로 초기화된다.
6. 파인튜닝 학습
- 준비한 데이터셋과 파인튜닝 전략을 사용하여 모델을 훈련시킨다.
- 학습 과정에서 설정된 하이퍼파라미터와 최적화 알고리즘을 기반으로 모델 매개변수를 점진적으로 조정하여 손실 함수를 최소화한다.
7. 모델 평가 및 튜닝
- 학습 과정에서 검증 세트를 사용하여 주기적으로 모델 평가하고 평가 결과에 따라 하이퍼파라미터를 조정하거나 전략을 미세 조정한다.=> 모델의 성능과 일반화 능력을 향상시킬 수 있다.
8. 모델 성능 테스트
- 미세 조정이 완료된 후 테스트 세트를 사용하여 최종 파인튜닝 모델을 평가하여 성능 지표를 얻는다.
- 이는 실제 적용에서 모델의 성능을 평가하는데 도움이 된다.
9. 모델 배포 및 적용
- 파인튜닝된 모델을 실제 응용 프로그램에 배포하고 실제 요구 사항을 충족하기 위해 추가 최적화 및 조정을 수행한다.
6. gpt 3.5
- GPT-3.5 제품군 중 가장 효과적이고 비용 효율적인 모델은 gpt-3.5-turbo
- Chat Completions API를 사용하여 대화에 최적화되어 있다
- 기억할만한 점은 최신 gpt-3.5-turbo는 컨텍스트 윈도우가 16,385 토큰, 4,096개의 토큰을 생성할 수 있다는 점
'인공지능' 카테고리의 다른 글
RAG 란? (0) | 2024.08.29 |
---|---|
파인튜닝 으로 GPT 챗봇 만들기(1) - 파인튜닝하기 (0) | 2024.08.23 |