티스토리 뷰
ChatGPT Assistant API 사용 중 알게된 문제점 해결하기(run 대기상태 이슈, Threads 리스트 보기 - GET /v1/threads)
애쿠 2023. 12. 18. 17:56
이전 글에서 Open AI의 Assistant API를 사용해봤다.
이전 글에서의 사용법대로 차례대로 포스트맨 요청으로 사용하면 타이밍만 잘 맞추면, 큰 문제가 발생하지 않는다.
(그래도 간간히 빈 문자열이 날아오는 경우가 생긴다.)
만약 실사용하게 된다면 아래와 같이 구성되게 될 것이다.
// 쓰레드 생성
val threads = assistantsClient.createThreads()
// 메시지 생성
assistantsClient.createMessages(threads.id, MessagesRequestDto("user", "PREP이 뭐야"))
// run 생성
val run = assistantsClient.createRuns(threads.id, RunsRequestDto(assistantId))
// run 상태 확인
assistantsClient.getRun(threads.id, run.id)
// message List에서 응답결과 확인
assistantsClient.getMessagesList(threads.id)
쓰레드는 사용자 별로 재사용할수도 있을 것 같기도하지만 일단은 무시
문제는 run을 생성했을 때, run이 queued 에서 completed가 되는데 제법 시간이 걸리는데서 발생한다.
Run 대기상태 이슈
fun loopRunRequest(threadId: String, runId: String) {
val startTime = Instant.now()
while (true) {
try {
Thread.sleep(1000);
val response: RunsResponseDto = assistantsClient.getRun(threadId, runId)
println("retrying............")
if (response.status == "completed") {
break;
}
} catch (e: Exception) {
println("error")
return;
}
}
val endTime = Instant.now()
val duration = Duration.between(startTime, endTime)
println("asyncRunRequest executed in ${duration.toMillis()} milliseconds")
}
1초마다 run의 결과를 확인하는 단순 루프문으로 구성해봤다.
run이 completed 될 때 까지 retrying을 찍고
retrying............
retrying............
retrying............
retrying............
retrying............
retrying............
retrying............
retrying............
retrying............
retrying............
asyncRunRequest executed in 9420 milliseconds
약 10초나 걸린다!!
이럴 경우 요청이 대량으로 들어오게 된다면
톰캣의 모든 thread pool을 이 API가 잡아먹어버려서, 중요한 다른 요청들이 pending 상태가 되버릴 것이다.
이 작은 기능 때문에 메인 서비스가 의도치 않게 응답이 늦게 나가는 경우가 발생하게 된다.
어떻게 해결해야할지 고민을 많이해봤는데... 딱히 해결 방법이 없어서 그냥 함수를 람다에서 사용해야할 것 같다.
람다는 요청을 처리하는 함수가 대기 상태로 빠지면, 다른 함수를 병렬 실행하기 때문에 톰캣의 thread pool 문제를 발생시키지 않을 것이다.
비동기 처리나 다른 쓰레드에서 처리할 수 있을까 등 이런저런 생각을 해봤는데,
근본적으로 요청 쓰레드에서 발생하는 문제라 어떻게 해결이 안될 것 같다는 결론을 지었다.
고민하면서 딥다이브도 중요하지만, 피쳐 서비스 개발에선 결과물이 나오는게 중요하기 때문에 우선은 람다에서 구현해야할 것 같다.
Threads 리스트 보기(GET /threads API 사용하기)
이건 이슈라기보다는 API가 왜 없는지 알 수 없는 경우다.
Assistants API들을 훑어보면 GET /threads가 없다는 것을 알게 될 것이다.
thread를 확인하기 위해서 threadId가 필요한(?) API만 있다.
thread를 마음대로 만들다보면 삭제해야될 것 같은데 삭제를 못하는 경우가 생긴다.
(다행히 thread는 주기적으로 삭제된다. 삭제 주기는 마지막 접근일로 60일이라고 한다.)
https://platform.openai.com/docs/models/default-usage-policies-by-endpoint
사실 API를 제공안할리가 없다. 근데 숨겨놨다... 아래 글에서 어떻게 뚫나 알려줬다.
https://community.openai.com/t/list-of-threads-is-missing-from-the-api/484510/28
아래 순서대로 진행해보자.
1. https://platform.openai.com/assistants 페이지로 이동
2. F12 개발자 도구에서 Network 탭 열기
3. assistants 검색 후 새로고침
4. assistants?limit=10 RequestHeader 확인(맨 아래 있음)
5. Authorization에서 session key 복사(sess부터 복사)
7. Header에 OpenAI-Beta: assistants=v1 추가
8. Authorization에 Bearer 선택 후 session key를 채워넣고 https://api.openai.com/v1/threads 요청
9. 결과 확인(조금 걸림)
github
마치며
일단은 이것저것 부딪히긴했지만, 어떻게 구현해야할지 방향성은 잡은 것 같다.
더 나은 방식을 알게 되거나, Beta 딱지를 떼면 다시 확인해볼 것 같다.
'개발 > chatGPT' 카테고리의 다른 글
ChatGPT API 비용 절감을 위한 Batch API (0) | 2024.06.07 |
---|---|
ChatGPT에서 나만의 봇 만들기. My GPTs - Actions 사용하기 (0) | 2024.02.08 |
ChatGPT Assistants API 사용하기 (with. SpringBoot) (2) | 2023.12.14 |
ChatGPT Builder로 나만의 챗봇 만들기 (0) | 2023.11.15 |
ChatGPT로 이미지 해석하기 - 스프링부트에서 Vision API 사용하기 (1) | 2023.11.14 |
- Total
- Today
- Yesterday
- OpenFeign
- lambda
- JWT
- EKS
- ChatGPT
- docker
- Log
- S3
- AWS
- MySQL
- CloudFront
- terraform
- java
- Elastic cloud
- 스프링부트
- cache
- Spring
- 후쿠오카
- 티스토리챌린지
- OpenAI
- 람다
- openAI API
- springboot
- Kotlin
- AOP
- elasticsearch
- AWS EC2
- 오블완
- GIT
- serverless
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |