메인 콘텐츠로 건너뛰기

자주 발생하는 HTTP 오류

실제 사용자 사용 과정 중 자주 발생하는 문제 사례와 해결 방법입니다. 아래를 확인하여 순서대로 처리할 수 있습니다.
인증 실패의 경우, API 키 또는 접근 권한 정보를 다시 확인해 주세요.
요청한 컨테이너 ID 또는 엔드포인트 경로가 잘못된 경우입니다. 컨테이너 ID 또는 라우트를 다시 확인해 주세요.
내부 서버 오류가 발생할 경우, 잠시 후 다시 시도하거나 Air Cloud 지원팀(contact@aieev.com)으로 문의해 주세요.

문제 해결

실제 사용자 사용 과정 중 자주 발생하는 문제 사례와 해결 방법입니다. 아래를 확인하여 순서대로 처리할 수 있습니다.
  • 증상: API 요청 인증에 실패함
  • 원인: 만료되었거나 잘못된 API 키 사용
  • 해결 방법:
    • API 키가 유효한지 확인합니다 (만료 여부 확인)
    • Air Cloud 대시보드에서 새로운 API 키를 발급받아 사용
  • 증상: 컨테이너 시작 시 GPU가 감지되지 않음
  • 원인: 노드 불안정성 또는 드라이버 불일치
  • 해결 방법:
    • 새로운 인스턴스로 재배포
    • 사용 중인 컨테이너 런타임과 드라이버의 호환성 확인
  • 증상: 컨테이너가 외부 엔드포인트에 연결하지 못함
  • 원인: 포트 설정 오류, DNS 문제, 방화벽 차단
  • 해결 방법:
    • 컨테이너가 올바른 포트를 노출하고 서비스가 수신 중인지 확인
    • 컨테이너 내부에서 curl 명령어로 외부 연결 테스트
    • 보안 그룹 설정에서 아웃바운드 트래픽이 차단되지 않았는지 확인
  • 증상: 배포가 헬스 체크 단계에서 멈춤
  • 원인: /health 경로에서 HTTP 200 OK 응답을 반환하지 않음
  • 해결 방법:
    • 올바른 헬스 체크 url 및 포트가 노출되어 있는지 확인
    • 로그를 확인하여 에러 메시지나 모델 로딩 지연 여부 파악
  • 증상: 높은 부하에도 불구하고 확장이 발생하지 않음
  • 원인: 스케일링 임계값이 너무 높거나, 레플리카 상태가 비정상
  • 해결 방법:
    • CPU 임계값, 지연 시간 등 오토스케일링 파라미터 조정
    • 모든 레플리카가 헬스 체크를 정상 통과하는지 확인
  • 증상: API 응답이 서버 오류(502/503)를 반환
  • 원인: 애플리케이션이 예상 포트에 바인딩되지 않았거나 시작 중 충돌 발생
  • 해결 방법:
    • 서비스가 0.0.0.0:<PORT>에 정상적으로 실행 중인지 확인
    • 모델 로딩 시간이 길 경우 헬스 체크 타임아웃을 늘려서 설정