Performance

성능을 위한 허구 캐싱 전략

성능을 위한 허구 캐싱 전략

후고 사이트의 개발 및 실행 최적화

Hugo 캐싱 전략은 정적 사이트 생성기의 성능을 극대화하는 데 필수적입니다. Hugo는 본질적으로 빠른 정적 파일을 생성하지만, 여러 계층에서 적절한 캐싱을 구현하면 빌드 시간을 크게 개선하고 서버 부하를 줄이며 사용자 경험을 향상시킬 수 있습니다.

Ollama가 병렬 요청을 처리하는 방식

Ollama가 병렬 요청을 처리하는 방식

병렬 요청 실행을 위해 ollama 구성하기.

Ollama 서버가 동일한 시간에 두 개의 요청을 받을 경우, 그 동작은 구성 설정과 사용 가능한 시스템 자원에 따라 달라집니다.

대규모 언어 모델 속도 테스트

대규모 언어 모델 속도 테스트

GPU 대 CPU에서 LLM의 속도를 테스트해 보겠습니다.

다양한 버전의 LLM(llama3, phi3, gemma, mistral)의 예측 속도를 CPU와 GPU에서 비교합니다.