Ollama

이 테스트에서는 Ollama에 호스팅된 다양한 LLM이 Hugo 페이지를 영어에서 독일어로 번역하는 방식을 비교하고 있습니다. 다른 LLM이 호스팅된 Ollama에서 Hugo 페이지를 영어에서 독일어로 번역하는 방식 비교.

Ollama 와 Qwen3 임베딩 LLM 을 활용한 텍스트 재랭킹 - Go 로 구현

이 작은 Go 코드 예시는 쿼리와 각 후보 문서에 대해 임베딩을 생성하기 위해 Ollama 를 호출합니다 그리고 코사인 유사도 기준으로 내림차순으로 정렬합니다.

Ollama 에서 지원하는 Qwen3 임베딩 및 리랭커 모델: 최첨단 성능

Qwen3 임베딩 및 리랭커 모델 은 Qwen 시리즈의 최신 릴리스로, 고급 텍스트 임베딩, 검색 및 재랭킹 작업을 위해 특별히 설계되었습니다.

PCIe 랜의 수가 LLM 성능에 미치는 영향? 작업에 따라 다릅니다. 훈련 및 멀티 GPU 추론의 경우 성능 저하가 상당합니다.

LLM과 Ollama를 사용하여 HTML 콘텐츠를 Markdown으로 변환하세요.

Ollama 모델 라이브러리에는 HTML 콘텐츠를 Markdown으로 변환할 수 있는 모델이 포함되어 있습니다. 이는 콘텐츠 변환 작업에 유용합니다. 이 가이드는 우리의 2026년 문서화 도구: Markdown, LaTeX, PDF 및 인쇄 워크플로우 허브의 일부입니다.

여기서 일부 AI 보조 코딩 도구와 AI 코딩 어시스턴트 및 그들의 장점을 나열하겠습니다.

테스트: 인텔 CPU 성능과 효율적인 코어를 어떻게 Ollama가 사용하는가

제가 테스트하고 싶은 이론은, 인텔 CPU에서 모든 코어를 사용하면 LLM의 속도가 빨라질까?입니다.
새로운 gemma3 27비트 모델(gemma3:27b, ollama에서 17GB)이 제 GPU의 16GB VRAM에 맞지 않아, 부분적으로 CPU에서 실행되고 있다는 점이 제게 짜증을 주고 있습니다.

이 가이드에서는 Ollama가 병렬 요청을 처리하는 방식(동시성, 큐잉 및 자원 제한)과 OLLAMA_NUM_PARALLEL 환경 변수(및 관련 설정)를 사용하여 이를 최적화하는 방법을 설명합니다.

DeepSeek’s 첫 세대 추론 모델로, OpenAI-o1과 유사한 성능을 보입니다. 이 모델은 Llama와 Qwen을 기반으로 한 DeepSeek-R1에서 추출한 6개의 밀집 모델입니다.

이 Ollama CLI 치트시트 는 매일 사용하는 명령어 (ollama ls, ollama serve, ollama run, ollama ps, 모델 관리 및 일반적인 워크플로우) 에 초점을 맞추며, 복사/붙여넣기 할 수 있는 예제를 제공합니다.

지난 시간에 새로운 버전이 출시되었습니다. 지금까지의 내용을 확인하고, 기타 LLM과 비교하여 Mistral Small의 성능을 테스트해보세요.

리랭킹 은 검색 증강 생성 (RAG) 시스템 에서 검색 (Retrieving) 과 생성 (Generating) 사이에 위치하는 두 번째 단계입니다.

아름다운 음식은 눈으로도 즐길 수 있는 즐거움입니다. 하지만 이번 포스팅에서는 두 가지 AI 기반 검색 시스템인 Farfalle 와 Perplexica 를 비교해 보겠습니다.

정말 흥미진진합니다!

코파일럿 (Copilot) 이나 perplexity.ai 에 접속하여 전 세계에 당신의 의도를 알릴 필요 없이, 이제 자신의 PC 나 노트북에서 유사한 서비스를 직접 호스팅할 수 있습니다!

최근 몇몇 새로운 LLM이 출시되었습니다. 흥미로운 시기입니다. 논리적 오류를 감지하는 데 이 모델들이 어떻게 수행되는지 테스트해 보겠습니다.

아직도 LLM이 당신이 원하는 것을 이해하려고 애를 쓰지 않도록 하기 위해 효과적인 프롬프트를 작성하는 데 사용되는 일반적인 접근 방법이 몇 가지 있습니다.

Ollama

Hugo 페이지 번역 품질 비교 - Ollama 상의 LLMs

Ollama 와 Qwen3 임베딩 LLM 을 활용한 텍스트 재랭킹 - Go 로 구현

Ollama 에서 지원하는 Qwen3 임베딩 및 리랭커 모델: 최첨단 성능

LLM 성능과 PCIe 라인: 주요 고려사항

LLM과 Ollama를 사용하여 HTML 콘텐츠를 Markdown으로 변환하세요.

AI 코딩 어시스턴트 비교

테스트: 인텔 CPU 성능과 효율적인 코어를 어떻게 Ollama가 사용하는가

올라마가 병렬 요청을 처리하는 방법

Ollama에서 Deepseek-R1 테스트

Ollama CLI 요약: ls, serve, run, ps 및 명령어 (2026 업데이트)

미스트럴 스몰, 게마 2, 퀵 2.5, 미스트럴 네모, LLama3 및 피 - LLM 테스트

임베딩 모델을 활용한 재순위화

팔팔레 대 퍼플렉시카

Ollama 를 활용한 Perplexica 자체 호스팅

Gemma2 vs Qwen2 vs Mistral Nemo vs...

LLM을 위한 효과적인 프롬프트 작성