Docker Model Runner: Panduan Konfigurasi Ukuran Konteks
Konfigurasikan ukuran konteks di Docker Model Runner dengan solusi kerumitan
Menyetel ukuran konteks di Docker Model Runner lebih kompleks dari yang seharusnya.
Konfigurasikan ukuran konteks di Docker Model Runner dengan solusi kerumitan
Menyetel ukuran konteks di Docker Model Runner lebih kompleks dari yang seharusnya.
Model AI untuk meningkatkan gambar dengan instruksi teks
Black Forest Labs telah merilis FLUX.1-Kontext-dev, sebuah model AI canggih untuk mengubah gambar berdasarkan instruksi teks.
Aktifkan percepatan GPU untuk Docker Model Runner dengan dukungan NVIDIA CUDA
Docker Model Runner adalah alat resmi Docker untuk menjalankan model AI secara lokal, tetapi mengaktifkan percepatan GPU NVidia di Docker Model Runner memerlukan konfigurasi khusus.
Benchmark GPT-OSS 120b pada tiga platform AI
Saya menemukan beberapa uji kinerja menarik dari GPT-OSS 120b yang berjalan di Ollama di tiga platform berbeda: NVIDIA DGX Spark, Mac Studio, dan RTX 4080. Model GPT-OSS 120b dari perpustakaan Ollama memiliki ukuran 65GB, yang berarti tidak masuk ke dalam 16GB VRAM dari RTX 4080 (atau yang lebih baru RTX 5080).
Referensi cepat untuk perintah Docker Model Runner
Docker Model Runner (DMR) adalah solusi resmi Docker untuk menjalankan model AI secara lokal, diperkenalkan pada April 2025. Cheat sheet ini memberikan referensi cepat untuk semua perintah penting, konfigurasi, dan praktik terbaik.
Bandingkan Docker Model Runner dan Ollama untuk LLM lokal
Menjalankan model bahasa besar (LLMs) secara lokal telah semakin populer untuk privasi, kontrol biaya, dan kemampuan offline. Lanskap berubah secara signifikan pada April 2025 ketika Docker memperkenalkan Docker Model Runner (DMR), solusi resmi mereka untuk pengujian model AI.
Ketersediaan, harga ritel dunia nyata di enam negara, dan perbandingan dengan Mac Studio.
NVIDIA DGX Spark adalah nyata, tersedia untuk dibeli 15 Oktober 2025, dan ditujukan untuk pengembang CUDA yang membutuhkan pekerjaan LLM lokal dengan tumpukan AI NVIDIA yang terintegrasi. Harga MSRP AS $3.999; harga ritel UK/DE/JP lebih tinggi karena pajak dan saluran. Harga publik AUD/KRW belum secara luas diposting.
Harga GPU Konsumen yang Cocok untuk AI - RTX 5080 dan RTX 5090
Kembali lagi, mari kita bandingkan harga untuk GPU konsumen tingkat atas yang cocok untuk LLM khususnya dan AI secara umum. Secara spesifik, saya sedang melihat harga RTX-5080 dan RTX-5090. Harganya sedikit turun.
Daftar singkat aplikasi untuk pemantauan beban GPU
Aplikasi pemantauan beban GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.
Pada Juli 2025, segera akan tersedia
Nvidia segera merilis NVIDIA DGX Spark - superkomputer kecil AI berbasis arsitektur Blackwell dengan 128+GB RAM terpadu dan kinerja AI sebesar 1 PFLOPS. Perangkat yang menarik untuk menjalankan LLM.
Pembaruan harga GPU yang cocok untuk AI - RTX 5080 dan RTX 5090
Mari kita bandingkan harga untuk GPU konsumen tingkat atas yang cocok untuk LLM khususnya dan AI secara umum. Secara khusus, lihat harga RTX 5080 dan RTX 5090. Mereka sedikit turun.
Pemeriksaan kenyataan harga - RTX 5080 dan RTX 5090
Hanya 3 bulan yang lalu kita tidak melihat RTX 5090 di toko, dan sekarang mereka sudah ada, tetapi harganya sedikit lebih tinggi dari MRSP. Mari kita bandingkan harga terendah RTX 5080 dan RTX 5090 di Australia dan lihat bagaimana perkembangannya.
Lebih banyak RAM, daya yang lebih sedikit, dan tetap mahal seperti...
Sistem otomasi terbaik untuk beberapa pekerjaan luar biasa.