Het lokaal draaien van grote taalmodellen geeft je privacy, offline mogelijkheden en geen API-kosten.
Deze benchmark onthult precies wat je kunt verwachten van 14 populaire
LLM’s op Ollama op een RTX 4080.
Vandaag kijken we naar de top-level consumentengrafische kaarten en RAM-modules.
Specifiek kijk ik naar
RTX-5080 en RTX-5090-prijzen, en 32GB (2x16GB) DDR5 6000.
Na automatisch installeren van een nieuw kernel, heeft Ubuntu 24.04 het ethernet-netwerk verloren. Dit vervelende probleem is voor mij opnieuw voorgekomen, dus ik documenteer de oplossing hier om anderen te helpen die hetzelfde probleem ondervinden.
Met deze gekke [prijsvolatiliteit van RAM](https://www.glukhov.org/nl/hardware/ “Analyse van GPUs, CPUs, RAM-prijzen, AI-werkstations en trends in compute-infrastructuur. Economie en prestatieoverwegingen van hardware voor moderne werklasten.) om een beter beeld te krijgen, laten we eerst zelf de RAM-prijzen in Australië volgen.
Implementeer enterprise AI op budgethardware met open modellen
De democratisering van AI is een feit.
Met open-source LLM’s zoals Llama, Mistral en Qwen die nu eigen modellen rivaliseren, kunnen teams krachtige AI-infrastructuur op consumentenhardware bouwen – kosten drastisch verlagen terwijl volledige controle over gegevensprivacy en implementatie behouden blijft.