Frontends de LLM

Não há tantas opções assim, mas ainda assim...

Conteúdo da página

Quando comecei a experimentar com LLMs, as interfaces deles estavam em desenvolvimento ativo e agora algumas delas são realmente boas.

!- Jan - interface multiplataforma para LLMs(jan-site_w678.jpg Jan - Frontend para LLMs - instalação)

Jan

Jan(https://jan.ai/) está disponível para Windows, Linux e Mac.

Possui temas escuros, claros e transparentes.

!- Jan LLM frontend - janela principal(jan-self_w678.jpg Jan - Frontend para LLMs - exemplo de resposta para por que selfhost)

Pode se conectar a vários backends existentes, como Anthropic, Cohere, OpenAI, NvidiaNIM, MistralAI etc, e hospedar modelos por conta própria - veja a seção Cortex na captura de tela abaixo - mostrando Jan baixado e hospedando localmente Llama3 8b q4 e Phi3 medium (q4).

!- Jan LLM frontend - opções de configuração(jan-config_w678.jpg Jan LLM frontend - opções de configuração)

Pontos positivos (o que gostei):

Interface intuitiva
Possibilidade de experimentar com a temperatura do modelo, topp, frequência e penalidades de presença e prompts do sistema.
Fornece servidor de API

Pontos negativos:

De alguma forma lento no meu sistema baseado em Ubuntu. No Windows funcionou bem.
Pode se conectar a muitos backends, mas todos são gerenciados. Seria bom usar a opção Ollama.
Poucas variantes dos modelos disponíveis para auto-hospedagem no Cortex. Não há muitas opções de quantização também.
Sim, Huggingface gguf é incrível. Mas eu queria
- reutilizar o que o Ollama já baixou e carregou na VRAM
- não hospedar o mesmo modelo em todos os lugares

KoboldAI

Um dos mais proeminentes

Silly Tavern

Outro muito versátil

LLM Studio

LLM Studio não é minha interface favorita para LLMs, mas tem melhor acesso aos modelos do Huggingface.

Ollama via Linha de Comando

Sim, isso também é uma interface de usuário, apenas uma via linha de comando.

Para executar o LLM llama3.1:

ollama run llama3.1

quando terminar, envie um comando para sair da linha de comando do Ollama:

/bye

cURL Ollama

Instale o cUrl se ainda não o fez:

sudo apt-get install curl

Para chamar o mistral nemo q8 llm local hospedado no Ollama - crie um arquivo local com o prompt p.json:

{
  model: mistral-nemo:12b-instruct-2407-q8_0,
  prompt: O que é pós-modernismo?,
  stream: false
}

e agora execute no terminal bash:

curl -X POST http://localhost:11434/api/generate -d @p.json > p-result.json

o resultado estará no arquivo p-result.json

se quiser apenas imprimir o resultado:

curl -X POST http://localhost:11434/api/generate -d @p.json

Também:

Não testei esses, mas é uma lista bastante abrangente de interfaces para LLMs:

Jan