AI Coding

降低大语言模型成本：令牌优化策略

令牌优化是区分成本效益高的LLM应用与耗费预算的实验的关键技能。

使用 Python 构建 MCP 服务器：网络搜索与爬取指南

模型上下文协议（MCP）正在革新AI助手与外部数据源和工具的交互方式。在本指南中，我们将探讨如何构建 MCP 服务器（Python），重点介绍网络搜索和爬取功能的示例。

DGX Spark 与 Mac Studio 对比：对 NVIDIA 个人 AI 超级计算机的价格分析

NVIDIA DGX Spark 是真实存在的，将于 2025年10月15日 开售，目标用户是需要 本地大型语言模型（LLM）工作 的 CUDA 开发者，配备集成的 NVIDIA AI 套件。美国建议零售价为 3,999美元；由于增值税和渠道因素，英国/德国/日本 的零售价更高。澳大利亚/韩元 的公开标价 尚未广泛发布。

Ollama 的 Go 客户端：SDK 对比与 Qwen3/GPT-OSS 示例

本指南全面概述了可用于 Ollama 的 Go SDK，并比较了它们的功能集。

对比：Qwen3:30b 与 GPT-OSS:20b

以下是 Qwen3:30b 和 GPT-OSS:20b 的比较，重点聚焦于指令遵循和性能参数、规格和速度：

将 Ollama 集成到 Python 中：REST API 和 Python 客户端示例

在本文中，我们将探讨两种连接您的 Python 应用程序到 Ollama 的方法：1. 通过 HTTP REST API；2. 通过 官方 Ollama Python 库。

Ollama GPT-OSS 结构化输出问题

Ollama的GPT-OSS模型在处理结构化输出时经常出现问题，尤其是在与LangChain、OpenAI SDK、vllm等框架一起使用时。

跨主流LLM提供商（OpenAI、Gemini、Anthropic、Mistral和AWS Bedrock）的结构化输出对比

以下是结构化输出在主流大语言模型（LLM）提供商之间的对比，以及一些Python示例：

通过结构化输出约束大语言模型：Ollama、Qwen3 与 Python 或 Go

大型语言模型（LLMs）功能强大，但在生产环境中，我们很少希望得到自由形式的段落。相反，我们希望获得可预测的数据：属性、事实或可以输入到应用程序中的结构化对象。这就是LLM结构化输出。

GitHub Copilot 快速参考 - 描述和常用命令

以下是最新版的GitHub Copilot快捷键指南，涵盖了Visual Studio Code和Copilot Chat的必备快捷键、命令、使用技巧和上下文功能。

模型上下文协议（MCP），以及在Go语言中实现MCP服务器的注意事项

这里我们对**模型上下文协议（MCP）**进行了描述，简要说明了如何用Go语言实现一个MCP服务器，包括消息结构和协议规范。

使用 Ollama 和 Qwen3 Reranker 模型对文档进行重排序 - 使用 Go 语言

由于标准 Ollama 没有直接的重排序 API，
您需要通过生成查询-文档对的嵌入向量并对其进行评分来实现使用 Qwen3 重排序器在 GO 中进行重排序。

使用 Ollama 和 Qwen3 Embedding LLM 对文本进行重排序 - Go 语言实现

这个小的 Go代码示例重新排序调用Ollama生成嵌入用于查询和每个候选文档，然后按余弦相似度降序排序。

使用LLM和Ollama将HTML内容转换为Markdown

在 Ollama 模型库中，有一些模型可以将 HTML 内容转换为 Markdown，这对内容转换任务非常有用。

Vibe 编程 - 含义与描述

氛围编程是一种由人工智能驱动的编程方法，开发者通过自然语言描述所需的功能，从而让人工智能工具自动生成代码。