OpenAI 兼容,不用重写 SDK
现有客户端只需要换 base URL 和 API key,业务代码里的请求结构可以继续沿用。
通过单一 OpenAI 兼容端点接入整个 LLM 生态,无需分别管理多家供应商账号、账单面板和 SDK 版本。
按权重路由并自动故障切换。节点冷却后流量毫秒级重新分配,请求永远有去处。
逐请求 token 计费,钱包余额和积分余额一目了然。设限额、收告警,告别账单惊喜。
只要用过 OpenAI SDK,BeansAI 你已经会了——把 base URL 指向我们的网关,继续发货。
import openai
client = openai.Client(
# 1. Change the base URL
base_url="https://api.beansai.dev/v1",
# 2. Use your BeansAI key
api_key="beans_sk_...",
)
response = client.chat.completions.create(
# 3. Pick ANY model
model="anthropic/claude-opus-4-8",
messages=[{"role": "user", "content": "Hello!"}],
stream=True,
)BeansAI 做的是 API 网关:把现有 OpenAI SDK 的 base URL 指向 https://api.beansai.dev/v1,换成 BeansAI key,再通过 model 参数选择要调用的模型。你不需要为每家供应商维护一套鉴权、账单和重试逻辑。
现有客户端只需要换 base URL 和 API key,业务代码里的请求结构可以继续沿用。
推理、长上下文、多模态、低成本后台任务都能用同一个入口切换模型。
统一查看请求日志、用量和钱包余额,减少多供应商运维成本。
适合正在把 AI 功能做进产品的团队:客服聊天、代码 Agent、内容生成、数据分析、内部自动化。真正的价值不是“模型很多”,而是你可以在同一套请求、日志和费用视图里比较模型并切换。
一个常见用法是:推理任务用 GPT,长上下文用 Claude,多模态用 Gemini,后台批处理用 DeepSeek 或 Qwen。业务代码保持稳定,模型选择可以按任务调整。
BeansAI 不替你判断哪个模型永远最好,它让团队更容易接入、比较和替换模型。上线后最重要的几件事:请求能发出去、失败能定位、费用能看清、模型能换得动。
直接接入多家供应商通常意味着多套 SDK、密钥、模型命名和鉴权流程。BeansAI 保持 OpenAI 兼容请求形状,用 model 字段选择供应商,减少 Web 应用、Agent 系统和内部自动化里的集成膨胀。
单供应商应用会受单点故障影响。BeansAI 加入路由、健康检查和故障切换,让流量尽量继续走向健康容量,这对不能因为上游波动而暂停的生产功能很重要。
分散账单很难比较用量。BeansAI 把逐请求 token 计费、钱包余额和消费控制集中在同一个开发者账户,团队能更清楚地看到 AI 预算花在了哪里。
团队可以通过改请求里的模型名来测试 Claude、GPT、Gemini、DeepSeek、Qwen、Mistral 和 Llama,不用重写业务代码。这让客服聊天、编程 Agent、分析任务和内容工作流都更容易匹配合适模型。
它解决多模型接入后的工程问题:统一 API key、OpenAI 兼容请求、日志、用量、账单和路由。
可以。多数应用只需要把 base URL 改为 https://api.beansai.dev/v1,使用 BeansAI API key,再设置要调用的模型名。
先看模型目录确认模型名、覆盖范围和价格,最后按文档里的 SDK 示例改 base URL 和 key。
不会。它让评测更容易:团队可以在统一请求格式下比较不同供应商,再为每个产品流程保留表现最好的模型。