Gemini(Google)指南

概述

Gemini 是 Google 的多模态大模型系列,具备图像、文本、音频等多模态理解与生成能力,并与 Google 的搜索与生态服务结合紧密。常用于检索增强、内容理解与生成、开发者工具整合等场景。

强检索关联
多模态
开发者生态

接入方式

网页端

API 接入

Google 提供 Generative Language API 与 SDK。模型命名与接口可能更新,请以官方文档为准。

示例(通用占位)

// curl(generateContent)
curl "https://generativelanguage.googleapis.com/v1beta/models/MODEL_NAME:generateContent?key=$GOOGLE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "用 5 点总结零知识证明"}]}]
  }'

// Node.js(官方 SDK 示例可能变化)
// 参考 Google 官方文档与示例仓库获取最新调用方式
提示:多模态输入(图像/音频)、安全策略与检索相关能力请参考最新文档。

常用场景

优势与局限

提示词与实践建议

资源链接