第 8 章：图像分析

龙虾学堂2026年3月23日

学会让 AI 分析图片内容

第 8 章：图像分析 ⭐

本章解决什么问题：学会让 AI 分析图片内容

学习目标：能够用自然语言让 AI 分析图片、识别文字、描述场景

版本基准：OpenClaw 3.13 前置条件：已完成第 7 章（浏览器自动化）

📋 实测验证说明：本章所有图像分析示例均经过实测验证，基于 OpenClaw image 工具实际执行。

8.1 分析图片内容

让 AI 帮你分析图片，理解图片内容。

基本用法

在 Telegram 中发送（附带一张图片）：

分析这张图片，告诉我里面有什么

AI 回复（实测）：

好的，分析这张图片...

**图片内容**：

这是一张办公室照片，包含：

1. **前景**：
   - 一张木质办公桌
   - 一台打开的笔记本电脑
   - 一个咖啡杯

2. **背景**：
   - 一扇窗户，可以看到城市景色
   - 墙上挂着一幅画
   - 一个书架，放着几本书

3. **光线**：
   - 自然光从窗户照入
   - 整体光线明亮

**场景判断**：这是一个现代化的家庭办公室或共享办公空间。

需要我帮你做什么吗？比如提取图片中的文字、描述更详细的内容等。

🔍 实测说明：实测时间 2026-03-20，使用 image 工具分析图片

💡 新手建议：发送图片时可以直接提问，AI 会自动分析图片内容并回答。

8.2 不同场景的图像分析

场景一：识别图中文字

发送（附带一张包含文字的图片）：

提取这张图片里的所有文字

AI 回复（实测）：

好的，提取图片中的文字...

**识别结果**：

欢迎使用 OpenClaw 本地 AI 助手平台

功能特点：

文件操作
代码编写
网络搜索
浏览器自动化

官网：https://openclaw.ai


共识别出 8 行文字，以上为完整内容。

💡 提示：这个功能叫 OCR（光学字符识别），可以提取图片中的文字。

场景二：描述图片场景

发送（附带一张风景照片）：

详细描述这张图片的场景

AI 回复（实测）：

好的，详细描述这张图片...

**场景描述**：

这是一张日落时分的海滩风景照。

**天空**：
- 橙红色的晚霞布满天空
- 几朵云彩被夕阳染成金黄色
- 太阳正在海平面上方缓缓落下

**海面**：
- 海水呈现深蓝色
- 波浪轻轻拍打着沙滩
- 夕阳的余晖在海面上形成金色反光

**沙滩**：
- 金黄色的细沙
- 几个脚印延伸到海边
- 远处有几个人在散步

**整体氛围**：宁静、温暖、浪漫，是一个完美的日落场景。

场景三：分析图表数据

发送（附带一张图表截图）：

分析这张图表，总结数据趋势

AI 回复（实测）：

好的，分析这张图表...

**图表类型**：折线图

**图表标题**：2025 年月度销售额

**数据趋势**：

1. **整体趋势**：上升
   - 1 月：100 万
   - 6 月：150 万
   - 12 月：200 万

2. **关键节点**：
   - 3 月有明显增长（+20%）
   - 7 月略有下降（-5%）
   - 11-12 月增长最快

3. **总结**：
   - 全年销售额增长 100%
   - 下半年表现优于上半年
   - 年底冲刺效果明显

需要我帮你把数据整理成表格吗？

场景四：识别代码截图

发送（附带一张代码截图）：

这张图片里是什么代码？解释一下功能

AI 回复（实测）：

好的，分析这张代码截图...

**编程语言**：Python

**代码内容**：

```python
def add(a, b):
    """计算两个数的和"""
    return a + b

# 测试
result = add(3, 5)
print(f"3 + 5 = {result}")

功能解释：

这是一个简单的 Python 函数：

定义了一个 add 函数，接受两个参数 a 和 b
函数返回两个数的和
调用函数计算 3 + 5，并打印结果

输出：3 + 5 = 8

这是一个基础的 Python 示例代码，常用于教学。


---

## 8.3 高级用法

### 多图片分析

**发送**（附带多张图片）：

对比这两张图片，有什么不同


**AI 回复**（实测）：

好的，对比这两张图片...

图片 1：白天的办公室

光线明亮
自然光从窗户照入
桌面整洁

图片 2：夜晚的办公室

灯光照明
窗外是夜景
桌上多了一盏台灯

主要区别：

对比项	图片 1	图片 2
时间	白天	夜晚
光源	自然光	人工灯光
氛围	明亮清爽	温馨安静

两张图片拍摄的是同一个办公室，但时间不同。


### 图片内容问答

**发送**（附带一张图片）：

这张图片里有人吗？他们在做什么？


**AI 回复**（实测）：

好的，分析图片中的人物...

人物分析：

是的，图片中有 2 个人：

左边的人：
- 穿着蓝色衬衫
- 坐在电脑前
- 正在打字或浏览网页
右边的人：
- 穿着白色 T 恤
- 站着，手里拿着文件
- 似乎在和左边的人讨论什么

活动判断：这看起来是一个工作讨论场景，可能是同事之间在交流项目内容。


### 识别图片中的物体

**发送**（附带一张图片）：

列出这张图片里所有的物体


**AI 回复**（实测）：

好的，识别图片中的物体...

物体列表：

桌子（木质）
笔记本电脑（银色）
咖啡杯（白色）
键盘（黑色）
鼠标（无线）
笔记本（纸质）
笔（蓝色）
手机（黑色）
植物（盆栽）
台灯（LED）

共识别出 10 个物体。需要我详细描述某个物体吗？


---

## 8.4 练习时间

### 练习 1：分析图片

**发送**（附带一张图片）：

这张图片里有什么？


观察 AI 如何分析图片内容。

### 练习 2：提取文字

**发送**（附带一张包含文字的图片）：

提取这张图片里的文字


练习让 AI 识别图片中的文字（OCR）。

### 练习 3：描述场景

**发送**（附带一张风景或场景图片）：

详细描述这张图片的场景


练习让 AI 详细描述图片内容。

---

## 8.5 常见问题

### Q1：AI 支持哪些图片格式？

**支持的格式**：
- ✅ JPG/JPEG
- ✅ PNG
- ✅ GIF
- ✅ WebP

### Q2：图片大小有限制吗？

**说明**：
- 有大小限制（通常几 MB）
- 过大的图片会被压缩
- 建议发送清晰的图片

### Q3：AI 能识别手写文字吗？

**说明**：
- 可以识别清晰的手写文字
- 但准确率可能不如印刷体
- 潦草的字迹可能识别困难

### Q4：AI 能分析二维码/条形码吗？

**说明**：
- 可以识别二维码/条形码
- 会返回编码内容
- 但复杂编码可能识别失败

---

## ✅ 你已解锁能力

| 能力 | 状态 |
|------|------|
| 让 AI 分析图片内容 | ✅ 已掌握 |
| 让 AI 提取图片文字 | ✅ 已掌握 |
| 让 AI 描述图片场景 | ✅ 已掌握 |
| 让 AI 识别图片物体 | ✅ 已掌握 |

---

## 📊 自测题（3 题）

### 1. 如何让 AI 提取图片中的文字？

**答案**：发送图片并说"提取这张图片里的文字"

### 2. AI 支持哪些图片格式？

**答案**：JPG、PNG、GIF、WebP

### 3. 如何让 AI 对比两张图片？

**答案**：同时发送两张图片，并说"对比这两张图片，有什么不同"

---

## 🎯 下一章预告

第 9 章：PDF 处理

你将学会：
- 让 AI 读取 PDF 文件
- 让 AI 总结 PDF 内容
- 让 AI 提取 PDF 中的信息

**提前试试**：

帮我看看这个 PDF 文件（发送一个 PDF 文件）


> 本文由郭峰主导，基于 GPT-5.4、OpenClaw Agent 完成，并经人工审校定稿。

---

> **课后练习**（可选）
> 1. 发送一张图片让 AI 分析
> 2. 发送一张包含文字的图片让 AI 提取
> 3. 发送两张图片让 AI 对比
> 
> 有任何问题，随时在群里提问！ 🚀

#openclaw#tutorial#教程