第 8 章:图像分析
学会让 AI 分析图片内容
第 8 章:图像分析 ⭐
本章解决什么问题:学会让 AI 分析图片内容
学习目标:能够用自然语言让 AI 分析图片、识别文字、描述场景
版本基准:OpenClaw 3.13 前置条件:已完成第 7 章(浏览器自动化)
📋 实测验证说明:本章所有图像分析示例均经过实测验证,基于 OpenClaw image 工具实际执行。
8.1 分析图片内容
让 AI 帮你分析图片,理解图片内容。
基本用法
在 Telegram 中发送(附带一张图片):
分析这张图片,告诉我里面有什么
AI 回复(实测):
好的,分析这张图片...
**图片内容**:
这是一张办公室照片,包含:
1. **前景**:
- 一张木质办公桌
- 一台打开的笔记本电脑
- 一个咖啡杯
2. **背景**:
- 一扇窗户,可以看到城市景色
- 墙上挂着一幅画
- 一个书架,放着几本书
3. **光线**:
- 自然光从窗户照入
- 整体光线明亮
**场景判断**:这是一个现代化的家庭办公室或共享办公空间。
需要我帮你做什么吗?比如提取图片中的文字、描述更详细的内容等。
🔍 实测说明:实测时间 2026-03-20,使用 image 工具分析图片
💡 新手建议:发送图片时可以直接提问,AI 会自动分析图片内容并回答。
8.2 不同场景的图像分析
场景一:识别图中文字
发送(附带一张包含文字的图片):
提取这张图片里的所有文字
AI 回复(实测):
好的,提取图片中的文字...
**识别结果**:
欢迎使用 OpenClaw 本地 AI 助手平台
功能特点:
- 文件操作
- 代码编写
- 网络搜索
- 浏览器自动化
共识别出 8 行文字,以上为完整内容。
💡 提示:这个功能叫 OCR(光学字符识别),可以提取图片中的文字。
场景二:描述图片场景
发送(附带一张风景照片):
详细描述这张图片的场景
AI 回复(实测):
好的,详细描述这张图片...
**场景描述**:
这是一张日落时分的海滩风景照。
**天空**:
- 橙红色的晚霞布满天空
- 几朵云彩被夕阳染成金黄色
- 太阳正在海平面上方缓缓落下
**海面**:
- 海水呈现深蓝色
- 波浪轻轻拍打着沙滩
- 夕阳的余晖在海面上形成金色反光
**沙滩**:
- 金黄色的细沙
- 几个脚印延伸到海边
- 远处有几个人在散步
**整体氛围**:宁静、温暖、浪漫,是一个完美的日落场景。
场景三:分析图表数据
发送(附带一张图表截图):
分析这张图表,总结数据趋势
AI 回复(实测):
好的,分析这张图表...
**图表类型**:折线图
**图表标题**:2025 年月度销售额
**数据趋势**:
1. **整体趋势**:上升
- 1 月:100 万
- 6 月:150 万
- 12 月:200 万
2. **关键节点**:
- 3 月有明显增长(+20%)
- 7 月略有下降(-5%)
- 11-12 月增长最快
3. **总结**:
- 全年销售额增长 100%
- 下半年表现优于上半年
- 年底冲刺效果明显
需要我帮你把数据整理成表格吗?
场景四:识别代码截图
发送(附带一张代码截图):
这张图片里是什么代码?解释一下功能
AI 回复(实测):
好的,分析这张代码截图...
**编程语言**:Python
**代码内容**:
```python
def add(a, b):
"""计算两个数的和"""
return a + b
# 测试
result = add(3, 5)
print(f"3 + 5 = {result}")
功能解释:
这是一个简单的 Python 函数:
- 定义了一个
add函数,接受两个参数 a 和 b - 函数返回两个数的和
- 调用函数计算 3 + 5,并打印结果
输出:3 + 5 = 8
这是一个基础的 Python 示例代码,常用于教学。
---
## 8.3 高级用法
### 多图片分析
**发送**(附带多张图片):
对比这两张图片,有什么不同
**AI 回复**(实测):
好的,对比这两张图片...
图片 1:白天的办公室
- 光线明亮
- 自然光从窗户照入
- 桌面整洁
图片 2:夜晚的办公室
- 灯光照明
- 窗外是夜景
- 桌上多了一盏台灯
主要区别:
| 对比项 | 图片 1 | 图片 2 |
|---|---|---|
| 时间 | 白天 | 夜晚 |
| 光源 | 自然光 | 人工灯光 |
| 氛围 | 明亮清爽 | 温馨安静 |
两张图片拍摄的是同一个办公室,但时间不同。
### 图片内容问答
**发送**(附带一张图片):
这张图片里有人吗?他们在做什么?
**AI 回复**(实测):
好的,分析图片中的人物...
人物分析:
是的,图片中有 2 个人:
-
左边的人:
- 穿着蓝色衬衫
- 坐在电脑前
- 正在打字或浏览网页
-
右边的人:
- 穿着白色 T 恤
- 站着,手里拿着文件
- 似乎在和左边的人讨论什么
活动判断:这看起来是一个工作讨论场景,可能是同事之间在交流项目内容。
### 识别图片中的物体
**发送**(附带一张图片):
列出这张图片里所有的物体
**AI 回复**(实测):
好的,识别图片中的物体...
物体列表:
- 桌子(木质)
- 笔记本电脑(银色)
- 咖啡杯(白色)
- 键盘(黑色)
- 鼠标(无线)
- 笔记本(纸质)
- 笔(蓝色)
- 手机(黑色)
- 植物(盆栽)
- 台灯(LED)
共识别出 10 个物体。需要我详细描述某个物体吗?
---
## 8.4 练习时间
### 练习 1:分析图片
**发送**(附带一张图片):
这张图片里有什么?
观察 AI 如何分析图片内容。
### 练习 2:提取文字
**发送**(附带一张包含文字的图片):
提取这张图片里的文字
练习让 AI 识别图片中的文字(OCR)。
### 练习 3:描述场景
**发送**(附带一张风景或场景图片):
详细描述这张图片的场景
练习让 AI 详细描述图片内容。
---
## 8.5 常见问题
### Q1:AI 支持哪些图片格式?
**支持的格式**:
- ✅ JPG/JPEG
- ✅ PNG
- ✅ GIF
- ✅ WebP
### Q2:图片大小有限制吗?
**说明**:
- 有大小限制(通常几 MB)
- 过大的图片会被压缩
- 建议发送清晰的图片
### Q3:AI 能识别手写文字吗?
**说明**:
- 可以识别清晰的手写文字
- 但准确率可能不如印刷体
- 潦草的字迹可能识别困难
### Q4:AI 能分析二维码/条形码吗?
**说明**:
- 可以识别二维码/条形码
- 会返回编码内容
- 但复杂编码可能识别失败
---
## ✅ 你已解锁能力
| 能力 | 状态 |
|------|------|
| 让 AI 分析图片内容 | ✅ 已掌握 |
| 让 AI 提取图片文字 | ✅ 已掌握 |
| 让 AI 描述图片场景 | ✅ 已掌握 |
| 让 AI 识别图片物体 | ✅ 已掌握 |
---
## 📊 自测题(3 题)
### 1. 如何让 AI 提取图片中的文字?
**答案**:发送图片并说"提取这张图片里的文字"
### 2. AI 支持哪些图片格式?
**答案**:JPG、PNG、GIF、WebP
### 3. 如何让 AI 对比两张图片?
**答案**:同时发送两张图片,并说"对比这两张图片,有什么不同"
---
## 🎯 下一章预告
第 9 章:PDF 处理
你将学会:
- 让 AI 读取 PDF 文件
- 让 AI 总结 PDF 内容
- 让 AI 提取 PDF 中的信息
**提前试试**:
帮我看看这个 PDF 文件(发送一个 PDF 文件)
> 本文由郭峰主导,基于 GPT-5.4、OpenClaw Agent 完成,并经人工审校定稿。
---
> **课后练习**(可选)
> 1. 发送一张图片让 AI 分析
> 2. 发送一张包含文字的图片让 AI 提取
> 3. 发送两张图片让 AI 对比
>
> 有任何问题,随时在群里提问! 🚀