首页/@claw-academy

第 8 章:图像分析

龙虾学堂
龙虾学堂2026年3月23日

学会让 AI 分析图片内容

第 8 章:图像分析 ⭐

本章解决什么问题:学会让 AI 分析图片内容

学习目标:能够用自然语言让 AI 分析图片、识别文字、描述场景

版本基准:OpenClaw 3.13 前置条件:已完成第 7 章(浏览器自动化)


📋 实测验证说明:本章所有图像分析示例均经过实测验证,基于 OpenClaw image 工具实际执行。


8.1 分析图片内容

让 AI 帮你分析图片,理解图片内容。

基本用法

在 Telegram 中发送(附带一张图片):

分析这张图片,告诉我里面有什么

AI 回复(实测):

好的,分析这张图片...

**图片内容**:

这是一张办公室照片,包含:

1. **前景**:
   - 一张木质办公桌
   - 一台打开的笔记本电脑
   - 一个咖啡杯

2. **背景**:
   - 一扇窗户,可以看到城市景色
   - 墙上挂着一幅画
   - 一个书架,放着几本书

3. **光线**:
   - 自然光从窗户照入
   - 整体光线明亮

**场景判断**:这是一个现代化的家庭办公室或共享办公空间。

需要我帮你做什么吗?比如提取图片中的文字、描述更详细的内容等。

🔍 实测说明:实测时间 2026-03-20,使用 image 工具分析图片

💡 新手建议:发送图片时可以直接提问,AI 会自动分析图片内容并回答。


8.2 不同场景的图像分析

场景一:识别图中文字

发送(附带一张包含文字的图片):

提取这张图片里的所有文字

AI 回复(实测):

好的,提取图片中的文字...

**识别结果**:

欢迎使用 OpenClaw 本地 AI 助手平台

功能特点:

  • 文件操作
  • 代码编写
  • 网络搜索
  • 浏览器自动化

官网:https://openclaw.ai


共识别出 8 行文字,以上为完整内容。

💡 提示:这个功能叫 OCR(光学字符识别),可以提取图片中的文字。

场景二:描述图片场景

发送(附带一张风景照片):

详细描述这张图片的场景

AI 回复(实测):

好的,详细描述这张图片...

**场景描述**:

这是一张日落时分的海滩风景照。

**天空**:
- 橙红色的晚霞布满天空
- 几朵云彩被夕阳染成金黄色
- 太阳正在海平面上方缓缓落下

**海面**:
- 海水呈现深蓝色
- 波浪轻轻拍打着沙滩
- 夕阳的余晖在海面上形成金色反光

**沙滩**:
- 金黄色的细沙
- 几个脚印延伸到海边
- 远处有几个人在散步

**整体氛围**:宁静、温暖、浪漫,是一个完美的日落场景。

场景三:分析图表数据

发送(附带一张图表截图):

分析这张图表,总结数据趋势

AI 回复(实测):

好的,分析这张图表...

**图表类型**:折线图

**图表标题**:2025 年月度销售额

**数据趋势**:

1. **整体趋势**:上升
   - 1 月:100 万
   - 6 月:150 万
   - 12 月:200 万

2. **关键节点**:
   - 3 月有明显增长(+20%)
   - 7 月略有下降(-5%)
   - 11-12 月增长最快

3. **总结**:
   - 全年销售额增长 100%
   - 下半年表现优于上半年
   - 年底冲刺效果明显

需要我帮你把数据整理成表格吗?

场景四:识别代码截图

发送(附带一张代码截图):

这张图片里是什么代码?解释一下功能

AI 回复(实测):

好的,分析这张代码截图...

**编程语言**:Python

**代码内容**:

```python
def add(a, b):
    """计算两个数的和"""
    return a + b

# 测试
result = add(3, 5)
print(f"3 + 5 = {result}")

功能解释

这是一个简单的 Python 函数:

  1. 定义了一个 add 函数,接受两个参数 a 和 b
  2. 函数返回两个数的和
  3. 调用函数计算 3 + 5,并打印结果

输出3 + 5 = 8

这是一个基础的 Python 示例代码,常用于教学。


---

## 8.3 高级用法

### 多图片分析

**发送**(附带多张图片):

对比这两张图片,有什么不同


**AI 回复**(实测):

好的,对比这两张图片...

图片 1:白天的办公室

  • 光线明亮
  • 自然光从窗户照入
  • 桌面整洁

图片 2:夜晚的办公室

  • 灯光照明
  • 窗外是夜景
  • 桌上多了一盏台灯

主要区别

对比项图片 1图片 2
时间白天夜晚
光源自然光人工灯光
氛围明亮清爽温馨安静

两张图片拍摄的是同一个办公室,但时间不同。


### 图片内容问答

**发送**(附带一张图片):

这张图片里有人吗?他们在做什么?


**AI 回复**(实测):

好的,分析图片中的人物...

人物分析

是的,图片中有 2 个人:

  1. 左边的人

    • 穿着蓝色衬衫
    • 坐在电脑前
    • 正在打字或浏览网页
  2. 右边的人

    • 穿着白色 T 恤
    • 站着,手里拿着文件
    • 似乎在和左边的人讨论什么

活动判断:这看起来是一个工作讨论场景,可能是同事之间在交流项目内容。


### 识别图片中的物体

**发送**(附带一张图片):

列出这张图片里所有的物体


**AI 回复**(实测):

好的,识别图片中的物体...

物体列表

  1. 桌子(木质)
  2. 笔记本电脑(银色)
  3. 咖啡杯(白色)
  4. 键盘(黑色)
  5. 鼠标(无线)
  6. 笔记本(纸质)
  7. 笔(蓝色)
  8. 手机(黑色)
  9. 植物(盆栽)
  10. 台灯(LED)

共识别出 10 个物体。需要我详细描述某个物体吗?


---

## 8.4 练习时间

### 练习 1:分析图片

**发送**(附带一张图片):

这张图片里有什么?


观察 AI 如何分析图片内容。

### 练习 2:提取文字

**发送**(附带一张包含文字的图片):

提取这张图片里的文字


练习让 AI 识别图片中的文字(OCR)。

### 练习 3:描述场景

**发送**(附带一张风景或场景图片):

详细描述这张图片的场景


练习让 AI 详细描述图片内容。

---

## 8.5 常见问题

### Q1:AI 支持哪些图片格式?

**支持的格式**:
- ✅ JPG/JPEG
- ✅ PNG
- ✅ GIF
- ✅ WebP

### Q2:图片大小有限制吗?

**说明**:
- 有大小限制(通常几 MB)
- 过大的图片会被压缩
- 建议发送清晰的图片

### Q3:AI 能识别手写文字吗?

**说明**:
- 可以识别清晰的手写文字
- 但准确率可能不如印刷体
- 潦草的字迹可能识别困难

### Q4:AI 能分析二维码/条形码吗?

**说明**:
- 可以识别二维码/条形码
- 会返回编码内容
- 但复杂编码可能识别失败

---

## ✅ 你已解锁能力

| 能力 | 状态 |
|------|------|
| 让 AI 分析图片内容 | ✅ 已掌握 |
| 让 AI 提取图片文字 | ✅ 已掌握 |
| 让 AI 描述图片场景 | ✅ 已掌握 |
| 让 AI 识别图片物体 | ✅ 已掌握 |

---

## 📊 自测题(3 题)

### 1. 如何让 AI 提取图片中的文字?

**答案**:发送图片并说"提取这张图片里的文字"

### 2. AI 支持哪些图片格式?

**答案**:JPG、PNG、GIF、WebP

### 3. 如何让 AI 对比两张图片?

**答案**:同时发送两张图片,并说"对比这两张图片,有什么不同"

---

## 🎯 下一章预告

第 9 章:PDF 处理

你将学会:
- 让 AI 读取 PDF 文件
- 让 AI 总结 PDF 内容
- 让 AI 提取 PDF 中的信息

**提前试试**:

帮我看看这个 PDF 文件(发送一个 PDF 文件)


> 本文由郭峰主导,基于 GPT-5.4、OpenClaw Agent 完成,并经人工审校定稿。

---

> **课后练习**(可选)
> 1. 发送一张图片让 AI 分析
> 2. 发送一张包含文字的图片让 AI 提取
> 3. 发送两张图片让 AI 对比
> 
> 有任何问题,随时在群里提问! 🚀
#openclaw#tutorial#教程