置顶

勘误反馈
如果对本博客文章有任何问题(如探讨、建议、文字或逻辑错误等)都可以给我发邮件:

  • 邮件标题:[wds博客问题反馈] - 希望在XXX文章增加一些细节的补充
  • 邮件地址:8851970@qq.com

Read More

回忆AI时代

当下人工智能的发展日新月异,哪怕提笔撰文的片刻间,AI也在飞速迭代。本文回望我们正身处的AI时代,站在未来视角,梳理并审视人工智能一路以来的演变与发展,所以我为这篇文章起的标题是《回忆AI时代》。

世间常有两种态度:有人因相信而看见,有人因看见而相信。于 AI 领域,我属于后者。尤其是今年,人工智能的发展速度堪称日新月异,直观感受尤为强烈。
回溯我的工作经历,早在 2016 年,我便接触并落地智能运维相关工作。彼时行业多以 “智能” 为统称,究其内核,和如今的人工智能并无本质区别,只是叫法不同。直到 ChatGPT 掀起浪潮,“AI” 才成为行业主流词汇。
技术飞速迭代的同时,智能体、Skill 等专业概念层出不穷。我虽大致知晓其用途,却对细节一知半解。为此,我计划通过本文分三大板块,系统梳理、学习 AI 知识:

  • 第一,梳理 AI的发展脉络,回顾行业关键节点、代表人物与重大事件;
  • 第二,拆解AI产业链上下游,研判行业发展趋势,探索如何用好、驾驭 AI;
  • 第三,深入解析当下主流 AI 架构与运行模式,尝试动手搭建模型,吃透底层工作原理。

一 AI的发展脉络

1.1 AI时代重要人物、事件与里程碑
1.2 什么是智能体Agent、Agent工作模式、以及Agent框架

二 拆解AI产业链上下游,研判行业发展趋势

2.1未来AI时代,什么是变化的什么又是不变的?

什么是智能体Agent、Agent工作模式、以及Agent框架

系列文章见: 《回忆AI时代》

什么是智能体

智能体(Agent,也常被称为 AI Agent)是指能够自主感知环境、进行推理和规划,并采取行动以实现特定目标的计算机系统。

Agent 核心能力 AI Agent 工作流程示例(找一台 5000 元以内的笔记本电脑)
🎯 Goal(目标)

👀 Perception(感知)

🧠 Reasoning(推理)

⚡ Action(行动)

💾 Memory(记忆)

📄 Output(输出)
用户提出需求

分析预算与需求

搜索电商网站与评测信息

筛选符合条件的机型

比较配置、价格与优缺点

生成推荐报告

输出最终结果

Agent与大模型区别

大模型(LLM) Agent
主要负责思考和生成文本 负责思考 + 行动
回答问题 完成任务
一次性响应 可连续执行多个步骤
通常不能主动使用工具 可以调用工具和 API
像顾问 像员工/助理

Agent不同的架构模式

https://chatgpt.com/c/6a2d7d85-1128-83ec-961e-94fbd431fb7b

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Agent

├── ReAct
│ ├─ 思考(Reason)
│ └─ 行动(Act)

├── Plan & Execute
│ ├─ 制定计划(Plan)
│ └─ 分步执行(Execute)

├── Multi-Agent
│ ├─ Agent A(规划)
│ ├─ Agent B(执行)
│ ├─ Agent C(评审)
│ └─ Agent D(协调)

└── AI Workflow
├─ 固定流程
├─ 条件判断
├─ 自动化编排
└─ Agent参与执行

ReAct

ReAct来源于2022年发表的论文( https://react-lm.github.io/ ),它的构建思想思考 → 行动 → 观察 → 再思考, 以下为执行过程与案例。

ReAct流程 案例
Question

Thought

Action

Observation

Thought

Answer
用户:新加坡今天会下雨吗?



思考:需要查询天气信息



行动:调用天气 API



观察:返回降雨概率 80%



思考:降雨概率较高,今天可能下雨




回答:今天大概率有雨,建议带伞出门

但它有缺点:

  • 长任务容易失控
  • 不会提前规划

Plan & Excute

ReAct升级版Plan & Excute,发布与2023年。

Plan & Excute流程 案例
Goal

Plan

Task1 / Task2 / Task3

Execute
* 写一篇Transformer教程
* Plan:
1. 收集资料
2. 整理结构
3. 编写内容
4. 审核
* Execute:
逐步完成

Multi-Agent

2023-2024,一个Agent不够,多个Agent协作方式,每个Agent专注一件事。Agent流程与案例:

流程 案例
CEO Agent

├── Research Agent
├── Coding Agent

└── Review Agent
PM Agent

Architect Agent

Developer Agent

Tester Agent

AI Workflow

2024-至今,它不需要让Agent自由思考,而是把流程固定下来,以下流程与案例:

流程 案例
Trigger

Step1

Step2

Step3

Result
用户提问

RAG检索

知识库

LLM总结

返回结果

相关论文、核心思想、作者

范式 核心思想 代表论文 作者 机构
ReAct 一个 Agent 思考 + 行动交替进行 ReAct: Synergizing Reasoning and Acting in Language Models (2022) Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao Princeton University / Google Research
Plan & Execute 先规划,再逐步执行 Plan-and-Solve Prompting (2023) / Plan-and-Execute 系列 Lei Wang, Jiacheng Liu, Xiang Ren(代表论文) University of Southern California (USC) 等
Multi-Agent 多个 Agent 分工协作 AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation Framework (2023) Qingyun Wu, Chi Wang, et al. Microsoft Research
Multi-Agent 多 Agent 协作模拟组织结构 MetaGPT: Meta Programming for Multi-Agent Collaborative Framework (2023) Hongbo Zhang, et al. Independent / Open-source community
Multi-Agent 对话式智能体社会模拟 CAMEL: Communicative Agents for “Mind” Exploration (2023) Guohao Li, et al. 多机构合作
AI Workflow 用流程编排 Agent,而非自由推理 (工程范式,无单一论文)但基础来自 Tool Use / Agent Systems —— 工业界(LangChain / Dify / Microsoft / n8n)
AI Workflow(基础研究) 工具调用与任务分解基础 Toolformer (2023) Timo Schick, et al. Meta AI

Agent框架

主流Agent框架对比

2026主流框架地图。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
                    Agent

┌─────────────────────┼─────────────────────┐
│ │ │
▼ ▼ ▼

LangGraph AutoGen Agents SDK
(Workflow) (Multi-Agent) (OpenAI官方)

│ │ │
▼ ▼ ▼

企业落地 协作Agent Tool Calling


┌────────────────────────────────────┐
│ Low-Code Agent │
└────────────────────────────────────┘

Dify


n8n


Flowise

以下是一些开源的框架拿来就用。

框架 工作方式 项目地址 Agent特点 适合场景
LangChain ReAct + Tool Calling + Chain 组合执行 https://github.com/langchain-ai/langchain 生态最大、组件最全、支持 Tool / Memory / RAG / Agent 快速构建通用 AI Agent、原型开发、RAG + Agent 应用
LlamaIndex 数据索引 + RAG + Query Engine + Agent https://github.com/run-llama/llama_index 强数据层能力,文档/数据库连接能力极强 企业知识库问答、数据检索型 Agent
Haystack Pipeline(流水线)+ Retrieval + QA + Agent扩展 https://github.com/deepset-ai/haystack 工程化强、搜索系统成熟、模块清晰 企业搜索、问答系统、生产级 NLP Pipeline
AutoGen 多Agent对话协作(Role-based conversation) https://github.com/microsoft/autogen 支持多角色 Agent 自动协作、自动拆解任务 多智能体系统、自动编程、研究型任务
CrewAI Role-based Multi-Agent Workflow(角色驱动) https://github.com/crewAIInc/crewAI 简单易用、结构清晰(CEO/Writer/Analyst) 内容生产、自动化任务流、业务流程 Agent

当然也可以自己开发一个基于ReAct的框架,以下是整理资料时看到一个网友分享的手搓基于ReAct框架。

1
https://github.com/MarkTechStation/VideoCode/tree/main/Agent%E7%9A%84%E6%A6%82%E5%BF%B5%E3%80%81%E5%8E%9F%E7%90%86%E4%B8%8E%E6%9E%84%E5%BB%BA%E6%A8%A1%E5%BC%8F

AI时代重要人物、事件与里程碑

系列文章见: 《回忆AI时代》

重要人物 & 重要事件

时间 人物 重要事件 时代背景 相关论文
1943 * 沃伦·麦卡洛克(Warren McCulloch)
* 沃尔特·皮茨(Walter Pitts)
提出人工神经元模型,被视为神经网络的起点。 二战期间,信号处理、自动控制、数理逻辑快速发展,学界开始尝试用数学模型模拟人脑神经活动。 A logical calculus of the ideas immanent in nervous activity
1950 艾伦·图灵(Alan Turing) 发表《计算机器与智能》,提出“图灵测试”。 第一台通用电子计算机问世不久,计算机能力初步显现,学界开始探讨机器是否具备“智能”。 Computing Machinery and Intelligence
1956 * 约翰·麦卡锡(John McCarthy)
* 马文·明斯基(Marvin Minsky)
达特茅斯会议正式提出“Artificial Intelligence(人工智能)”这一名称。 计算机、逻辑学、神经科学交叉发展,一众学者希望合力打造具备人类思维能力的机器,AI 学科正式诞生。 (会议论文集,无单一标题)
1957 弗兰克·罗森布拉特(Frank Rosenblatt) 发明感知机(Perceptron),推动早期神经网络研究。 人工智能处于发展初期,受MP神经元模型启发,研究者尝试搭建可自主学习的简易人工神经网络。 The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain(1958正式发表)
1966 约瑟夫·魏泽鲍姆(Joseph Weizenbaum) 开发聊天程序 ELIZA,展示了人机对话的潜力。 早期AI聚焦自然语言交互,受限于技术,仅能依靠关键词匹配实现简单对话,是人机交互的初步探索。 ELIZA — A Computer Program For the Study of Natural Language Communication Between Man and Machine
1974–1980 —— 第一次“AI 寒冬”,由于算力和数据不足,研究热度下降。 硬件算力薄弱、算法局限性凸显,早期AI无法落地复杂场景,政府与资本削减科研经费,研究陷入停滞。 ——
1980年代 爱德华·费根鲍姆(Edward Feigenbaum) 专家系统兴起,AI 开始在商业领域应用。 学界转向实用化方向,依托行业知识库打造专用AI系统,在医疗、工业、金融等领域落地,迎来短期复苏。 The Fifth Generation: Artificial Intelligence and Japan’s Computer Challenge to the World(1983)
1986 * 杰弗里·辛顿(Geoffrey Hinton)
* 大卫·鲁梅尔哈特(David Rumelhart)
推广反向传播算法,使多层神经网络训练成为可能。 单层感知机缺陷明显,多层网络难以训练,反向传播算法突破这一瓶颈,为深度网络发展打下算法基础。 Learning representations by back-propagating errors
1997 IBM Deep Blue 团队 “深蓝”击败国际象棋世界冠军卡斯帕罗夫,AI 首次在复杂博弈中战胜人类顶尖选手。 计算机硬件性能大幅提升,算力足以支撑大规模穷举搜索,AI 在规则明确的博弈领域实现重大突破。 Deep Blue: An Artificial Intelligence Chess System
2006 杰弗里·辛顿(Geoffrey Hinton) 提出深度信念网络(DBN)等方法,“深度学习”概念重新兴起。 传统浅层机器学习遇到性能天花板,辛顿解决了深度网络训练的梯度消失问题,唤醒沉寂多年的神经网络研究。 A Fast Learning Algorithm for Deep Belief Nets
2012 * 亚历克斯·克里热夫斯基(Alex Krizhevsky)
* 杰弗里·辛顿(Geoffrey Hinton)
AlexNet 在 ImageNet 竞赛中大幅领先,深度学习进入主流。 互联网积累海量图像数据,GPU 并行计算普及,深度学习在视觉任务上碾压传统算法,行业全面转向深度模型。 ImageNet Classification with Deep Convolutional Neural Networks
2014 伊恩·古德费洛(Ian Goodfellow) 提出生成对抗网络(GAN),推动生成式 AI 发展。 判别式模型日趋成熟,学界开始探索机器“创作”能力,GAN 利用对抗思想大幅提升图像、文本生成效果。 Generative Adversarial Nets
2016 DeepMind 团队(Demis Hassabis 等) AlphaGo 战胜围棋冠军李世石,震动全球。 围棋规则复杂、组合无穷,传统搜索算法难以胜任,AlphaGo 结合深度学习与强化学习,打破大众对AI能力的认知。 Mastering the game of Go with deep neural networks and tree search
2017 Vaswani 等 Google 研究者 发表《Attention Is All You Need》,提出 Transformer 架构,奠定现代大模型基础。 循环神经网络处理长文本效率低,注意力机制被提出,Transformer 架构适配并行计算,成为自然语言处理核心框架。 Attention Is All You Need
2018 OpenAI 团队 发布 GPT,展示大规模语言模型的潜力。 Transformer 架构成熟,互联网海量文本数据可用于预训练,大参数语言模型开始展现强大的语言理解与生成能力。 Improving Language Understanding by Generative Pre-Training
2020 OpenAI 团队 发布 GPT-3,参数规模和生成能力大幅提升。 算力集群、大数据、预训练技术全面成熟,行业开始走向超大规模参数模型路线,通用人工智能初见雏形。 *Language Models are Few-Shot Learners
2022 OpenAI 团队 ChatGPT 发布,生成式 AI 进入大众视野。 对话优化、指令微调技术落地,大模型交互体验大幅提升,AI 从科研、产业走向普通用户。 Training Language Models to Follow Instructions with Human Feedback(InstructGPT,ChatGPT核心技术)
2023 OpenAI、Anthropic、Google DeepMind 等 大模型竞赛加速,GPT-4、Claude、Gemini 等模型推动 AI 应用爆发。 全球科技企业争相布局通用大模型,技术快速迭代,AI 渗透办公、创作、工业、生活等全场景。 GPT-4 Technical Report(OpenAI)
Claude 2 Technical Overview(Anthropic)
Gemini: A Family of Highly Capable Multimodal Models(Google)

Read More

新加坡地理

新加坡🇸🇬工作与生活指南: 系列文章概览

新加坡建国初期土面积约为581.5平方公里而截至今天,新加坡面积已增加到约735平方公里。新加坡从20世纪60年代开始大规模填海,以下都是通过填海扩展出来的土地:

  • 东海岸地区(East Coast)
  • 裕廊工业区
  • 樟宜机场所在地
  • 滨海湾(Marina Bay)地区
  • 大士(Tuas)港口地区

以下照片是新加坡老巴刹食阁,1970年时与现在(2026年)的对比,远处的海现在已经是叫滨海湾。
老巴刹

新加坡由1个主岛和60多个离岛组成。主要岛屿包括:

  • Pulau Ujong(新加坡本岛)
  • Sentosa(圣淘沙岛)
  • Jurong Island(裕廊岛)
  • Pulau Tekong(德光岛)

全国划分为五个社区(行政区),中区社区(人口120万),东北社区(人口130万),西北社区(人口83万),东南社区(人口84万),西南社区(人口83万),由相应的社区发展理事会(简称社理会)管理。

老巴刹

日志生成报告工具

我用的是hexo管理博客系统,所以需要一个数据统计工具,最近发现这个工具生成的页面还是挺好看的。

生成报告截图

GoAccess 是一个轻量级的Web日志分析工具,可以直接分析:

Nginx
Apache
Caddy
HAProxy

日志并生成:
UV(独立访客)
PV(访问量)
热门页面
热门 IP
404 页面
浏览器统计
搜索来源
国家地区(GeoIP)

以我Linux系统为例,工具安装:

1
yum install goaccess

生成报告:

1
2
3
goaccess /www/wwwlogs/blog.puppeter.com.log \
-o /www/wwwroot/blog.puppeter.com/blog/public/report.html \
--log-format=COMBINED