能工智人的传习录

知行合一,以 AI 炼器

记录 AI 实践、技术思考与生活点滴

水彩插画:木质书桌上的笔记本电脑,屏幕显示批量处理脚本,左侧输入文件,右侧输出文件

Day 6 练习:批量处理实战——选一个场景跑通

这是「AI 之路进阶升级指南」第二周 Day 6 的配套练习。你需要先完成 Day 5,再回来动手。 Day 5 你写了 read_file() 函数和批量脚本骨架。现在脚本能识别各种格式的文件了。但还没真正跑过一次完整流程:选场景、调 API、保存结果,这个链路还没串起来。 ...

2026-06-13 · 6 分钟 · Alex Wang
水彩插画:各种文件(PDF、Word、CSV)像积木一样被投入一个漏斗,另一端流出整齐的文本

Day 5 练习:让脚本读懂更多格式的文件

这是「AI 之路进阶升级指南」第二周 Day 5 的配套练习。你需要先读完 Part 2,再回来动手。 Part 2 的 batch_summarize.py 能批量处理 .md 和 .txt 文件。但真实文件远不止这两种。PDF 报告、Word 合同、CSV 数据表、JSON 配置文件——它们就在你的桌面上,脚本却读不了。 ...

2026-06-12 · 5 分钟 · Alex Wang
水彩插画:传送带将杂乱纸张送入笔记本电脑,另一侧输出整齐汇总表

AI 之路进阶升级指南(二):从一次调用到批量处理——让程序替你干 100 件事

这是「AI 之路进阶升级指南」系列第二篇。你需要先完成 Part 1 和前三天的练习(Day 1、Day 2、Day 3)。 Part 1 里你学会了让程序帮你问 AI 一个问题。今天要做点不一样的:让程序替你问 AI 一百个问题。 ...

2026-06-09 · 9 分钟 · Alex Wang
水彩插画:笔记本上的温度参数实验记录

Day 3 练习:API 参数实验

这是「AI 之路进阶升级指南」第一周 Day 3 的配套练习。你需要先完成 Day 1。Part 1 里讲了参数的理论(「理解 API 参数」),今天动手验证。 Part 1 读了参数理论,但没有亲手试过,那些只是文字。今天做三个实验,亲眼看看参数如何影响输出。 ...

2026-06-08 · 3 分钟 · Alex Wang

omo vs oms:Fallback 链深度解析

本文是《当你的 AI 编程工具需要三套配置》的下篇。上篇介绍了三套配置的方案设计、文件结构和编排理念,本文聚焦 fallback 链的机制差异和配置实践。 文中 omo = oh-my-openagent,oms = oh-my-opencode-slim。模型和 provider 名称已脱敏为 provider-a/model-x 等泛化名称。 ...

2026-06-07 · 11 分钟 · Alex Wang
水彩风格:笔记本屏幕并排两个终端窗口,左暖琥珀右冷蓝绿,桌上有笔记本、token珠子、茶杯和两张打勾便利贴

Day 2 练习:用聚合平台跑通同一个请求

这是「AI 之路进阶升级指南」第一周 Day 2 的配套练习。你需要先完成 Day 1。 昨天你用 DeepSeek 官方 API 跑通了第一段代码。今天做一件事:换一个平台,用同样的代码,改两个参数,再跑一次。 ...

2026-06-06 · 3 分钟 · Alex Wang

当你的 AI 编程工具需要三套配置

为什么我需要三套 OpenCode 配置 我的 ~/.config/opencode/ 目录下有三个 opencode.json。起因很简单:我想同时跑 oh-my-openagent(以下简称 omo)和 oh-my-opencode-slim(以下简称 oms),对比着用,搞清楚各自的边界在哪。 ...

2026-06-05 · 8 分钟 · Alex Wang

今日停更一天

休息一天。明天继续。

2026-06-04 · 1 分钟 · Alex Wang
水彩风格:笔记本电脑终端亮起一行金色AI回复,桌上有笔记本、token珠子、茶杯和打勾的便利贴

Day 1 练习:跑通你的第一段 API 代码

这是「AI 之路进阶升级指南」第一周 Day 1 的配套练习。你需要先读完 Part 1,再回来动手。 今天只做一件事:跑通 Part 1 里的 hello_api.py,在终端看到 AI 回复你一句话。 ...

2026-06-02 · 2 分钟 · Alex Wang
一张看似完美的实验报告被放大镜照出两处设计缺陷:rubric 偏向变量、场景覆盖不足

AI 设计的实验,你得自己审

系列:AI Agent 实验方法论(第三篇) 上一篇:实验设计没毛病,LLM 为什么还是翻车了 TL;DR: 双盲实验 B 赢了 4/4,数据漂亮。但审设计时发现 rubric 有 3/8 维度直接测试被测变量,超过 1/3 上限,差点变成自我验证;另一个验证里一个场景满分、另一个才暴露缺陷,只跑一个就宣布通过的话缺陷就上线了。两个坑都是审设计发现的,不是跑完实验才看见的。 ...

2026-06-01 · 6 分钟 · Alex Wang