<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>双盲实验 on 能工智人的传习录</title><link>https://blog.chuanxilu.net/tags/%E5%8F%8C%E7%9B%B2%E5%AE%9E%E9%AA%8C/</link><description>Recent content in 双盲实验 on 能工智人的传习录</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Fri, 29 May 2026 10:00:00 +0800</lastBuildDate><atom:link href="https://blog.chuanxilu.net/tags/%E5%8F%8C%E7%9B%B2%E5%AE%9E%E9%AA%8C/index.xml" rel="self" type="application/rss+xml"/><item><title>如何用双盲实验验证 skill 改动的有效性</title><link>https://blog.chuanxilu.net/posts/2026/05/double-blind-experiment-ai-prompt-validation/</link><pubDate>Fri, 29 May 2026 10:00:00 +0800</pubDate><guid>https://blog.chuanxilu.net/posts/2026/05/double-blind-experiment-ai-prompt-validation/</guid><description>AI skill 的 A/B 测试不是给用户看两个方案测转化率，是让 AI agent 用两个 skill 分别产出结果，再用另一个 AI agent 盲评。我用真实实验数据说明为什么需要双盲，以及如何避免五种失效模式。</description></item></channel></rss>