L0 第 3 篇 🥚 难度 🕒 12 分钟

AI 现在到底能做什么、不能做什么——用真实例子说话

不要再听吹牛和黑稿了，我们一条一条核对：哪些事 AI 已经做得比你好，哪些事它彻底做不了。

阿

阿莱

2026/5/29

聊 AI 这件事，社交媒体上有两派人在打架。

一派天天发”AI 又取代了 XX 行业！设计师/程序员/翻译/老师马上失业！“——配上一个吓人的截图。

另一派天天发”AI 还是不行啊，连 9.11 和 9.9 谁大都搞错”——配上一个翻车的截图。

两派都不在解决问题。 因为 AI 能力本来就是不均匀的：在某些事上已经远超普通人，在另一些事上还不如小学生。你需要一份靠谱的清单，知道哪些事可以放心交给它、哪些事千万别交给它。

我们就来对一对这份清单。

✅ AI 已经做得很好（甚至比你强）

1. 写普通文字

写邮件、写产品文案、写工作汇报、写公众号文章、改简历、翻译、润色——这些 AI 已经能做到专业写作者 70-90 分的水平。

真实例子：知乎 / 小红书的”运营号”很多已经被 AI 接管。一个人配 1 个 AI 可以产出过去 10 个人的内容量。

但请注意：“写得通顺”不等于”写得对”——AI 可能把你的产品功能描述错。事实部分永远需要你自己核验。

2. 总结和提取信息

把一篇 5000 字的论文压成 300 字摘要、从一份合同里抠出关键条款、把一个 1 小时的会议录音变成会议纪要——这是 AI 的强项。

真实例子：律师事务所现在普遍用 AI 做”合同初审”，过去 4 小时的工作 20 分钟出活，律师只需要核对关键点。

3. 编程辅助

写常见的样板代码、调试报错、解释别人的代码、给一个糟糕的代码做重构建议——AI 在这上面像个不知疲倦的资深同事。

真实例子：Cursor、GitHub Copilot 这类工具让有经验程序员的开发效率提升 30-100%。在工程问题上，AI 已经是事实标配。

注意：对完全不会写代码的人帮助有限——你不知道它写得对不对。

4. 翻译

中英互译、英日互译……尤其是商务/技术文本，AI 翻译已经超过 95% 的人类译者。文学翻译仍然不行。

真实例子：DeepL、Google Translate + GPT 已经让很多商业翻译公司转型或裁员。

5. 一些专业医疗判断

放射科 AI 看 CT/X 光，识别恶性肿瘤的准确率已经接近资深放射科医生。皮肤癌图像识别在某些任务上超过皮肤科医生。

真实例子：中国部分大医院的影像科已经把 AI 作为”第二读片人”——AI 先扫一遍标出可疑区域，医生只看 AI 标出的。

但请注意：AI 是辅助工具，最终决策仍然是医生——出了事要医生负责。

6. 客服和咨询的”前道”

回答常见问题、引导用户、初步分诊问题——AI 在这里完全可以扛。

真实例子：电商和金融 App 的客服窗口，80% 的问题已经被 AI 直接消化，只有复杂的才转人工。

7. 创意头脑风暴

想 100 个名字、起 100 个标题、列 30 种活动方案——AI 在”广度”上远超人类。它的点子可能不是最好的，但能帮你打破思维定势。

8. 视觉创作

Midjourney / Stable Diffusion / Sora / DALL-E 这些已经能做到普通商业插画师 70-80 分水平。logo、社交媒体配图、概念图、营销视觉——很多场景下已经够用。

9. 围棋、象棋、电竞这类有明确规则的游戏

AlphaGo 不用解释，已经全面碾压人类。

10. 一些科学发现

AlphaFold 预测了所有已知生物的全部蛋白质 3D 结构（2 亿+）。这件事生物学家手动做了 50 年才做完 17 万个。Google DeepMind 因此拿了 2024 年诺贝尔化学奖。

💡 共同特点

你注意到了吗？AI 厉害的领域有一个共同特点：有海量的训练数据。文字、代码、医学影像、棋谱、蛋白质数据——都是积累了几十年的大型数据集。

⚠️ AI 能做，但要非常小心

1. 任何涉及”事实”的问答

它会瞎编。这就是”幻觉”——它说得头头是道，但内容是假的。

例子：让它列”中国南北朝时期的著名书法家”，它能给你五个名字，听起来都很真——但其中两三个可能是它编的。

怎么应对：① 永远不要让 AI 做你没办法验证的事实查询；② 给它充足的源材料让它做”基于材料的回答”而不是”基于记忆的回答”——这就是 RAG 的思路。

2. 算数和计算

GPT-4 算 245 × 367 经常算错（不是因为它笨，是它的处理机制不擅长精确算术）。

怎么应对：让它写代码算而不是直接算。"用 Python 计算 245 × 367"，它会写一行代码出来，结果就准了。

3. 实时信息

它训练截止某个日期。问”今天美股开盘了吗”、“昨天 NBA 谁赢了”——它要么不知道，要么编。

怎么应对：用带网页搜索的 AI（Perplexity、有联网的 ChatGPT/Claude）。

4. 涉及伦理判断的事

“我该不该离婚”、“我该不该报警”、“我该不该裁掉这个员工”——AI 给出的答案可能听起来很有道理，但它本质上是统计意义上的”大家可能怎么想”，不是真正的伦理思考。

怎么应对：当成”一个普通朋友的看法”，绝不当做最终建议。

5. 你的个人隐私

把公司机密、客户数据、个人病历贴进 ChatGPT——这些数据可能被记录、可能被用于训练。

怎么应对：付费版本通常承诺不训练；敏感数据上私有部署（公司内自建）；最敏感的事最好别让 AI 碰。

❌ AI 现在还做不了

1. 真正的因果推理

AI 是”相关性的高手、因果性的盲人”。它知道”鸡叫之后天亮”，但分不清是鸡叫导致天亮还是天亮导致鸡叫。

真实例子：让 AI 做医学诊断”为什么这个病人发烧”——它能列出可能的病因，但分不清是病因还是症状。

2. 长期规划和执行

“帮我做一个为期 3 个月的减肥计划”——它能列出计划。但让它自己跟踪 3 个月、根据进展调整、提醒你——做不到（至少在没有工程化包装的情况下）。

当下的 AI Agent 在这方面进步很快，但稳定执行多步骤、长周期任务仍然是个 hard problem。

3. 情感共鸣

你失恋了对 AI 倾诉，它能说出非常恰当的安慰话——但它没在感受。它输出的”理解”是一种模拟。

这件事的伦理含义远不止你以为的那么简单。

4. 创造真正”新”的东西

AI 能在已有的风格里组合出无穷变化（“以梵高的风格画一只猫”），但它无法成为下一个梵高——因为它的所有”理解”都来自已有的人类作品。

诺贝尔物理学奖那种突破性思想，AI 暂时还做不到。

5. 物理世界里的具身任务

让一个机器人在陌生家里给你倒杯水？目前还非常困难。视觉理解 + 运动控制 + 常识推理的组合远没成熟。

特斯拉的人形机器人 Optimus、波士顿动力的 Atlas——都还在演示阶段，距离实用还远。

6. 在没有数据的领域里工作

让 AI 帮你诊断一种全新的疾病（训练数据里没有）——它会很自信地给你一个错误答案。它在已知模式里很厉害，在真正未知的领域里很糟糕。

7. 真正理解它说的话

这是个哲学问题，但有现实影响。当 AI 说”我理解你的感受”时，它没在理解任何东西——它只是在输出统计上最可能的字符序列。

这并不让它没用，但你应该带着这个认知去使用它。

一张速查表

任务	建议
写邮件/文案/翻译	✅ 大胆用
总结长文/会议纪要	✅ 大胆用
编程辅助	✅ 大胆用（懂代码的话）
创意头脑风暴	✅ 大胆用
起标题/想名字	✅ 大胆用
学新东西/查资料	⚠️ 用，但要求它列出处
算数计算	⚠️ 让它写代码算，不要直接算
写代码（你不懂代码）	⚠️ 危险
医疗建议	⚠️ 可以问，但必须看医生
法律建议	⚠️ 可以问，但必须找律师
投资建议	❌ 别
重大人生决定	❌ 别
涉密信息	❌ 别

一句话总结

AI 是一个博学但不专业、流畅但不严谨、自信但不可靠的助手。

用它的”博学和流畅”提高你的效率，但所有”严谨和可靠”的部分必须你自己来。

💡 一个心法

永远把 AI 当一个聪明的实习生，不是当一个权威专家。 它能帮你干很多活，但你要为它的产出负责。

下一篇：《“幻觉”是什么、为什么会发生、怎么减轻》——讲清楚为什么 AI 会一本正经地胡说八道。

🔗 被以下 5 篇文章引用

📬

读到这里说明你认真在学 🎯

订阅每周精选 —— 下一篇新文章 / 新可视化第一时间送到邮箱。

💬

讨论区

· 用 GitHub 账号登录评论

⚠️ Giscus 评论未配置 —— 在 src/components/Comments.astro 顶部填入仓库 ID 和分类 ID（见组件注释里的配置步骤）。