AI 现在到底能做什么、不能做什么——用真实例子说话
不要再听吹牛和黑稿了,我们一条一条核对:哪些事 AI 已经做得比你好,哪些事它彻底做不了。
聊 AI 这件事,社交媒体上有两派人在打架。
一派天天发”AI 又取代了 XX 行业!设计师/程序员/翻译/老师马上失业!“——配上一个吓人的截图。
另一派天天发”AI 还是不行啊,连 9.11 和 9.9 谁大都搞错”——配上一个翻车的截图。
两派都不在解决问题。 因为 AI 能力本来就是不均匀的:在某些事上已经远超普通人,在另一些事上还不如小学生。你需要一份靠谱的清单,知道哪些事可以放心交给它、哪些事千万别交给它。
我们就来对一对这份清单。
✅ AI 已经做得很好(甚至比你强)
1. 写普通文字
写邮件、写产品文案、写工作汇报、写公众号文章、改简历、翻译、润色——这些 AI 已经能做到专业写作者 70-90 分的水平。
真实例子:知乎 / 小红书的”运营号”很多已经被 AI 接管。一个人配 1 个 AI 可以产出过去 10 个人的内容量。
但请注意:“写得通顺”不等于”写得对”——AI 可能把你的产品功能描述错。事实部分永远需要你自己核验。
2. 总结和提取信息
把一篇 5000 字的论文压成 300 字摘要、从一份合同里抠出关键条款、把一个 1 小时的会议录音变成会议纪要——这是 AI 的强项。
真实例子:律师事务所现在普遍用 AI 做”合同初审”,过去 4 小时的工作 20 分钟出活,律师只需要核对关键点。
3. 编程辅助
写常见的样板代码、调试报错、解释别人的代码、给一个糟糕的代码做重构建议——AI 在这上面像个不知疲倦的资深同事。
真实例子:Cursor、GitHub Copilot 这类工具让有经验程序员的开发效率提升 30-100%。在工程问题上,AI 已经是事实标配。
注意:对完全不会写代码的人帮助有限——你不知道它写得对不对。
4. 翻译
中英互译、英日互译……尤其是商务/技术文本,AI 翻译已经超过 95% 的人类译者。文学翻译仍然不行。
真实例子:DeepL、Google Translate + GPT 已经让很多商业翻译公司转型或裁员。
5. 一些专业医疗判断
放射科 AI 看 CT/X 光,识别恶性肿瘤的准确率已经接近资深放射科医生。皮肤癌图像识别在某些任务上超过皮肤科医生。
真实例子:中国部分大医院的影像科已经把 AI 作为”第二读片人”——AI 先扫一遍标出可疑区域,医生只看 AI 标出的。
但请注意:AI 是辅助工具,最终决策仍然是医生——出了事要医生负责。
6. 客服和咨询的”前道”
回答常见问题、引导用户、初步分诊问题——AI 在这里完全可以扛。
真实例子:电商和金融 App 的客服窗口,80% 的问题已经被 AI 直接消化,只有复杂的才转人工。
7. 创意头脑风暴
想 100 个名字、起 100 个标题、列 30 种活动方案——AI 在”广度”上远超人类。它的点子可能不是最好的,但能帮你打破思维定势。
8. 视觉创作
Midjourney / Stable Diffusion / Sora / DALL-E 这些已经能做到普通商业插画师 70-80 分水平。logo、社交媒体配图、概念图、营销视觉——很多场景下已经够用。
9. 围棋、象棋、电竞这类有明确规则的游戏
AlphaGo 不用解释,已经全面碾压人类。
10. 一些科学发现
AlphaFold 预测了所有已知生物的全部蛋白质 3D 结构(2 亿+)。这件事生物学家手动做了 50 年才做完 17 万个。Google DeepMind 因此拿了 2024 年诺贝尔化学奖。
你注意到了吗?AI 厉害的领域有一个共同特点:有海量的训练数据。文字、代码、医学影像、棋谱、蛋白质数据——都是积累了几十年的大型数据集。
⚠️ AI 能做,但要非常小心
1. 任何涉及”事实”的问答
它会瞎编。这就是”幻觉”——它说得头头是道,但内容是假的。
例子:让它列”中国南北朝时期的著名书法家”,它能给你五个名字,听起来都很真——但其中两三个可能是它编的。
怎么应对:① 永远不要让 AI 做你没办法验证的事实查询;② 给它充足的源材料让它做”基于材料的回答”而不是”基于记忆的回答”——这就是 RAG 的思路。
2. 算数和计算
GPT-4 算 245 × 367 经常算错(不是因为它笨,是它的处理机制不擅长精确算术)。
怎么应对:让它写代码算而不是直接算。"用 Python 计算 245 × 367",它会写一行代码出来,结果就准了。
3. 实时信息
它训练截止某个日期。问”今天美股开盘了吗”、“昨天 NBA 谁赢了”——它要么不知道,要么编。
怎么应对:用带网页搜索的 AI(Perplexity、有联网的 ChatGPT/Claude)。
4. 涉及伦理判断的事
“我该不该离婚”、“我该不该报警”、“我该不该裁掉这个员工”——AI 给出的答案可能听起来很有道理,但它本质上是统计意义上的”大家可能怎么想”,不是真正的伦理思考。
怎么应对:当成”一个普通朋友的看法”,绝不当做最终建议。
5. 你的个人隐私
把公司机密、客户数据、个人病历贴进 ChatGPT——这些数据可能被记录、可能被用于训练。
怎么应对:付费版本通常承诺不训练;敏感数据上私有部署(公司内自建);最敏感的事最好别让 AI 碰。
❌ AI 现在还做不了
1. 真正的因果推理
AI 是”相关性的高手、因果性的盲人”。它知道”鸡叫之后天亮”,但分不清是鸡叫导致天亮还是天亮导致鸡叫。
真实例子:让 AI 做医学诊断”为什么这个病人发烧”——它能列出可能的病因,但分不清是病因还是症状。
2. 长期规划和执行
“帮我做一个为期 3 个月的减肥计划”——它能列出计划。但让它自己跟踪 3 个月、根据进展调整、提醒你——做不到(至少在没有工程化包装的情况下)。
当下的 AI Agent 在这方面进步很快,但稳定执行多步骤、长周期任务仍然是个 hard problem。
3. 情感共鸣
你失恋了对 AI 倾诉,它能说出非常恰当的安慰话——但它没在感受。它输出的”理解”是一种模拟。
这件事的伦理含义远不止你以为的那么简单。
4. 创造真正”新”的东西
AI 能在已有的风格里组合出无穷变化(“以梵高的风格画一只猫”),但它无法成为下一个梵高——因为它的所有”理解”都来自已有的人类作品。
诺贝尔物理学奖那种突破性思想,AI 暂时还做不到。
5. 物理世界里的具身任务
让一个机器人在陌生家里给你倒杯水?目前还非常困难。视觉理解 + 运动控制 + 常识推理的组合远没成熟。
特斯拉的人形机器人 Optimus、波士顿动力的 Atlas——都还在演示阶段,距离实用还远。
6. 在没有数据的领域里工作
让 AI 帮你诊断一种全新的疾病(训练数据里没有)——它会很自信地给你一个错误答案。它在已知模式里很厉害,在真正未知的领域里很糟糕。
7. 真正理解它说的话
这是个哲学问题,但有现实影响。当 AI 说”我理解你的感受”时,它没在理解任何东西——它只是在输出统计上最可能的字符序列。
这并不让它没用,但你应该带着这个认知去使用它。
一张速查表
| 任务 | 建议 |
|---|---|
| 写邮件/文案/翻译 | ✅ 大胆用 |
| 总结长文/会议纪要 | ✅ 大胆用 |
| 编程辅助 | ✅ 大胆用(懂代码的话) |
| 创意头脑风暴 | ✅ 大胆用 |
| 起标题/想名字 | ✅ 大胆用 |
| 学新东西/查资料 | ⚠️ 用,但要求它列出处 |
| 算数计算 | ⚠️ 让它写代码算,不要直接算 |
| 写代码(你不懂代码) | ⚠️ 危险 |
| 医疗建议 | ⚠️ 可以问,但必须看医生 |
| 法律建议 | ⚠️ 可以问,但必须找律师 |
| 投资建议 | ❌ 别 |
| 重大人生决定 | ❌ 别 |
| 涉密信息 | ❌ 别 |
一句话总结
AI 是一个博学但不专业、流畅但不严谨、自信但不可靠的助手。
用它的”博学和流畅”提高你的效率,但所有”严谨和可靠”的部分必须你自己来。
永远把 AI 当一个聪明的实习生,不是当一个权威专家。 它能帮你干很多活,但你要为它的产出负责。
下一篇:《“幻觉”是什么、为什么会发生、怎么减轻》——讲清楚为什么 AI 会一本正经地胡说八道。
读到这里说明你认真在学 🎯
订阅每周精选 —— 下一篇新文章 / 新可视化第一时间送到邮箱。
讨论区
· 用 GitHub 账号登录评论src/components/Comments.astro 顶部填入
仓库 ID 和分类 ID(见组件注释里的配置步骤)。