跳转到帖子
在手机APP中查看

一个更好的浏览方法。了解更多

AIGC实战 - 只有干货的 AI 社区

主屏幕上的全屏APP,带有推送通知、徽章等。

在iOS和iPadOS上安装此APP
  1. 在Safari中轻敲分享图标
  2. 滚动菜单并轻敲添加到主屏幕
  3. 轻敲右上角的添加按钮。
在安卓上安装此APP
  1. 轻敲浏览器右上角的三个点菜单 (⋮) 。
  2. 轻敲添加到主屏幕安装APP
  3. 轻敲安装进行确认。
(建议配图:左边是一个在那翻书的图书管理员(代表谷歌/百度),右边是一个闭着眼睛正在写诗的莎士比亚(代表 AI))
大家好,欢迎来到 AI 实战第一课。
在开始学习任何具体操作之前,我们需要先敲碎一个巨大的误解。这个误解导致了 90% 的新手觉得 AI “不好用”或者“在骗人”。
这个误解就是:以为 AI 是一个更高级的百度或谷歌。
今天,我们把 AI 的“头盖骨”掀开,看看它里面到底是怎么运转的。
一、 搜索引擎 vs AI:找书 vs 写书
首先,你要明白这两者有着本质的区别:
搜索引擎(百度/谷歌)是“搬运工”:
当你搜“红烧肉怎么做”,它是去互联网的仓库里,把你需要的网页搬过来给你看。它保证原汁原味,哪怕网页上写错了,它也照搬。
AI(ChatGPT/文心一言)是“创作者”:
当你问“红烧肉怎么做”,它不是去搜网页。它是在它的“大脑”里,根据它以前读过的几万本菜谱,当场给你写一个新的菜谱。
一句话总结: 搜索引擎是给你找现成的答案(Retrieval)。 AI 是给你造一个新的答案(Generation)。
二、 AI 的核心秘密:超级“文字接龙”
那么,AI 是怎么“造”答案的呢? 其实,它的原理甚至简单得有点甚至让人失望:它在玩“文字接龙”游戏。
举个最简单的例子。 如果我对你说五个字:“床前明月光”,你脑子里下一句会蹦出什么? 我敢打赌,99.9% 的人会脱口而出:“疑是地上霜”。
请问: 在这个 0.1 秒的瞬间,你思考了李白的生平吗?你思考了这首诗的深刻含义吗? 没有。 你之所以能接上来,纯粹是因为在你的记忆里,这几个字出现的概率是最高的。这就叫“肌肉记忆”。
AI 的原理一模一样,只不过它的“肌肉记忆”覆盖了全人类的知识。
当你在对话框里输入:“请帮我写一封...” AI 的大脑会疯狂计算:
后面接“信”的概率是 80%
后面接“死”的概率是 0.01%
后面接“大”的概率是 5%
于是,它选择了概率最高的“信”。 紧接着,它根据“请帮我写一封信”,继续预测下一个字…… 就这样,一个字接着一个字,像吐丝一样,它把整篇文章“猜”了出来。
三、 为什么它有时候像个天才,有时候像个傻子?
既然它是靠“猜概率”来工作的,这就解释了它所有的优缺点:
1. 为什么它非常有创意?(优点) 因为它不是死记硬背。每次你问它,它选择的“概率路径”可能都不一样。 就像一个诗人,每次灵感爆发写的诗都不一样。所以它能帮你写出从来没有存在过的文案、故事、代码。
2. 为什么它数学很差?(缺点) 因为数学是严谨的逻辑,容不得半点“大概”。 但在 AI 眼里,1 + 1 = 2 并不是因为数学公理,而是因为它在书上看过太多次 1 + 1 后面跟着 2 了。 一旦遇到复杂的、它没见过的数学题,它靠“猜”就会出错。
3. 为什么它没有“真情实感”?(本质) 当你对 AI 说“我很难过”,它回答“我很抱歉听到这个消息”。 它真的感到“抱歉”了吗? 没有。 它只是计算出:在人类的对话数据里,当一个人说“难过”时,另一个人回答“抱歉”的概率最高。 它是一个没有任何感情、但极其擅长模仿感情的冷血杀手。
四、 怎么利用这个原理?(实战心法)
明白了“概率机器”的原理,你就知道怎么驾驭它了:
给足提示(Prompt):
你给的上文越多,它预测下文的概率就越准。
(就像“床前明月...”这几个字给全了,它才绝对不会接错。)
不要全信:
既然是“猜”出来的,就一定有猜错的时候。永远保持怀疑,特别是针对事实类的问题(如:某人的生日、某次会议的日期)。
利用它的发散性:
正因为它不是搜索引擎,所以当你需要头脑风暴、寻找灵感、改写文章时,它比搜索引擎好用一万倍。
五、 课后思考
请大家在评论区思考一个问题:
如果 AI 只是在做“文字接龙”,那它到底算不算有“智能”?还是说,人类的思考本质上也不过是复杂的“文字接龙”?
(这没有标准答案,欢迎大家在论坛吵架!)
给站长的建议:
排版提示: 把“文字接龙”和“概率”这几个词加粗、标红。这是本节课的“题眼”。
互动引导: 最后那个“课后思考”非常重要。它能把你的 IPS 社区论坛瞬间激活,因为这涉及到哲学层面的讨论,非技术人员特别喜欢聊这个。你可以自己先用马甲号在下面回一个观点,引战一下。
z2
(建议配图:皮诺曹(长鼻子木偶)正在对着电脑打字,或者一张 AI 生成的有 6 根手指的人手图片,暗示“看似完美实则有瑕疵”)
大家好。
在上一节课我们知道了,AI 是一个读了很多书的“超级实习生”。但你很快就会发现这个实习生有一个巨大的毛病:它特别爱吹牛,而且脸不红心不跳。
你问它:“林黛玉倒拔垂杨柳的故事是怎么回事?” 它会给你讲得头头是道。
你问它:“2024年哪只股票必涨?” 它可能会给你编造一个并不存在的代码。
甚至有律师用 ChatGPT 写起诉书,结果 AI 引用了几个根本不存在的法律案例,导致律师被法官罚款。
这种现象,在 AI 圈有一个专门的术语,叫**“幻觉” (Hallucination)**。
为什么这么聪明的 AI 会犯这么低级的错误?今天我们就来扒一扒它的“脑回路”。
一、 它的目标是“讨好你”,而不是“告诉你真相”
还记得我们说的“文字接龙”游戏吗?
AI 的底层逻辑是:预测下一个最顺口的字。 请注意,是“最顺口”,而不是“最真实”。
想象一下,你是一个没复习但被迫上台演讲的学生。 老师问:“请谈谈你对《量子力学与老母猪产后护理》这本书的看法。” 你根本没看过这本书(就像 AI 数据库里没有这个冷门知识),但全场都在看着你,你不敢冷场。 于是你开始编:
这时候的你,就是在“产生幻觉”。 你的目标不是“陈述事实”(因为你不知道),你的目标是**“把话接下去,让句子通顺,让场面不尴尬”**。
二、 它是“模糊的 JPEG 图片”,不是“高清数据库”
很多人以为 AI 是把互联网上的书都存在脑子里了。 错!
OpenAI 的 ChatGPT 只有几百 GB 大小,但互联网的数据有几万 TB。它不可能把所有字都存下来。 它是把知识压缩了。
举个形象的比喻:
搜索引擎(百度/Google): 是一座巨大的图书馆。你要找一本书,它给你精确的页码。如果没这本书,它就说“找不到”。
AI 大模型: 是读完这座图书馆后,凭记忆画出来的一张模糊素描。
当你问它细节时,比如“那本书第 32 页第 5 行写了什么?”
由于是模糊的记忆(压缩后的数据),它看不清细节。
但它又要回答你,于是它根据模糊的印象,脑补(生成)了一行字填上去。
这就是为什么 AI 经常记错数字、搞错人名、编造引文。因为它真的记不住那么细,它只能靠“猜”来还原。
三、 最容易出现“幻觉”的三个雷区
作为使用者,你要知道什么时候 AI 最容易“犯病”,这时候要格外小心:
一本正经地胡说八道(知识盲区):
问它最新的新闻(它没联网时不知道)、问它极度冷门的知识、问它你自己编造的概念(如“请解释一下‘量子香蕉’理论”)。
结果: 它会顺着你的话编一套理论出来。
数学与逻辑陷阱:
问它:“13456 乘以 78902 等于多少?”
结果: 它可能会算错。因为它是文科生,它是靠“语感”来做数学题的,而不是靠计算器。
引用来源:
让它写论文并列出参考文献。
结果: 它列出的书名、作者、年份看起来都像真的,但你去图书馆一查——全是编的。
四、 怎么治它的“爱吹牛病”?(解决方案)
既然知道它有幻觉,我们是不是就不能用它了? 当然不是。只要你有“药方”:
药方一:给它“开卷考试”的权利(RAG 原理)
不要直接问:“公司去年的年假规定是什么?”(它肯定瞎编,因为它没看过你们公司的手册)。
正确做法: 把公司手册的内容复制给它,然后问:“根据我发给你的这段内容,公司的年假规定是什么?”
原理: 强迫它从你提供的材料里找答案,而不是去它的模糊记忆里瞎编。
药方二:要求“来源链接”
现在很多高级 AI(如 ChatGPT 联网版、秘塔AI搜索)可以联网。
指令: “请搜索最新信息回答这个问题,并给出引用链接。”
原理: 一旦有了链接,你点进去看一眼,就知道它有没有瞎说了。
药方三:保持“审稿人”的警惕
永远记住: AI 生成的内容,默认它是“草稿”。
你自己必须是那个最后签字负责人。不要把核实事实的工作交给 AI。
五、 课后作业
为了让你切身体会什么是“幻觉”,请去戏弄一下 AI:
打开你的 AI 工具。
问它一个完全不存在的问题,越离谱越好。
例如:“请详细介绍一下 1998 年发生在南极企鹅和北极熊之间的那场著名战役。”
例如:“鲁迅为什么要暴打周树人?”
截图发到论坛里,看看谁的 AI 编得最精彩、最像真的!
z2
课程标题:【认知 1.3】算力即石油:显卡、芯片与大厂的战争
(建议配图:一张金条堆成的金字塔,或者一张英伟达(NVIDIA)显卡被放在皇冠上的图片)
大家好。
如果你最近关注财经新闻,你一定会被一个名字刷屏:英伟达 (NVIDIA)。这家公司的市值经常暴涨,甚至一度超过了微软和苹果。
为什么?因为它们卖铲子。
在 AI 这场“淘金热”中,全世界所有的科技公司——谷歌、微软、Meta、特斯拉,甚至你的老板——都在排队给英伟达送钱,只为了买那一块名叫 GPU(图形处理器/显卡) 的黑铁块。
这块铁块到底有什么魔力?为什么 AI 的智商全靠它?
今天,我们用三个关键词,带你读懂这场“算力战争”。
一、 关键词一:GPU(显卡)—— 为什么 CPU 不行?
很多同学问:“我电脑里不是有 CPU 吗?为什么跑 AI 非要用 GPU?”
我们可以把电脑处理器比作人:
CPU(中央处理器) = 一个老教授
特点: 他非常聪明,能处理极其复杂的逻辑,比如操作系统调度、复杂的数学证明。但他只有一个人(或者几个分身/核心)。
弱点: 如果你让他做“把 10000 块砖头从 A 搬到 B”这种简单但量大的体力活,他会累死。
GPU(图形处理器) = 一万个小学生
特点: 单个小学生肯定没教授聪明,但这帮孩子人多势众(几千个核心)。
强项: 他们最擅长做简单、重复、并发的工作。比如处理图像上的每一个像素点,或者计算 AI 里的每一个简单概率。
AI 的训练过程,恰恰就是搬砖。 它不需要复杂的逻辑推理,它需要的是进行几千亿次简单的加减乘除运算。
让 CPU(教授)做,由于只能一个一个来,可能要算 100 年。
让 GPU(一万个小学生)做,大家一起动手,几天就干完了。
这就是为什么 GPU 成了 AI 时代的“神”。
二、 关键词二:参数量 (Parameters) —— AI 的“脑容量”
我们在新闻里经常听到:“GPT-4 有 1.8 万亿 参数”、“Llama 3 有 700 亿 参数”。 这个“参数”到底是啥?
你可以把它理解为大脑里的 “神经元连接”。
婴儿的大脑: 神经连接少,只能处理简单的吃喝拉撒。
爱因斯坦的大脑: 神经连接极其复杂、丰富,能处理相对论。
参数量,决定了 AI 的“智商上限”和“知识储备”。
参数量越小: 它是“轻量级”选手。跑得快,占内存小(甚至能在你手机上跑),但不够聪明,稍微复杂的问题就答不上来。
参数量越大: 它是“重量级”选手。博学多才,逻辑缜密,但它是个大胖子。
这就引出了下一个问题: 养一个拥有万亿参数的“大胖子”,需要吃多少饭?
三、 关键词三:算力 (Compute) —— 喂养 AI 的“石油”
既然大模型是个拥有万亿神经元的大胖子,每一次让它思考(推理),或者教它学习(训练),都需要消耗巨大的能量。
这个能量,就叫 “算力”。
训练阶段(上学): 要让一个空白的大脑学会全人类的知识,需要几万张顶级 GPU 日夜不停地全负荷运转几个月。这烧掉的电费和硬件损耗,是以亿美元为单位计算的。
推理阶段(工作): 当你问 ChatGPT 一个问题,它每吐出一个字,后台都有昂贵的 GPU 在疯狂计算。
“算力即石油”: 在工业时代,国家为了争夺石油打仗,因为没有石油机器转不动。 在 AI 时代,大厂为了争夺 GPU 打仗,因为没有算力,AI 就是个植物人。
四、 这一切跟你有什么关系?
了解这些“硬核”知识,对我们普通用户有什么用?
理解“慢”与“贵”: 为什么 GPT-4 比 GPT-3.5 慢?为什么高级版要收费? 因为 GPT-4 的参数量大得多,每次回答你问题,后台消耗的算力(显卡资源/电费)是 3.5 的几十倍。聪明,是有代价的。
选择工具的智慧:
如果你只是想写个简单的请假条,用免费的、参数量小的模型(如 GPT-3.5 或 手机端 AI)就够了,杀鸡焉用牛刀。
如果你要写复杂的商业策划书,必须用付费的、参数量大的模型(如 GPT-4, Claude 3 Opus),因为只有它的脑容量够用。
未来的趋势: 现在的 AI 都在云端(因为你买不起几万块的显卡)。 未来,随着芯片技术的进步(算力成本下降),我们每个人手机里都会住着一个高智商 AI。那是真正的“个人助理”时代的开始。
五、 课后小作业
请大家去查一下: 目前市面上最强的一块 AI 显卡(比如 NVIDIA H100)大概多少钱? 把这个价格发在评论区。你会瞬间明白为什么只有巨头才玩得起大模型!
给站长的发布建议:
高亮重点: 请务必把 CPU=教授,GPU=小学生 这个比喻用粗体或者引用框标出来。这是这一课最精彩的记忆点,学员哪怕忘了什么是“参数”,也会记住这个比喻。
SEO 优化: 在页面的 <meta keywords> 里加上 英伟达, GPU, 算力, AI芯片, 参数量,这些都是目前的高频搜索词。
链接引导: 文末可以加一句:“知道了硬件的昂贵,下一节课我们来讲讲,如何不花一分钱,利用好这些昂贵的算力——【1.4 人机关系心法:它是副驾驶,你是老司机】。”
z2
课程标题:【认知 1.4】人机心法:它是副驾驶,你是老司机
(建议配图:一张汽车驾驶室的图片。人类手握方向盘看着前方,旁边坐着一个发光的机器人拿着地图指路)
大家好。
作为【认知篇】的最后一课,我们来聊一个最扎心的话题:AI 到底会不会取代我?
当你看到 AI 能写诗、能画画、能写代码,甚至能做 PPT 时,很多人会感到一种深深的无力感:“我还有什么用?”
别慌。微软(Microsoft)给自家的 AI 产品起了一个非常绝妙的名字,其实已经把答案告诉你了。
那个名字叫 Copilot。 翻译过来,叫 “副驾驶”。
这意味着:你(Human),才是那个握着方向盘的“主驾驶” (Pilot)。
一、 什么是“副驾驶”思维?
想象一下,你正在开一辆车去拉萨。
AI (副驾驶/导航员) 能做什么?
它能瞬间算出哪条路最近。
它能告诉你前方 500 米有拥堵。
它能帮你播放音乐、调节空调温度。
它甚至能在你累的时候帮你扶一把方向盘(辅助驾驶)。
你 (老司机) 必须做什么?
决定去哪里: 是去拉萨,还是去大理?AI 不知道你的梦想,它只知道地图。
处理突发状况: 突然窜出一只羊,或者导航让你把车开进河里(地图数据错误),你必须立刻踩刹车。
承担责任: 如果车撞了,交警是罚你的款,还是罚导航软件的款?
这就是 AI 时代的核心生存法则:
二、 为什么你不能把方向盘交给 AI?
很多新手最大的错误,就是有了 AI 之后,把脑子扔了,变成了“自动驾驶”模式。这是极其危险的。
1. 它可以“乱说”,你不能“乱信” 正如我们在 1.2 课讲的,AI 会产生“幻觉”。 如果你是一名律师,你直接把 AI 生成的辩护词提交给法官,看都不看一眼。
结果: 辩护词里引用了假法条,你会被吊销执照,而不是 AI 被销毁。
心法: 永远保持**“审查者” (Reviewer)** 的身份。它是干活的实习生,你是签字的那个经理。
2. 它懂“效率”,你懂“价值” AI 可以一秒钟生成 100 个活动方案。
方案 A:成本 10 万,效果平平。
方案 B:成本 500 万,效果爆炸,但公司没钱。
方案 C:成本 50 万,非常有创意,但有法律风险。
AI 会觉得这三个方案都符合逻辑。 但只有你知道:公司现在的现金流很紧(不能选 B),老板最讨厌法律风险(不能选 C)。 所以,最后拍板选 A 并在上面进行优化的,只能是你。
三、 AI 时代的三种人,你想做哪种?
未来职场只有三种人:
拒绝 AI 的人(被淘汰者): 坚持用两条腿走路,结果被开汽车的人远远甩在身后。
依赖 AI 的人(被奴役者): 完全听信导航,导航说“前方直行”,他就直接把车开进了沟里。这种人会因为 AI 的错误而丢掉工作。
驾驭 AI 的人(超级个体): 他手里握着方向盘,旁边坐着一个博学多才的副驾驶。他问副驾驶要数据、要建议、要草稿,但最后哪怕改一个标点符号,也是基于他自己的判断。
我们这套教程的目标,就是把你培养成第三种人。
四、 总结:你的不可替代性在哪里?
请记住这句话,把它贴在你的电脑屏幕上:
AI 拥有的是算力。
你拥有的是愿力(Vision)、责任(Responsibility)和人性(Humanity)。
五、 社区作业(这是本单元最重要的互动)
恭喜你!学完了【第一单元:认知重塑】。 现在,请在评论区分享你的看法:
“在你的工作或生活中,哪一件事情是你绝对不敢完全交给 AI 去做的?为什么?”
(参考答案:哄女朋友开心、给孩子取名字、决定公司的年度战略、安慰刚刚失业的朋友……)
给站长的建议:
单元总结: 在发布完这一课后,建议你在 IPS5 的论坛里发一个**“置顶帖”**,标题叫《【第一单元结业】恭喜你,你的认知已经超过了 90% 的人》。
引导下一步: 在帖子末尾预告:“既然心态摆正了,下一单元我们将进入**【术语扫盲】**。别被大模型、Token、Agent 这些词吓倒,我会用大白话把它们翻译给你听!”
至此,第一单元(认知篇)的 4 节课内容已经全部为您准备完毕。
接下来,我们要开始【第二单元:术语扫盲】,还是先停一下,你去发布并测试一下学员反馈?
z2
大家好,欢迎进入第二单元。
如果你去参加任何一个关于 AI 的会议,或者看科技新闻,你一定会在前三分钟内听到一个词:“大模型” 或者它的英文缩写 “LLM”。
很多人一听这种专业词汇就觉得头大,认为这是程序员才懂的东西。 其实完全不是。今天我们就把这个词拆开,用大白话给你翻译一遍。学完这节课,你就能在饭桌上给别人科普了。
一、 拆解 LLM:大型·语言·模型
LLM 的全称是 Large Language Model。我们把它掰开揉碎了看:
1. L = Large(大)
到底有多大? 我们在 1.3 课讲过“参数量”。你可以把它理解为这个 AI 大脑里的“脑细胞连接数”。
以前的 AI(比如你手机里的语音助手Siri)可能是几百万个连接,所以像个智障。
现在的 LLM,动辄是几百亿、上万亿个连接。为了训练它,大厂们买空了英伟达的显卡,烧了几个月的电。这个“大”,指的是规模大、成本高、极其昂贵。
2. L = Language(语言)
为什么强调“语言”?因为人类最核心的智慧,就储存在“语言文字”里。
这个 AI 没有长眼睛(初期),也没有手脚。大厂们是把全人类在互联网上写过的所有的书、新闻、论坛帖子、代码……全部倒进了它的脑子里。
它通过学习人类的“语言”,顺便学会了语言背后的“常识”和“逻辑”。
3. M = Model(模型)
这是最容易让人困惑的一个词。你可以把“模型”理解为一个超级压缩包(Zip 文件),或者一个数学公式。
它不是一个数据库!它并没有把《红楼梦》一字不落地存下来。它是通过阅读《红楼梦》,总结出了曹雪芹的写作“规律”和“公式”。
当你向它提问时,它是把你的问题代入这个“公式”里,**当场计算(生成)**出一个答案给你。
二、 最通俗的比喻:它是一个“全能压缩饼干”
如果上面的解释还是有点绕,请记住这个比喻:
想象一下,人类有史以来所有的知识,是一座无限大的满汉全席(海量数据)。 你不可能把满汉全席随时带在身上。 于是,科学家们用一种叫“深度学习”的高压锅,花了几个月的时间,把这座满汉全席熬制、浓缩、烘干。
最后,从高压锅里拿出来的,是一块只有手掌大小的**“超级压缩饼干”。 这块饼干,就是大模型 (LLM)**。
它的神奇之处在于: 你只要往这块饼干上滴一滴水(输入你的提示词 Prompt),它就能瞬间膨胀,还原出一盘红烧肉、或者一首诗、或者一段代码。
三、 为什么我们要懂这个?
作为一个非技术的普通人,我们不需要知道这个“压缩饼干”是怎么制造的,但我们需要知道市面上有哪些品牌的饼干:
OpenAI 家的饼干: 叫 GPT(比如 GPT-4o)。目前公认最聪明的。
Anthropic 家的饼干: 叫 Claude(比如 Claude 3.5)。写文章非常像人,逻辑极强。
谷歌家的饼干: 叫 Gemini。和谷歌全家桶结合得很好。
国内厂家的饼干: 比如百度的文心一言、阿里的通义千问、月之暗面的 Kimi。它们的优势是中文好、懂国内人情世故、而且网络稳定。
以后当别人再说“大模型”时,你在脑子里自动把它替换成“AI 的大脑”就可以了。
所有的 AI 应用(比如 AI 写文章软件、AI 画图网站、AI 法律助手),背后都接入了某一个“大模型”作为它的底层智商。
四、 课后互动
纸上得来终觉浅。请大家在评论区报个到: “你目前最常用、或者听说过最多的‘大模型’是哪一个?你觉得它最擅长帮你干什么?”
给你的执行建议:
排版策略: 把“大型·语言·模型”这三个词的解释做成明显的列表或者引用块,方便学员一眼扫过就能记住。
社区激活: 最后那个互动问题非常适合在你的 IPS5 论坛里盖楼。因为每个人的工作场景不同,有人会说“我用 Kimi 看长文档”,有人会说“我用 GPT 写周报”,这种真实的讨论会让新来的学员大开眼界,极大地丰富你的社区内容。
z2
大家好。
在上一节课,我们知道了“大模型 (LLM)”是 AI 的大脑。今天,我们要聊聊这个大脑是怎么阅读和记忆的。
新手在使用 AI 时,最常吐槽两个问题:
“为什么用某些 AI 工具那么贵,动不动就提示额度用完了?”
“为什么我跟它聊了半个小时,它突然把我最开始提的要求给忘了?”
要解答这两个痛点,你必须搞懂 AI 世界里的两个核心术语:Token(词元) 和 Context(上下文)。
一、 什么是 Token?—— AI 的“乐高积木”与计费尺
你可能会觉得:“AI 肯定跟我一样,一个字一个字地读啊。” 错!
AI 的世界里没有“字”和“词”,只有一种叫 Token(词元) 的东西。 你可以把 Token 理解为**“乐高积木块”**。AI 就是通过拼接这些积木块来理解和生成语言的。
最要命的是,中文和英文的“积木块”大小是不一样的:
英文:通常一个单词就是一个 Token。
比如:AI is smart -> AI 脑子里是 3 块积木 [AI] [is] [smart]。消耗 3 个 Token。
中文:通常一个汉字需要 1 到 2 个 Token。
比如:AI 很聪明 -> 因为中文结构复杂,AI 会把它拆得更碎,脑子里可能是 [A] [I] [很] [聪] [明],甚至拆成笔画级别的积木。消耗 5 到 8 个 Token。
二、 什么是 Context?—— AI 的“办公桌”与“金鱼记忆”
讲完了 Token,我们来看看与之紧密绑定的 Context(上下文窗口)。
什么叫上下文? 想象一下,AI 的脑子里有一张办公桌,这张桌子的大小就是 Context(上下文窗口)。
你发给它的所有资料、你和它的聊天记录,全都要摆在这张办公桌上,它才能看着这些资料回答你的问题。
但是,这张桌子是有物理边界的!
假设某个 AI 的桌子最多只能放下 8,000 个 Token 的积木:
你先告诉它:“你是一个脾气暴躁的客服。”(消耗 50 个 Token,摆在桌边)。
然后你丢给它一份长达一百页的超大物流发货单和财务报表,让它分析。(消耗 10,000 个 Token)。
发生什么事了? 因为桌子只能放下 8,000 个,后面源源不断涌进来的报表积木,硬生生把最开始的那 50 个“暴躁客服”的积木挤掉到地上了!
这就是所谓的**“超出上下文窗口”。 此时,AI 已经彻底失忆**了。它完全忘记了自己是个“暴躁客服”,开始用极其平淡的机器人口吻给你分析报表。你觉得它变笨了,其实是它的“办公桌”塞满了。
三、 避坑指南:给小白的 3 个实操建议
懂了这两个概念,你在实战中就能秒杀 90% 的普通用户:
别把它当无限网盘用: 不要一上来就把几十万字的公司资料一股脑全贴给 AI。先精简提炼核心内容,或者把长文档拆分成几部分,否则前面的重点一定会被它“忘掉”。
发现它变笨了?果断“新建对话”: 如果你和 AI 聊了很久,它开始胡言乱语或者忘记前文,不要试图纠正它。直接点击界面上的**“New Chat / 新建对话”。这相当于一键清理了它的办公桌**,让它清空记忆,重新轻装上阵。
最重要的话,留在最后说: 如果你的任务很长,把你最核心的指令(比如:“请严格按照表格输出,不要有废话”)写在文本的最末尾。因为最后面的 Token 是刚放上办公桌的,AI 印象最深。
四、 课后互动
纸上得来终觉浅。今天不留复杂的作业,请大家在评论区分享:
“你之前有没有遇到过 AI 突然‘变笨’、答非所问、或者忘了你最初设定的要求的情况?现在你知道是为什么了吗?”
(欢迎大家吐槽自己以前踩过的坑!)
z2
大家好。
在 AI 刚刚爆火的时候,新闻里经常出现一个神奇的职位:提示词工程师 (Prompt Engineer)。据说这些人不用写一行代码,仅仅靠“跟 AI 聊天”,就能拿到百万年薪。
但随着 AI 变得越来越聪明,很多人开始担心:“以后 AI 都能读懂我的心了,我还需要学怎么写提示词吗?”
答案是:提示词的“套路”确实在消失,但“提问的价值”正在暴涨。 今天,我们就来揭开它的神秘面纱,看看这句价值百万的“咒语”到底在发生什么样的进化。
一、 Prompt 的本质:给 AI 的“剧本”
在中文里,Prompt 通常被翻译为**“提示词”。但在 AI 玩家圈子里,大家更喜欢叫它“咒语”**。
简单来说:你在 AI 聊天框里输入的每一句话,无论是问问题、下指令,还是闲聊,都叫做 Prompt。
你可以把 AI 想象成一个演技高超、但完全没有主见的顶级演员。
如果你只对演员说:“给我哭!”(这是烂 Prompt) 他会很尴尬,不知道是为了失恋哭,还是因为破产哭,最后只能给你挤出两滴极其敷衍的眼泪。
如果你给演员一份详细的剧本:“你现在是一个刚刚破产的中年老板,走在下雨的街头……”(这是好 Prompt) 他瞬间就能给你呈现出影帝级别的表演。
二、 认知升级:从“讨好 AI”到“给 AI 当老板”
随着大模型越来越强,我们使用 Prompt 的心态正在发生根本性的转变:
以前:我们在学“如何讨好 AI”(技巧) 过去模型不够聪明,我们需要掌握很多“黑话”和奇奇怪怪的套路(比如加一句“让我们一步步思考”)去触发它的智商。那时的提示词工程师更像是一个翻译官。
以后:我们要学“如何给 AI 当老板”(逻辑与审美) 现在的模型已经非常强大了,它不再需要你用“技巧”去哄。它考验的是你的领导力。
老板不需要会修打印机,但必须知道公司的目标是什么。
你不需要会写代码,但你必须知道怎么把一个大任务拆解清楚。
三、 为什么 Prompt 依然重要?(垃圾进,垃圾出)
即便 AI 成了天才,如果你给它“垃圾”,它吐出来的依然是“垃圾”。
❌ 小白的 Prompt(像用百度一样,只有关键词):
✅ 老板的 Prompt(有逻辑、有专业背景、有审美要求):
发现了吗?AI 的智商(大脑)没变,变的是你的“指令质量”。
四、 你的专业深度,就是你的“独门咒语”
为什么有人能写出价值百万的 Prompt? 因为他们把“隐性知识”变成了“显性指令”。
一个资深的律师,能写出让 AI 完美审阅合同的 Prompt,因为他知道合同的死穴在哪里。一个完全不懂法律的人,即便模型再强,他也问不出点子上。
在 AI 时代:
你的逻辑能力,决定了 AI 干活的效率。
你的审美水平,决定了 AI 产出的品质。
你的专业经验,决定了 AI 回答的深度。
五、 课后互动
纸上得来终觉浅。今天不留复杂的作业,请大家在评论区思考一个问题:
“如果你现在手头有一位全能的、24 小时待命的超级实习生,你会如何用一段话(Prompt)向他交代你明天最想完成的那项工作?”
(写出你的指令,让我们看看谁已经具备了“给 AI 当老板”的潜质!)
z2
大家好。
恭喜你走到第二单元的最后一课!
在前几节课,我们一直在聊“对话”、聊“文字接龙”。但你心里一定有个疑问:“难道 AI 只能陪我聊天吗?它能不能帮我把活儿给干了?”
比如:
帮我盯着某个产品的价格,降价了自动给我发邮件?
帮我搜集全网关于某个行业的报告,自动汇总成表格?
帮我策划一场旅行,不仅出方案,还顺便查好天气、订好机位?
能。这种能“独立思考、自动干活”的 AI,就叫 Agent(智能体)。
今天,我们就用大白话拆解一下,如何把一个只会聊天的“大脑”,变成一个全能的“数字员工”。
一、 从“聊天机器人”到“智能体”的进化
ChatGPT(基础大模型): 像是一个博学但瘫痪在床的博士。你问他什么他都知道,但他没法出门,没法拿东西,只能动嘴皮子。
Agent(智能体): 像是给这位博士装上了手脚,给了他工具,并交给了他一套公司规章制度。他不仅能想,还能去办。
二、 拆解 Agent 的三要素:大脑、手脚与绝活
要让 AI 真正为你服务,一个合格的 Agent 必须具备三个核心组件:
1. 大脑 (The Brain - 即 LLM)
作用: 负责理解你的指令,拆解任务。
例子: 你说“帮我调研竞品”,大脑会想:“我得先去搜一下有哪些竞品,然后对比功能,最后写报告。”
2. 手脚与工具 (Tools / Limbs)
作用: 赋予 AI 接触真实世界的能力。
常见的“工具”:
浏览器: 让 AI 能上网看实时新闻(打破知识过时的限制)。
计算器/Python: 让 AI 算数不再出错(解决数学幻觉)。
API 接口: 让 AI 能去订机票、发邮件、改 Excel。
关键: 有了工具,AI 就不再只是“猜概率”,而是去“查真相”。
3. 绝活与流程 (Skills / SOP)
作用: 赋予 AI 某个行业的专业深度。
通俗解释: 这就是你喂给它的“专家经验”。
例子: 你告诉 Agent:“如果你看到合同里没有‘违约金’条款,立刻标红并写出修改建议。”这一套标准作业程序(SOP),就是它的“绝活”。
三、 实战场景:你的“差旅 Agent”是如何工作的?
假设你对 Agent 说:“我明天要去上海出差,帮我安排一下。”
大脑思考: “我要查天气 -> 查机票 -> 查酒店 -> 提醒老板带伞。”
调用工具: 它会启动浏览器工具去查明天的天气和航班信息。
运用绝活: 它记得你的个人偏好(Skill)——“老板只坐南航,不喜欢住吵闹的酒店。”
最终输出: 它不会只给你一段话,它会直接给你一份确认单,甚至把日程同步到你的手机日历里。
四、 为什么非技术人员一定要懂 Agent?
因为 Agent 是“超级个体”的终极形态。
以前,你需要雇一个助理、一个美工、一个会计。 现在,你可以利用 Coze(扣子)、Dify 或 GPTs 等零代码平台,亲手捏出三个 Agent:
一个**“文案 Agent”**(拥有搜索工具和你的写作风格)。
一个**“财务 Agent”**(拥有计算工具和税务知识)。
一个**“客服 Agent”**(拥有公司产品手册和温柔的语调)。
你不再是自己在干活,你是在管理一个“数字团队”。
五、 课后互动
第二单元圆满结束!在进入下一单元的【实操篇】之前,请大开脑洞:
“如果可以不花钱‘捏’一个数字员工,你最希望它具备哪两项‘手脚/工具’(比如:能发微信、能改表格、能搜小红书...)?它要帮你解决什么最痛苦的杂事?”
(在评论区留下你的构思,也许下一课我们就会教你如何实现它!)
给站长的发布建议:
视觉引导: 建议做一个简单的**“大脑+手脚=员工”**的示意图,这是本节课的核心记忆点。
预告下一单元: 在文末加上大大的跳转链接:“恭喜你完成了所有理论武装!下一单元,我们将正式进入**【第三单元:沟通艺术】**,教你手把手写出能指挥这些 Agent 的‘神级指令’!”
z2
大家好。
很多人刚用 AI 时,习惯把它当成微信好友,先发一句:“在吗?” 或者 “你好,能帮我个忙吗?”
醒醒!AI 是一台不需要寒暄的超级处理器。 你对它越客气,它可能越觉得你没想好要干什么。在 AI 的世界里,“效率”来自于“信息密度”。
今天,我们直接上真实案例,看看同一个 AI,在接收到“烂指令”和“好指令”时,表现出的智商差距到底有多大。
案例一:行政/人力——“写个会议纪要”
❌ 坏指令(小白型):
AI 的反应: 机械地删减文字,漏掉关键决策,甚至把谁说了什么都搞混了。
✅ 好指令(老板型):
结果: AI 瞬间吐出一张清晰的执行表,拿给老板看,老板会觉得是你亲手整理的。
案例二:销售/运营——“帮我跟进客户”
❌ 坏指令(搜索习惯):
AI 的反应: 给出一套全网通用的、毫无感情的模板,客户看了直接拉黑。
✅ 好指令(实战习惯):
结果: AI 写出的内容会精准击中王总的痛点,转化率提升 300%。
案例三:法律/专业领域——“帮我审下合同”
❌ 坏指令(偷懒型):
AI 的反应: 大谈特谈法律常识,告诉你要遵守诚实信用原则,全是正确的废话。
✅ 好指令(专家型):
结果: AI 会像鹰一样盯着那几行小字,帮你省下几万元的律师费或潜在损失。
一、 终极秘诀:好指令的“三要素”
看完对比,你发现好指令的秘密了吗?其实就三个词:
明确角色 (Who): 告诉 AI 它是谁(秘书、销售专家、律师)。
提供背景 (What): 把相关的细节喂给它(王总聊了什么、合同要审哪三个点)。
规定格式 (How): 告诉它你想要表格、列表、还是某种特定语气的文案。
二、 课后作业:变废为宝
请大家在评论区进行一次**“指令整容”**:
找出一句你最近对 AI 说过的、效果不太好的短指令(例如:“帮我写个请假条”)。
运用今天学的“三要素”,把它改造成一句让 AI 瞬间变聪明的“好指令”。
把改造前后的对比发出来,我们一起来帮你点评!
本章图片设计指南(发给 Nano Banana 2 制作):
给站长的建议:
案例定制化: 你的学员很多对物流、硬件、网站管理感兴趣。在发布时,你可以把案例二微调为“写一份关于 Keychron 键盘的测评大纲”或者“给 yibang.org 写一个推广文案”,这样他们会更有亲切感。
论坛运营: 引导大家在评论区互相“挑刺”。如果有人发了改造后的指令,你可以回复他:“如果再加一个具体数据,效果会更炸裂!”这种互动会让你的社区显得非常专业。
第一单元和第二单元我们已经打好了理论基础,现在的 3.1 开启了实操大门。我们需要继续推进到最硬核的 3.2 黄金框架(BROF 公式)吗?
z2
大家好。

在上一节课,我们看到了“好指令”和“坏指令”的差距。很多同学问:“我也想写出那种大段大段、逻辑严密的指令,但我没思路,怎么办?”

别担心,写好提示词(Prompt)不需要文学功底,它更像是一场**“填空游戏”**。

今天,我把价值百万的提示词技巧,浓缩成了一个谁都能记住的单词:BROF 公式。以后你只要想让 AI 干活,就把这四个字母在脑子里过一遍。

一、 拆解 BROF:你的“金牌令箭”
B (Background) —— 背景:交代前因后果

大白话: 告诉 AI“我是谁,我在干嘛,发生了什么”。

如果不说: AI 会像个刚入职、一脸懵逼的新人。

示例: “我正在为我的新网站 yibang.org 策划首页文案,我们的目标客户是刚接触 AI 的小白……”

R (Role) —— 角色:赋予专家身份

大白话: 告诉 AI“你现在是谁,你应该表现得像谁”。

如果不说: AI 会用平淡的机器人语气跟你说话。

示例: “你现在是一名拥有 10 年经验的资深网站文案策划,擅长用充满亲和力且专业的语言吸引用户。”

O (Objective) —— 任务:明确具体动作

大白话: 告诉 AI“你想让它干成哪一件具体的事”。

如果不说: AI 会漫无目的地长篇大论。

示例: “请帮我写出三个不同风格的网站标语(Slogan),每个标语都要突出‘简单、高效、零基础’这三个核心点。”

F (Format) —— 格式:规定最终样貌

大白话: 告诉 AI“结果长什么样”。

如果不说: AI 的排版可能让你看到头晕。

示例: “请用表格形式输出。表格包含两列:第一列是标语内容,第二列是设计的初衷和逻辑。”

二、 案例演示:把“烂提示”整容成“金牌指令”
假设你正在为你的网站 AIGCFlows.com 构思一篇关于“物流自动化”的文章。

❌ 以前的你: “帮我写一篇物流自动化的文章。”

✅ 现在的你(使用 BROF 公式):

[B 背景] 我正在为我的网站 AIGCFlows.com 撰写一篇博客,主题是探讨 2026 年仓储物流的自动化趋势。
[R 角色] 你是一位专注于供应链科技的资深行业分析师,文章要写给那些还没接触过自动化的中小物流企业主看。
[O 任务] 请梳理出目前最主流的三种自动化技术,并分析它们能帮小企业主省下多少钱。
[F 格式] 请使用“总-分-总”结构,多用 bullet point(圆点列表),语气要诚恳、接地气。

三、 随取随用的“万能填空模版”
你可以直接复制这段话,填入你的需求,发给任何 AI:

[背景]:我目前正在做的是___________________。
[角色]:你现在的身份是_____________________。
[任务]:请帮我完成_________________________。
[要求/格式]:你需要注意_________,最后以_________形式呈现。

四、 课后作业:挑战“一发入魂”
请大家在评论区,尝试用 BROF 公式 重新写一个你最近遇到的工作任务。

场景建议: 给客户回邮件、写一段 Keychron 键盘的卖点介绍、或者策划一次家庭旅行。

看看谁的 Prompt 得到的 AI 回复最让你满意!

本章封面图片设计建议
提示词:
A massive, glowing golden key floating in a futuristic digital space. The key has four distinct mechanical parts labeled with large, bold glowing letters: 'B' (Background), 'R' (Role), 'O' (Objective), 'F' (Format). In the background, streams of data are transforming into organized blueprints and documents. The lighting is professional and inspiring, soft blue and warm gold tones, 8k resolution, high-tech classroom vibe.

给站长的建议
实操性: 这一节课一定要在网站上设置一个**“一键复制模版”**的按钮,或者直接在帖子下方贴出这段文本,方便学员直接使用。

迭代点: 你可以收集学员回复中比较好的 Prompt,整理成一个**《行业万能指令库》**,作为额外的电子书或者会员福利。

这一课是“武功心法”,学员掌握后会非常有成就感。下一步,我们要讲 3.3 迭代与追问:如何“调教”出完美结果吗?这节课会教大家如何“纠错”和“精进”。
z2
大家好。
学完了 BROF 公式,你已经能写出 80 分的指令了。但有时候,AI 给出的回答还是会让你觉得“差点意思”:
“文案写得太死板,不像人话。”
“方案太宏观,没有落地细节。”
“代码有个小 Bug,运行不起来。”
这时候,很多新手会选择放弃,或者重新开一个对话。这其实是最大的浪费!
真正的 AI 高手,从来不指望“一发入魂”。他们最厉害的本领是:调教(Iterative Prompting)。
今天,我们要学习如何通过“追问”和“反馈”,把 80 分的草稿变成 100 分的成品。
一、 调教心法:把它当成你的“资深实习生”
想象一下,你带了一个名牌大学毕业的实习生。 你让他写个报告,他交上来的第一版肯定不完美。你会直接开除他吗? 不会。 你会指着草稿对他说:
“这段太啰嗦,删掉。”
“这个数据不对,去查一下最新的。”
“加个表格对比,看起来更直观。”
对 AI 也是一样。调教的本质,就是持续给予“反馈”。
二、 三种神级追问技巧
当 AI 给出的结果不理想时,试试这三个动作:
1. “精准纠偏”法(像红笔批改一样) 不要只说“写得不好”,要告诉它哪里不好。
错误示范: “写得太烂了,重写。”
正确示范: “整体不错,但第二段的语气太生硬了,请用更幽默、像好朋友聊天一样的口吻改写一下。”
2. “剥洋葱”法(由浅入深) 如果一个任务太复杂,AI 往往会给出一个泛泛而谈的答案。这时候你要引导它深入。
追问 1: “关于刚才提到的第三点‘自动化物流’,请详细列举出三个适合小型仓库的低成本方案。”
追问 2: “在这三个方案中,哪一个最容易在 yibang.org 这种规模的网站后台实现对接?请列出具体步骤。”
3. “思维链 (CoT)”法(让它想清楚再说) 如果你发现 AI 逻辑混乱,或者数学算错,请使用这句万能咒语:
原理: 这种追问强迫 AI 调动更多的“算力”去分析逻辑,而不是直接“猜”出答案。
三、 迭代的禁忌:不要“在垃圾上刷漆”
如果 AI 连续三次追问都还没理解你的意思,说明你的 B(背景) 或 R(角色) 彻底错了。
这时候不要再追问了! 你应该:
反思自己的初始指令是不是太模糊。
点击“New Chat(新建对话)”,清理它的办公桌(Context 上下文)。
重新修改你的 BROF 公式。
四、 结语:你才是最后的“签字人”
永远记住 1.4 课的心法:你是老司机,它是副驾驶。
调教的终点,是达到你的交付标准。AI 给你的永远是“草稿”,只有经过你调教、审核并最终点头的,才叫“作品”。
五、 课后作业:模拟“调教”现场
让 AI 帮你写一首关于“春天”的诗(故意给一个很短的指令)。
通过三次追问,把它改造成一首“充满赛博朋克感、读起来很忧郁、且必须包含‘显卡’和‘代码’两个词”的诗。
把第一次的烂草稿和第三次调教后的成品对比截图,发到评论区。
看看谁才是最会折磨(调教)AI 的“魔鬼教官”!
本章图片设计建议
给站长的建议
互动感: 在 Pages 页面里,可以用“折叠框”或者“滑块”展示几个“追问前 vs 追问后”的对比效果,这种视觉上的进化感非常能说服学员。
引导方向: 这一课结束后,学员已经掌握了基本的沟通逻辑。下一课 3.4 结构化思维 将会教他们如何像搭建乐高一样,完成“万字长文”或“大型策划案”这种大工程。
z2
大家好。
通过前三节课,你已经学会了如何写出一个漂亮的指令,也学会了如何通过“调教”来完善细节。
但你很快会遇到一个终极挑战:“我想写一份 5000 字的市场调研报告”、“我想给我的新网站 yibang.org 策划一整年的内容”……
如果你直接把这个大任务丢给 AI,它给你的往往是:
只有几百字的“缩水版”回答。
逻辑混乱,前面说的和后面对不上。
质量平平,完全达不到职业水准。
这不是 AI 不行,而是你试图让它一次性吞掉一头大象。
今天,我们要学习 AI 时代最高级的思维方式:结构化拆解。 既然不能一口吞,我们就把“大象”切成小块,用一串“连环咒语”来解决它。
一、 核心逻辑:不要“直接要”,要“分步造”
建筑工人在盖大楼时,绝不会第一天就问:“怎么盖出一栋 50 层的大厦?” 他们会:
看图纸(出大纲)。
打地基(定框架)。
建主体(写初稿)。
搞装修(润色优化)。
对付复杂 AI 任务,我们也只需要这三步走:
二、 实战演练:策划一个完整的行业深度报告
假设你要在你的网站上发布一篇关于 “2026 年全球 AI 硬件市场趋势” 的深度分析报告。
第一阶段:出大纲(连环咒语 1)
指令: “你现在是顶级行业分析师。我需要写一份 3000 字的年度报告,主题是‘2026 年 AI 硬件趋势’。请先不要写正文,先帮我列出一份详细的内容大纲。”
目的: 确保 AI 的逻辑框架是对的。如果大纲不对,后面写再多也是废话。
第二阶段:分段扩写(连环咒语 2、3、4...)
指令: “现在,请针对大纲的第一部分‘高性能显卡(GPU)的供需现状’进行深度扩写。要求结合我们之前提到的‘算力即石油’的概念,字数在 800 字以上。”
目的: 集中所有的 Token(词元) 和注意力去攻克一个小点。这样写出来的深度,比一次性写全文高出 5 倍。
第三阶段:最后组装与润色(连环咒语 Final)
指令: “我已经在上面的对话中完成了所有章节。现在,请帮我检查全文的逻辑连贯性,并为整篇报告写一个极具震撼力的开篇摘要和总结结论。”
目的: 消除分段写作可能带来的断层感。
三、 结构化思维的 3 个黄金法则
先定框架,后填肉: 永远不要跳过“大纲”这一步。大纲就是你给 AI 画的“跑道”。
一次只干一件事: 与其让它“写一篇 2000 字的文章”,不如让它“分四次写完,每次写 500 字”。
保持上下文“办公桌”整洁: 如果任务太长(比如写一本书),当写到第十章时,AI 可能会忘了第一章。这时候,你需要手动把第一章的核心大纲再发给它一次,帮它“唤醒记忆”。
四、 结语:你就是“总策划师”
所谓的“提示词高手”,其实就是最会拆解任务的人。
你不需要自己去搬每一块砖,但你必须清楚地知道每一块砖应该放在哪里。当你学会了把复杂项目拆解为“连环咒语”,在这个世界上,就没有 AI 无法帮你完成的工作。
五、 课后作业:挑战“大型策划案”
选择一个你最近想做的复杂任务(如:写一星期的食谱、策划一次团建、写一份新业务计划书)。
不要直接要结果。请先给 AI 下一个指令,让它为你出一份详细的大纲。
在大纲的基础上,挑选其中最难的一小块,让 AI 进行深度扩写。
把你的“大纲”和“深度扩写片段”发到论坛,让大家看看你的拆解逻辑!
本章图片设计建议
给站长的建议
里程碑式总结: 第三单元结束了,这标志着学员已经掌握了所有核心沟通技术。建议你发布一个“结业挑战”,让大家用这一单元学的知识去解决一个真实问题。
衔接下一单元: 预告第四单元 【兵器鉴赏】。告诉学员:“你已经会开车了,下一单元我们将带你走进‘名车展厅’,看看市面上那些最顶级的 AI 工具(如 Kimi、ChatGPT、Claude、Midjourney)到底哪个最适合你!”
z2
大家好。
现在是 2026 年,AI 市场的繁荣程度简直像是在逛大集。
有人说:“必须用国外的,那是原汁原味的最强大脑。”
有人说:“国内的才好用,不仅懂中国话,还免费,联网速度飞快。”
到底谁在吹牛?作为小白,该如何选择?其实,选 AI 和选员工是一个道理:没有最好的,只有最适合你岗位的。
一、 国内派(主场优势):懂你的心,更懂你的网
核心代表:Kimi(月之暗面)、通义千问(阿里巴巴)、豆包(字节跳动)
优点 1:中文理解力满分。
它们能精准识别中文里的“梗”、成语和职场潜规则。你让它写个“含蓄的催款通知”,它给出的措辞绝对比国外 AI 更像中国老江湖。
优点 2:长文本处理极强。
比如 Kimi,它最出名的就是能一口气读完几十万字甚至上百万字的资料。你丢给它一整年的财报或者几本书,它能秒出总结。
优点 3:网络无障碍。
不需要复杂的网络设置,网页版、手机 App 随开随用,速度极快。
二、 国外派(技术尖兵):逻辑上限,全能选手
核心代表:ChatGPT (OpenAI)、Claude (Anthropic)、Gemini (Google)
优点 1:逻辑与代码能力封神。
如果你是程序员,或者需要处理极其复杂的逻辑推理(比如深度法律分析、数学建模),Claude 3.5 或 GPT-4o 目前依然是行业的天花板。
优点 2:创意输出更“高级”。
在文学创作、脑暴以及写那种国际范儿的英文邮件时,它们的语言美感和创意发散性通常更胜一筹。
优点 3:生态系统丰富。
比如 GPT 有无数的 GPTs 插件,Gemini 能直接读取你的 Google 全家桶数据(邮件、日历等)。
三、 快速对照表:你的需求 vs AI 选择
你的需求场景
推荐兵器
推荐理由
读超长 PDF、写长篇报告
Kimi
“长文本之王”,处理速度极快且免费。
办公文档自动化、写 Excel 公式
通义千问
深度集成阿里办公生态,处理表格逻辑很顺。
写深度文案、编程、复杂逻辑推导
Claude 3.5 / GPT-4o
聪明程度(智商)目前依然是全球顶尖。
日常闲聊、搜索新闻、查资料
豆包 / 秘塔搜索
反应极快,搜索整合能力强,界面简单。
四、 避坑指南:小白选型 3 原则
别迷信“付费即最强”: 对于 90% 的普通职场人,国内主流 AI 的免费版已经绰绰有余。不要一上来就去折腾付费,先用顺手再说。
网络环境决定选择: 如果你没有稳定的特殊网络环境,国内 AI 是你唯一的、也是最好的选择。别为了用 ChatGPT 把时间都浪费在连不上网上。
不要只用一个: 建议手机里至少装一个国内的(推荐 Kimi)和一个国外的(推荐 Claude 或 GPT)。就像你有两个助理,遇到难题时,听听两者的不同意见。
五、 课后互动
“你目前正在使用的 AI 是哪一个?你觉得它在哪方面最让你满意,哪方面又让你想把它‘开除’?”
(欢迎在评论区分享你的‘员工评价’,我会帮你分析这个 AI 是否真的适合你当前的工作!)
本章封面图片设计建议
这一章的内容和“选型逻辑”你觉得清晰吗?如果准备好了,我们就开启 4.2 节——【文字之外的魔法:AI 也会看图和说话】。
z2
大家好。
在之前的课程里,我们一直都在跟 AI “敲字”。你可能会觉得 AI 就像一个住在电脑屏幕里的“笔友”。
但到了 2026 年,顶级 AI 已经进化出了五感。它不再只读你的文字,它能看到你拍的照片,听懂你说话的语气,甚至能直接开口跟你谈心。这种“能看、能听、能说”的能力,就是我们今天要讲的核心词:多模态 (Multimodal)。
一、 AI 的“眼睛”:视觉理解 (Vision)
现在的 AI 已经不是在简单的“识图”,而是在“理解画面”。
它能帮你做什么?
整理杂乱的资料: 你随手拍一张乱七八糟的报销单或手写笔记,发给 AI,它能瞬间帮你转成整齐的 Excel 表格。
硬件与维修助理: 比如你的电脑主板(像 X99 那种复杂的板子)插线没反应,你拍个特写发给它,问:“我这根跳线插对了吗?”它能像专业技师一样指出问题。
生活小百科: 在路边看到不认识的花草,或者在超市看到没见过的水滤芯,拍张照问它:“这是什么?适配什么型号?”它比搜图引擎更聪明,因为它能结合上下文告诉你怎么用。
二、 AI 的“耳朵”与“嘴巴”:语音交互 (Audio)
现在的语音 AI 已经告别了那种“僵硬的机器人声”,变得充满了情感。
听觉(耳朵): 它可以帮你记录一整场会议,不仅能把录音转成文字,还能听出谁在生气,谁在犹豫。
视觉(嘴巴): 它可以变成你的外语陪练。你可以直接用语音跟它练习英语,它能纠正你的发音,还能根据你的语气调整说话的速度。
实时对话模式: 像 Gemini Live 这样的功能,让你可以像给朋友打电话一样跟 AI 交流。你可以随时打断它,问它:“等等,刚才那段你再解释一下。”
三、 1+1 > 2:多模态的终极威力
多模态最迷人的地方在于:你可以把不同的感官组合起来。
想象一下这个场景:
你正在装修新家,拍了一张客厅的照片。
你直接对 AI 说:“你看这张图,我想在左边墙角放一个猫爬架,风格要极简一点,帮我搜一下合适的方案并估算一下尺寸。”
AI 此时同时动用了“眼睛”来看图、“耳朵”来听指令、以及“大脑”来计算。 这种体验,才叫真正的“数字助手”。
四、 给小白的 3 个实操建议
别手打,直接拍: 遇到复杂的说明书、合同条款或复杂的硬件接口,直接拍照发给 AI 提问。
善用“语音备忘录”: 当你灵感爆发但没空打字时,直接对着 AI 说话,让它帮你把这段杂乱的语音整理成有逻辑的思维导图。
情绪感知: 当你写了一封重要的邮件拿不定主意时,可以对 AI 说:“读一下这段文字,看看如果你是收件人,你会觉得我的语气太傲慢了吗?”
五、 课后作业:挑战“非文字输入”
请大家今天尝试一次**“非文字提问”**:
拍一张你桌面上最混乱的东西(或者一张复杂的发票/说明书)。
发给 AI,并语音提问:“帮我总结一下这里面的核心信息。”
在评论区分享:AI 的表现有没有惊艳到你?它看懂了哪些你觉得很难的细节?
本章封面图片设计建议
这一节的内容通过“感官”的类比,应该能让小白迅速理解 AI 的全貌。接下来,我们要开启初级课程的最后一站——【4.3 浏览器插件:让 AI 贴着你的网页走】吗?
z2
大家好。
在 4.1 课里,我们选好了“员工”;在 4.2 课里,我们知道了 AI 有“感官”。今天,我们要把这些能力真正融入你的工作流程中。
你是否有过这样的经历:
看到一篇长达 1 万字的行业报告,想看又没时间,只能先“加入收藏夹吃灰”?
满屏的英文或专业术语,看得头晕眼花,不停地复制到翻译软件里去翻?
想要提取网页上几百行的数据到 Excel,只能苦哈哈地手动复制粘贴?
别再折腾了! 真正的高手,会让 AI 直接“住”在浏览器里。这就是我们要讲的:AI 浏览器插件。
一、 什么是 AI 插件?—— 网页上的“随身翻译官与速读器”
你可以把 AI 插件想象成一个**“透明的侧边栏”**。它就在你浏览器的右侧,它能看见你正在看的网页内容。你不需要再把文字复制出来,直接对它说:“总结一下这一页在讲什么”,它就能秒出答案。
二、 三大核心超能力:你的效率“增幅器”
1. 一键“省流”:万字长文,一秒读完
场景: 面对厚重的 PDF 或长博客,点击插件上的“总结”按钮。
效果: AI 会自动把整页内容拆解成 5 个核心要点。你只需花 30 秒,就能判断这篇文章是否值得深读。
2. 深度翻译:不只是换个语种,更是换个“脑子”
场景: 浏览国外的 AI 硬件论坛。
效果: 传统翻译经常闹笑话。AI 插件(如沉浸式翻译)能理解语境,把生硬的英文变成流畅、地道的中文,甚至能保留原网页的排版。
3. 随身“写作助手”:回复邮件、评价、发帖
场景: 你正在回复客户的邮件,或者在论坛回复贴子。
效果: 插件会出现在你的输入框旁边,你只要输入几个关键词,它就能帮你扩写成一段得体、专业的回复。
三、 2026 年最推荐的 3 款“神兵利器”
Monica(全能冠军): 目前最强大的全能型插件。它支持 GPT-4o、Claude 3.5 等多种模型,集成了总结、翻译、写作、联网搜索于一体。对小白最友好。
Kimi 侧边栏(长文本之王): 如果你经常需要分析超长的专业文档、财报,Kimi 的插件是首选。它的中文理解和长文本处理极度流畅。
Edge Copilot(内置免安装): 如果你使用微软的 Edge 浏览器,它自带的 Copilot 已经足够强大,能直接总结当前标签页,甚至能根据网页内容帮你写代码或画图。
四、 强化练习:带上 BROF 去看网页
既然学了插件,我们就要用最专业的 BROF 公式 来驱动它。
假设你正在看一个英文的 Keychron 键盘介绍网页,你可以打开插件侧边栏,输入:
五、 课后作业:安装你的第一款 AI 插件
在你的电脑浏览器(Chrome 或 Edge)搜索并安装一款 AI 插件(首推 Monica 或 Kimi)。
找一篇你一直想看但没时间看的长文章,让 AI 帮你总结。
在评论区分享:“你用插件总结了哪篇文章?它帮你在 30 秒内省下了多少阅读时间?”
本章封面图片设计建议
第四单元到此结束!现在学员们已经配齐了“兵器”。接下来,我们将进入初级课程的最后一站——【第五单元:安全合规 —— 别把“底裤”喂给 AI】。准备好了吗?
z2
大家好。
恭喜你!能坚持看到这一课,你已经跑赢了 90% 只会把 AI 当聊天软件玩的人。
但在你正式开启 AI 全速办公之前,我必须给你泼一盆冷水。你可能听说过这样的新闻:“某大厂员工为了修 Bug,把公司机密代码传给 AI,结果导致代码被模型吸收,成了全球公开的秘密。”
记住一句话:在互联网上,如果一个工具是免费的,那么你(和你的数据)就是那个“产品”。
今天我们要学习:如何在使用 AI 的同时,守住你的个人隐私和公司商业机密。
一、 AI 的“记忆力”:它不仅是工具,更是“大嘴巴”
你要明白,你发给云端 AI(如 ChatGPT、Kimi、Claude)的每一句话,默认情况下都可能被用来**“训练下一代模型”**。
这就像你在一个熙熙攘攘的广场上对着一个扩音器说话。虽然 AI 公司承诺会保护隐私,但在模型学习的过程中,你的信息可能会以一种意想不到的方式被“吐”给其他用户。
二、 绝对不能喂给 AI 的 3 类“底裤”数据
为了保护你自己和你的公司,请死死记住以下三条红线:
个人极度敏感信息:
例子: 身份证号、家庭住址、银行卡密码、私人手机号。
后果: 一旦泄露,你可能会面临无休止的骚扰电话甚至诈骗。
公司未公开的商业机密:
例子: 还没发布的新产品设计图、公司内部的财务报表、核心技术代码、客户名单。
后果: 竞争对手可能通过 AI 间接“窥探”到你的商业底牌。
第三方法律责任数据:
例子: 客户的私人合同、患者的病历。
后果: 你可能因为违反了法律(如 GDPR 或国内的数据保护法)而面临巨额赔偿。
三、 高手的“脱敏”技巧:如何安全地问问题?
想让 AI 帮你看合同,但合同里又有敏感名字,怎么办?学会**“数据脱敏”**:
❌ 错误示范: “帮我看看这份《张三与李四关于上海路 100 号房产的转让协议》有没有问题。”
✅ 正确示范: “帮我看看这份《甲方与乙方关于 A 地块房产的转让协议》模版有没有法律漏洞。”
技巧: 用“张三、李四、公司 A、项目 X”来代替真实的名字。AI 只要理解逻辑,不需要知道那是谁。
四、 安全设置:给你的 AI 装上“隐私锁”
在主流 AI 工具中,通常都有“不参与培训”的开关:
ChatGPT: 在设置中开启“临时聊天 (Temporary Chat)”或者关闭“模型训练”。
企业级方案: 如果你的公司对安全要求极高,请使用 API 接入模式(API 产生的数据通常默认不参与训练)或者部署本地模型(数据不出你自己的电脑)。
五、 结业礼:成为一名“终身 AI 进化者”
恭喜你!《从零开始:AI 时代实战通关指南(初级篇)》到此全部结课。
你现在已经拥有了:
正确的心态: 把它当副驾驶,而不是替代者。
硬核的术语: 懂 Token、懂 Agent、懂多模态。
万能的公式: 会用 BROF 写出神级指令。
趁手的兵器: 选好了适合自己的 AI 助手和插件。
安全的护甲: 知道如何保护隐私。
这只是你 AI 旅程的开始。AI 的世界每天都在变,保持好奇心,你就是那个不被时代抛弃的人。
六、 课后互动(结业感言)
“回想起第一课,你对 AI 的看法发生了什么改变?你目前最想用 AI 解决的‘第一个大任务’是什么?”
(请在评论区写下你的结业感言,我会为优秀的同学点赞,并送上我们精心准备的《中级实操篇》预告一份!)
本章封面图片设计建议
给站长的建议:
结业勋章: 作为一个 IPS5 开发者,你可以利用论坛的“勋章”系统。当用户在这一课留言后,自动给他们发一个**“AI 初级通关勋章”**。
合集索引: 在本课结尾,放一个完整的链接清单,把 1.1 到 5.1 的所有文章排好序,方便新来的用户系统性“刷课”。
后续内容: 既然你提到过想做医疗、金融、音乐等领域的 AI,接下来你可以开始筹备**“行业深度专题课”**了。
z2
Background Picker
Customize Layout

我的帐户

导航

搜索

搜索

配置浏览器推送通知

Chrome (安卓)
  1. 轻敲地址栏旁的锁形图标。
  2. 轻敲权限 → 通知。
  3. 调整你的偏好。
Chrome (台式电脑)
  1. 点击地址栏中的挂锁图标。
  2. 选择网站设置。
  3. 找到通知选项,并调整你的偏好。