AI全栈课程学习笔记
2025年4月1日大约 3 分钟
AI全栈课程学习笔记
2 大模型应用开发基础
-- 本课主要让大家在认知上适配AI
学会什么:
- AGI时代的个人发展
- 大模型能做什么
- 大模型落地现状
- 大模型的通俗原理
- 大模型的应用架构
2.1 一些概念
AGI(Artificial General Intelligence)通用人工智能。
普通人能够做啥:
- 在过程中抓住机会
- 在AGI到来后成为获益者
- 主流预测3-5年会到来AGI时代(现在是2024年)
本课程主要让普通人成为AI产品制造者,也就是设计和开发AI产品,哪怕只是满足自己需求;
2.2 AI产品制造者的核心能力
三懂
- 懂业务:懂用户、懂客户、懂需求、懂市场、懂运营、懂商业模式、懂怎么赚钱;
- 懂AI:就是懂AI能做什么、不能做什么,怎么才能做得更好、更快、更便宜;懂怎么用AI解决赚钱过程中的问题;
- 懂编程:就是懂如何编写代码实现一个符合业务需求的产品,尤其是AI产品;
AI全栈工程师:懂业务、懂AI、懂编程
2.3 什么是AI
定义:基于机器学习、神经网络的是AI,基于规则、搜索的不是AI。
大模型全程LLM英文:Large Language Model
2.4 大模型能做什么
- 按格式输出,如:Json格式
- 分类
- 聚类
- 持续互动,如同游戏
- 技术相关问题
一切问题都可能解决所以叫通用人工智人。用AI要用【用人思维】。
2.5 成功落地大模型五要素
1.业务人员的积极性
2.对AI能力的认知
3.业务团队自带编程能力
4.小处着手
5.老板的耐心
2.6 找落地场景
1.从熟悉的领域入手。 -- 市场营销管理,客户管理系统,内容管理系统;教育领域;
2.尽量找能用语言描述的任务。
3.别求大而全。将任务拆解,先解决小人物,小场景。
4.让AI学最厉害员工的能力,再让ta辅导其他员工,实现将本增效。
2.7 工作机会
1.独立开发者
2.科技公司机会全部岗位
3.传统企业跑通AI工作流,找全栈工程师定制化开发
2.8 大模型工作原理
根据上下文,猜下一个字。
大模型会根据提示词的约束,猜出相关的字。
大模型核心工作过程:训练(学习)和推理(使用)
训练:
1.大模型阅读了人类说过的所有的话。这就是【机器学习】。
2.训练过程会把不同的token同时出现的概率存入【神经网络】文件。保存的数据就是【参数】,也叫【权重】。
推理:
1.我们给推理程序若干token,程序会加重大模型权重,算出概率最高的下一个token是什么。
2.用生成的token,再加上上文,就能继续生成下一个token。
2.9 Token是什么
大模型认知的最小单位,可能是一个英文也可能是半个或者三分之一个。汉字也是如此可能是一个词或者一个汉字或者半个汉字。
大模型在训练前,需要先训练一个tokenizer模型。它能把所有的文本,切成token。