AI相关学习

AI基础知识学习

AI核心概念

温度

描述大模型输出的随机性，温度越高，输出越随机，温度越低，输出越固定保守。

Prompt提示词

输入给ai的内容称为提示词，分为系统提示词和用户提示词，系统提示词整体约束ai的输出，用户提示词会随用随输。

Token

token是大语言模型处理文本的基本单位，可能是单词或标点符号。

模型蒸馏

将复杂大模型的知识转移到更小模型，保持模型性能的同时，减小模型体积，降低推理成本。

多模态

一种大模型类型，可以同时理解和处理多种类型的信息，比如文本，图像，音频和视频，实现文生图，图生文。

RAG

知识检索增强，大模型的信息不准确时，需要额外的知识信息，RAG就作为大模型的额外补充知识库

Embedding嵌入

可以说是向量化，将文本，图像等数据转换为向量表示，并写入向量数据库中。

思维链(CoT)和ReAct

思维链（CoT）：让模型详细介绍中间步骤和推理过程，像DeepSeek的深度思考。

ReAcT：结合推理（Reason）和行动（Act）的AI开发范式，模型先思考问题，推理分析并提出行动计划，然后执行行动，再基于结果进一步推理。

Agentic WorkFlow（智能体工作流）

通过·规划和编排，让智能体自由搭配功能，自动化实现复杂任务，类似可视化编程。

MCP模型上下文协议

实现AI与外部工具或数据的标准化交互。

AI实用工具

日常问题解决与知识搜索-AI对话工具

DeepSeek，豆包，元宝等一些对话模型

小项目与新项目开发-Cursor

拿cursor生成网站

老项目与大项目维护-AI IDE插件

GodeGeex，JetBrains Assistant

其他开发场景

Chat2DB，PostMan，Wrap AI提交代码或部署项目

写作类工具

语雀·AI

作图豆包+Mermaid

AI编程技巧

prompt优化，复杂项目分模块，基于Linux开发

AI编程技术

AI开发框架

SpringAI，LangChain4j，LangGraph

场景	推荐框架	优势
Java企业应用	SpringAI	无缝继承Spring生态
智能体开发	LangChain4j	完整Agnet工具链
复杂工作流	LangGraph	可视化编排

AI集成

本地部署（Ollama框架）或者AI云服务

AI领域业务

RAG知识库

多模态

MCP服务

ReAct智能体

AI工具链

低代码平台

工具库

Vercel 部署前端

Sealos 云原生应用管理

Railway Docker部署

AI大模型接入

大模型概念

涌现

模型参数两和训练数据量的增加，模型会展现出训练过程中未明确赋予的新能力，比如逻辑推理，代码编写，多步骤问题解决。

大模型分类

按模态分

单模态:处理单一类型数据

多模态模型：处理多种类型信息

按开源性分

闭源模型：不公开模型权重和训练方法

GPT-4，Claude，Gemini

开源模型：公开模型权重，允许下载和自行部署

Llama系列，Mistral，Falcon

按规模分

超大规模：参数级别在千亿和数万亿

GPT-4，能力强大，但需要大量计算资源

中小规模类型：参数量在几十亿到几百亿

llama3,Mistral 7B

按用途分

通用模型:能处理广泛任务

GPT-4，Calude 3，Gemini

特定领域模型

医疗：MedPaLM2

代码：CodeLlama，StarCoder

科学：Galactica

大模型开发流程

AI基础开发流程

如何对比和选择大模型

维度类别	具体评估点	说明
功能支持维度	多模态能力	纯文本处理，图像理解（FPT-4V，Gemini)音频/视频处理（GPT-4o)代码生成与理解（CodeLlama）
工具使用能力	函数调用支持，工具集成能力，外部API连接能力
上下问窗口大小	输入上下问长度（4K至128Ktokens）长文档的处理能力
指令遵循能力	复杂指令处理能力，多步骤任务执行能力，回答格式控制能力
响应质量	输出流畅性与连贯性，回答相关性与深度，语言表达自然度
知识时效性	知识截止日期，更新频率
部署与集成维度	部署方式	云Api服务，本地部署可能性，私有云部署支持
API接口	接口稳定性与可靠性，SDK支持情况，开发框架集成
并发处理能力	请求吞吐量，并发请求处理能力，服务水平协议（SLA）保障
商业与合规维度	成本效益	API调用价格，批量调用折扣，计算资源成本
数据安全与隐私	数据使用政策，是否支持不保存用户数据，企业级安全合规
法律合规性	地区可用性，版权与知识产权问题，内容安全审查机制
生态与支持维度	社区支持	开发者社区活跃度，问题解决资源丰富度，第三方扩展工具
文档完善	API文档质量，示例代码丰富度，最佳实践指南
技术支持	官方支持渠道，响应时间，企业级支持选项
性能指标维度	准确性	知识准确度，推理能力水平，幻觉的倾向性

四种接入方式的对比

AI应用开发

prompt工程

核心-基于角色的分类

用户prompt:这是用户向AI提供的实际问题，指令或信息
系统prompt：这是设置AI模型星轨规则和角色定位的隐藏指令，相当于给AI设定人格和能力边界
助手prompt：AI模型的响应内容，在多轮对话中，之前助手的回复也会成为当前上下文的一部分，影响后续对话理解和生成

扩展知识-基于功能的分类

指令型提示词：明确告诉AI模型需要干什么

翻译下下文本为英文：春天来了，花儿开了

对话型提示词：模拟自然对话

你认为人工智能在未来会取代人类工作，啊

创意型提示词：引导AI模型进行创意内容生成
角色扮演提示词：让AI扮演特定角色或人物进行回答
少样本学习提示词：引导AI理解所需的输出和风格

扩展知识-基于复杂度的回答

简单提示词：单一指令或问题，没有复杂的背景或约束条件
复合提示词:包含多个指令或步骤
链式提示词：一系列连续的，相互依赖的提示词
模板提示词：包含可替换变量的标准化提示词，常用于大规模应用

Token成本优化技巧

精简系统提示词，提取主谓宾
定期清理历史对话，以总结替换完整历史对话
使用向量检索代替直接输入
结构化替代自然语言，使用表格，列表等结构化格式代替长段落描述

prompt优化技巧

promp提示词库

基础提示技巧

明确指定任务和角色定位

系统：你是一位经验丰富的python教师，擅长向初学者解释编程概念

提供详细说明和具体示例

请提供一个社交媒体营销计划，针对一款新上市的智能手表。计划应
1.目标受众描述
2.三个内容主题
3.每个平台的内容类型建议
4.发布频率建议
示例格式:
目标受众:[描述]
内容主题:[主题1],[主题2]，[主题3]
平台策略:[平台]-[内容类型]-[频率]

使用结构化格式引导思维

分析以下公司的优势和劣势:公司:Tesla
请使用表格格式回答，包含以下列:
-优势(最少3项)
-每项优势的简要分析
-劣势(最少3项)
-每项劣势的简要分析
-应对建议

明确输出格式要求

撰写一篇关于气候变化的科普文章，要求:
-使用通俗易懂的语言，适合高中生阅读
-包含5个小标题，每个标题下2-3段文字
-总字数控制在800字左右
-结尾提供3个可行的个人行动建议

进阶提示技巧

思维链提示法（Chain-of-Thought）

问题:一个商店售卖T恤，每件15元。如果购买5件以上可以享受8折优惠
请一步步思考解决这个问题:
1.首先计算7件T恤的原价
2.确定是否符合折扣条件
3.如果符合，计算折扣后的价格
4.得出最终支付金额

少样本学习（Few-Shot-Learning）

我将给你一些情感分析的例子，然后请你按照同样的方式分析新句子的输出
输入:"这家餐厅的服务太差了，等了一个小时才上菜"
输出:负面，因为描述了长时间等待和差评服务

输入:"新买的手机屏幕清晰，电池也很耐用
输出:正面，因为赞扬了产品的多个方面

现在分析这个句子:
"这本书内容还行，但是价格有点贵"

分步骤指导（Step-by-Step）

请帮我创建一个简单的网站落地页设计方案，按照以下步骤:

步骤1: 分析目标受众(考虑年龄、职业、需求等因素)
步骤2: 确定页面核心信息(主标题、副标题、价值主张)
步骤3: 设计页面结构(至少包含哪些区块)
步骤4: 制定视觉引导策略(颜色、图像建议)
步骤5: 设计行动召唤(CTA)按钮和文案

自我评估和修正

解决以下概率问题:
从一副标准扑克牌中随机抽取两张牌，求抽到至少一张红桃的概率。

首先给出你的解答，然后:
1. 检查你的推理过程是否存在逻辑错误
2. 验证你使用的概率公式是否正确
3. 检查计算步骤是否有误
4. 如果发现任何问题，提供修正后的解答

知识检索和引用

请解释光合作用的过程及其在植物生长中的作用。在回答中:
1. 提供光合作用的科学定义
2. 解释主要的化学反应
3. 描述影响光合作用效率的关键因素
4. 说明其对生态系统的重要性

对于任何可能需要具体数据或研究支持的陈述，请明确指出这些信息的来源，并说明这些信息的可靠性。

多视角分析

分析"城市应该禁止私家车进入市中心"这一提议:

请从以下4个不同角度分析:
1. 环保专家视角
2. 经济学家视角
3. 市中心商户视角
4. 通勤居民视角

对每个视角:
- 提供支持该提议的2个论点
- 提供反对该提议的2个论点
- 分析可能的折中方案

多模态思维

设计一个智能家居系统的基础架构:

1. 首先用文字描述系统的主要功能和组件
2. 然后创建一个系统架构图(用ASCII或文本形式表示)
3. 接着提供用户交互流程
4. 最后简述实现这个系统可能面临的技术挑战

尝试从不同角度思考:功能性、用户体验、技术实现、安全性等。

提示词调试与优化

迭代式提示优化

初始提示: 谈谈人工智能的影响。

[收到笼统回答后]
改进提示: 分析人工智能对医疗行业的三大积极影响和两大潜在风险，提供具体应用案例。

[如果回答仍然不够具体]
进一步改进: 详细分析AI在医学影像诊断领域的具体应用，包括:
1. 现有的2-3个成功商业化AI诊断系统及其准确率
2. 这些系统如何辅助放射科医生工作
3. 实施过程中遇到的主要挑战
4. 未来3-5年可能的技术发展方向

边界测试极限情况测试模型的能力边界，找出优化空间

尝试解决以下具有挑战性的数学问题:
证明在三角形中，三条高的交点、三条中线的交点和三条角平分线的交点在同一条直线上。

如果你发现难以直接证明:
1. 说明你遇到的具体困难
2. 考虑是否有更简单的方法或特例可以探讨
3. 提供一个思路框架，即使无法给出完整证明

提示词模板化

创建结构化模板，针对类似任务进行一致性提示，避免每次输出产生较大区别，不利于调试

【专家角色】: {领域}专家
【任务描述】: {任务详细说明}
【所需内容】:
- {要点1}
- {要点2}
- {要点3}
【输出格式】: {格式要求}
【语言风格】: {风格要求}
【限制条件】: {字数、时间或其他限制}

例如:
【专家角色】: 营养学专家
【任务描述】: 为一位想减重的上班族设计一周健康饮食计划
【所需内容】:
- 七天的三餐安排
- 每餐的大致卡路里
- 准备建议和购物清单
【输出格式】: 按日分段，每餐列出具体食物
【语言风格】: 专业但友好
【限制条件】: 考虑准备时间短，预算有限

错误分析与修正

系统性分析模型回答中的错误，并针对性优化提示词

我发现之前请你生成的Python代码存在以下问题:
1. 没有正确处理文件不存在的情况
2. 数据处理逻辑中存在边界条件错误
3. 代码注释不够详细

请重新生成代码，特别注意:
1. 添加完整的异常处理
2. 测试并确保所有边界条件
3. 为每个主要函数和复杂逻辑添加详细注释
4. 遵循PEP 8编码规范

MCP协议

什么是MCP

官方定义：MCP 是一种开放协议，它标准化了应用程序如何为 LLM 提供上下文。将 MCP 想象成 AI 应用程序的 USB-C 端口。正如 USB-C 提供了一种将设备连接到各种外围设备和配件的标准化方式一样，MCP 也提供了一种将 AI 模型连接到不同数据源和工具的标准化方式。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31