AI相关学习
AI基础知识学习
AI核心概念
温度
描述大模型输出的随机性,温度越高,输出越随机,温度越低,输出越固定保守。
Prompt提示词
输入给ai的内容称为提示词,分为系统提示词和用户提示词,系统提示词整体约束ai的输出,用户提示词会随用随输。
Token
token是大语言模型处理文本的基本单位,可能是单词或标点符号。
模型蒸馏
将复杂大模型的知识转移到更小模型,保持模型性能的同时,减小模型体积,降低推理成本。
多模态
一种大模型类型,可以同时理解和处理多种类型的信息,比如文本,图像,音频和视频,实现文生图,图生文。
RAG
知识检索增强,大模型的信息不准确时,需要额外的知识信息,RAG就作为大模型的额外补充知识库
Embedding嵌入
可以说是向量化,将文本,图像等数据转换为向量表示,并写入向量数据库中。
思维链(CoT)和ReAct
思维链(CoT):让模型详细介绍中间步骤和推理过程,像DeepSeek的深度思考。
ReAcT:结合推理(Reason)和行动(Act)的AI开发范式,模型先思考问题,推理分析并提出行动计划,然后执行行动,再基于结果进一步推理。
Agentic WorkFlow(智能体工作流)
通过·规划和编排,让智能体自由搭配功能,自动化实现复杂任务,类似可视化编程。
MCP模型上下文协议
实现AI与外部工具或数据的标准化交互。
AI实用工具
日常问题解决与知识搜索-AI对话工具
DeepSeek,豆包,元宝等一些对话模型
小项目与新项目开发-Cursor
拿cursor生成网站
老项目与大项目维护-AI IDE插件
GodeGeex,JetBrains Assistant
其他开发场景
Chat2DB,PostMan,Wrap AI提交代码或部署项目
写作类工具
语雀·AI
作图 豆包+Mermaid
AI编程技巧
prompt优化,复杂项目分模块,基于Linux开发
AI编程技术
AI开发框架
SpringAI,LangChain4j,LangGraph
| 场景 | 推荐框架 | 优势 |
|---|---|---|
| Java企业应用 | SpringAI | 无缝继承Spring生态 |
| 智能体开发 | LangChain4j | 完整Agnet工具链 |
| 复杂工作流 | LangGraph | 可视化编排 |
AI集成
本地部署(Ollama框架)或者AI云服务
AI领域业务
RAG知识库
多模态
MCP服务
ReAct智能体
AI工具链
低代码平台
工具库
Vercel 部署前端
Sealos 云原生应用管理
Railway Docker部署
AI大模型接入
大模型概念
涌现
模型参数两和训练数据量的增加,模型会展现出训练过程中未明确赋予的新能力,比如逻辑推理,代码编写,多步骤问题解决。
大模型分类
按模态分
单模态:处理单一类型数据
多模态模型:处理多种类型信息
按开源性分
闭源模型:不公开模型权重和训练方法
GPT-4,Claude,Gemini
开源模型:公开模型权重,允许下载和自行部署
Llama系列,Mistral,Falcon
按规模分
超大规模:参数级别在千亿和数万亿
GPT-4,能力强大,但需要大量计算资源
中小规模类型:参数量在几十亿到几百亿
llama3,Mistral 7B
按用途分
通用模型:能处理广泛任务
GPT-4,Calude 3,Gemini
特定领域模型
医疗:MedPaLM2
代码:CodeLlama,StarCoder
科学:Galactica
大模型开发流程
AI基础开发流程
如何对比和选择大模型
| 维度类别 | 具体评估点 | 说明 |
|---|---|---|
| 功能支持维度 | 多模态能力 | 纯文本处理,图像理解(FPT-4V,Gemini)音频/视频处理(GPT-4o)代码生成与理解(CodeLlama) |
| 工具使用能力 | 函数调用支持,工具集成能力,外部API连接能力 | |
| 上下问窗口大小 | 输入上下问长度(4K至128Ktokens) 长文档的处理能力 | |
| 指令遵循能力 | 复杂指令处理能力,多步骤任务执行能力,回答格式控制能力 | |
| 响应质量 | 输出流畅性与连贯性,回答相关性与深度,语言表达自然度 | |
| 知识时效性 | 知识截止日期,更新频率 | |
| 部署与集成维度 | 部署方式 | 云Api服务,本地部署可能性,私有云部署支持 |
| API接口 | 接口稳定性与可靠性,SDK支持情况,开发框架集成 | |
| 并发处理能力 | 请求吞吐量,并发请求处理能力,服务水平协议(SLA)保障 | |
| 商业与合规维度 | 成本效益 | API调用价格,批量调用折扣,计算资源成本 |
| 数据安全与隐私 | 数据使用政策,是否支持不保存用户数据,企业级安全合规 | |
| 法律合规性 | 地区可用性,版权与知识产权问题,内容安全审查机制 | |
| 生态与支持维度 | 社区支持 | 开发者社区活跃度,问题解决资源丰富度,第三方扩展工具 |
| 文档完善 | API文档质量,示例代码丰富度,最佳实践指南 | |
| 技术支持 | 官方支持渠道,响应时间,企业级支持选项 | |
| 性能指标维度 | 准确性 | 知识准确度,推理能力水平,幻觉的倾向性 |
四种接入方式的对比
AI应用开发
prompt工程
核心-基于角色的分类
- 用户prompt:这是用户向AI提供的实际问题,指令或信息
- 系统prompt:这是设置AI模型星轨规则和角色定位的隐藏指令,相当于给AI设定人格和能力边界
- 助手prompt:AI模型的响应内容,在多轮对话中,之前助手的回复也会成为当前上下文的一部分,影响后续对话理解和生成
扩展知识-基于功能的分类
- 指令型提示词:明确告诉AI模型需要干什么
翻译下下文本为英文:春天来了,花儿开了
- 对话型提示词:模拟自然对话
你认为人工智能在未来会取代人类工作,啊
- 创意型提示词:引导AI模型进行创意内容生成
- 角色扮演提示词:让AI扮演特定角色或人物进行回答
- 少样本学习提示词:引导AI理解所需的输出和风格
扩展知识-基于复杂度的回答
- 简单提示词:单一指令或问题,没有复杂的背景或约束条件
- 复合提示词:包含多个指令或步骤
- 链式提示词:一系列连续的,相互依赖的提示词
- 模板提示词:包含可替换变量的标准化提示词,常用于大规模应用
Token成本优化技巧
- 精简系统提示词,提取主谓宾
- 定期清理历史对话,以总结替换完整历史对话
- 使用向量检索代替直接输入
- 结构化替代自然语言,使用表格,列表等结构化格式代替长段落描述
prompt优化技巧
promp提示词库
基础提示技巧
- 明确指定任务和角色定位
系统:你是一位经验丰富的python教师,擅长向初学者解释编程概念 - 提供详细说明和具体示例
请提供一个社交媒体营销计划,针对一款新上市的智能手表。计划应 1.目标受众描述 2.三个内容主题 3.每个平台的内容类型建议 4.发布频率建议 示例格式: 目标受众:[描述] 内容主题:[主题1],[主题2],[主题3] 平台策略:[平台]-[内容类型]-[频率] - 使用结构化格式引导思维
分析以下公司的优势和劣势:公司:Tesla 请使用表格格式回答,包含以下列: -优势(最少3项) -每项优势的简要分析 -劣势(最少3项) -每项劣势的简要分析 -应对建议 - 明确输出格式要求
撰写一篇关于气候变化的科普文章,要求: -使用通俗易懂的语言,适合高中生阅读 -包含5个小标题,每个标题下2-3段文字 -总字数控制在800字左右 -结尾提供3个可行的个人行动建议
进阶提示技巧
- 思维链提示法(Chain-of-Thought)
问题:一个商店售卖T恤,每件15元。如果购买5件以上可以享受8折优惠 请一步步思考解决这个问题: 1.首先计算7件T恤的原价 2.确定是否符合折扣条件 3.如果符合,计算折扣后的价格 4.得出最终支付金额 - 少样本学习(Few-Shot-Learning)
我将给你一些情感分析的例子,然后请你按照同样的方式分析新句子的输出 输入:"这家餐厅的服务太差了,等了一个小时才上菜" 输出:负面,因为描述了长时间等待和差评服务 输入:"新买的手机屏幕清晰,电池也很耐用 输出:正面,因为赞扬了产品的多个方面 现在分析这个句子: "这本书内容还行,但是价格有点贵" - 分步骤指导(Step-by-Step)
请帮我创建一个简单的网站落地页设计方案,按照以下步骤: 步骤1: 分析目标受众(考虑年龄、职业、需求等因素) 步骤2: 确定页面核心信息(主标题、副标题、价值主张) 步骤3: 设计页面结构(至少包含哪些区块) 步骤4: 制定视觉引导策略(颜色、图像建议) 步骤5: 设计行动召唤(CTA)按钮和文案 - 自我评估和修正
解决以下概率问题: 从一副标准扑克牌中随机抽取两张牌,求抽到至少一张红桃的概率。 首先给出你的解答,然后: 1. 检查你的推理过程是否存在逻辑错误 2. 验证你使用的概率公式是否正确 3. 检查计算步骤是否有误 4. 如果发现任何问题,提供修正后的解答 - 知识检索和引用
请解释光合作用的过程及其在植物生长中的作用。在回答中: 1. 提供光合作用的科学定义 2. 解释主要的化学反应 3. 描述影响光合作用效率的关键因素 4. 说明其对生态系统的重要性 对于任何可能需要具体数据或研究支持的陈述,请明确指出这些信息的来源,并说明这些信息的可靠性。 - 多视角分析
分析"城市应该禁止私家车进入市中心"这一提议: 请从以下4个不同角度分析: 1. 环保专家视角 2. 经济学家视角 3. 市中心商户视角 4. 通勤居民视角 对每个视角: - 提供支持该提议的2个论点 - 提供反对该提议的2个论点 - 分析可能的折中方案 - 多模态思维
设计一个智能家居系统的基础架构: 1. 首先用文字描述系统的主要功能和组件 2. 然后创建一个系统架构图(用ASCII或文本形式表示) 3. 接着提供用户交互流程 4. 最后简述实现这个系统可能面临的技术挑战 尝试从不同角度思考:功能性、用户体验、技术实现、安全性等。
提示词调试与优化
- 迭代式提示优化
初始提示: 谈谈人工智能的影响。 [收到笼统回答后] 改进提示: 分析人工智能对医疗行业的三大积极影响和两大潜在风险,提供具体应用案例。 [如果回答仍然不够具体] 进一步改进: 详细分析AI在医学影像诊断领域的具体应用,包括: 1. 现有的2-3个成功商业化AI诊断系统及其准确率 2. 这些系统如何辅助放射科医生工作 3. 实施过程中遇到的主要挑战 4. 未来3-5年可能的技术发展方向 - 边界测试 极限情况测试模型的能力边界,找出优化空间
尝试解决以下具有挑战性的数学问题: 证明在三角形中,三条高的交点、三条中线的交点和三条角平分线的交点在同一条直线上。 如果你发现难以直接证明: 1. 说明你遇到的具体困难 2. 考虑是否有更简单的方法或特例可以探讨 3. 提供一个思路框架,即使无法给出完整证明 - 提示词模板化
创建结构化模板,针对类似任务进行一致性提示,避免每次输出产生较大区别,不利于调试
【专家角色】: {领域}专家 【任务描述】: {任务详细说明} 【所需内容】: - {要点1} - {要点2} - {要点3} 【输出格式】: {格式要求} 【语言风格】: {风格要求} 【限制条件】: {字数、时间或其他限制} 例如: 【专家角色】: 营养学专家 【任务描述】: 为一位想减重的上班族设计一周健康饮食计划 【所需内容】: - 七天的三餐安排 - 每餐的大致卡路里 - 准备建议和购物清单 【输出格式】: 按日分段,每餐列出具体食物 【语言风格】: 专业但友好 【限制条件】: 考虑准备时间短,预算有限 - 错误分析与修正
系统性分析模型回答中的错误,并针对性优化提示词
我发现之前请你生成的Python代码存在以下问题: 1. 没有正确处理文件不存在的情况 2. 数据处理逻辑中存在边界条件错误 3. 代码注释不够详细 请重新生成代码,特别注意: 1. 添加完整的异常处理 2. 测试并确保所有边界条件 3. 为每个主要函数和复杂逻辑添加详细注释 4. 遵循PEP 8编码规范
MCP协议
什么是MCP
官方定义:MCP 是一种开放协议,它标准化了应用程序如何为 LLM 提供上下文。将 MCP 想象成 AI 应用程序的 USB-C 端口。正如 USB-C 提供了一种将设备连接到各种外围设备和配件的标准化方式一样,MCP 也提供了一种将 AI 模型连接到不同数据源和工具的标准化方式。
一般架构

SDK三层架构



