pve直通显卡到ubuntu

发表于 2025-12-01 分类于个人服务运维
本文字数： 727 阅读时长 ≈ 3 分钟

在EPYC平台的PVE环境中直通英伟达显卡到Ubuntu虚拟机，需要按照以下步骤进行配置：

一、BIOS设置

首先需要在主板BIOS中开启相关虚拟化功能：
• AMD平台：开启SVM Mode和IOMMU

• Intel平台：开启VT-d

• 确保UEFI启动模式，关闭Legacy boot或CSM

二、PVE宿主机配置

修改GRUB启动参数
编辑/etc/default/grub文件，修改GRUB_CMDLINE_LINUX_DEFAULT参数：

# AMD平台
GRUB_CMDLINE_LINUX_DEFAULT="quiet amd_iommu=on iommu=pt initcall_blacklist=sysfb_init pcie_acs_override=downstream"

# Intel平台  
GRUB_CMDLINE_LINUX_DEFAULT="quiet intel_iommu=on iommu=pt initcall_blacklist=sysfb_init pcie_acs_override=downstream"

更新GRUB配置：update-grub

加载VFIO模块
编辑/etc/modules文件，添加以下模块：
1
2
3
vfio_iommu_type1
vfio_pci
vfio_virqfd

屏蔽宿主机显卡驱动
编辑/etc/modprobe.d/pve-blacklist.conf，添加黑名单：

# NVIDIA显卡
blacklist nvidiafb
blacklist nouveau
blacklist nvidia

# AMD显卡
blacklist amdgpu
blacklist radeon

# Intel集显
blacklist snd_hda_codec_hdmi
blacklist snd_hda_intel
blacklist snd_hda_codec
blacklist snd_hda_core

配置vfio-pci绑定
获取显卡设备ID：

1 2	lspci -nn \| grep -i "VGA" lspci -nn \| grep -i "audio"

创建/etc/modprobe.d/vfio.conf文件：

1
2
3

options vfio-pci ids=10de:1287,10de:0e0f
softdep nouveau pre: vfio-pci
softdep nvidia pre: vfio-pci

忽略NVIDIA显卡警告
编辑/etc/modprobe.d/kvm.conf：
1
options kvm ignore_msrs=1 report_ignored_msrs=0
更新内核并重启
1
2
update-initramfs -u -k all
reboot

三、验证配置

重启后验证IOMMU是否启用：

1 2	dmesg \| grep -e DMAR -e IOMMU dmesg \| grep 'remapping'

检查vfio-pci是否接管显卡：

1	lspci -nnk \| grep -A3 -E "10de:1287\|10de:0e0f"

四、创建Ubuntu虚拟机

虚拟机配置

• 机型：选择q35

• BIOS：改为UEFI（OVMF）

• CPU类型：设为host（提升性能兼容性）

• 内存：建议8GB及以上

• 磁盘：SCSI控制器选择VirtIO SCSI

添加显卡设备

在PVE Web界面中：

选择目标虚拟机 → “硬件”
点击”添加” → “PCI设备”
选择目标显卡设备
重要：勾选”所有功能(All Functions)”和”PCI-Express”
保存设置
关闭安全启动

在虚拟机BIOS中关闭Secure Boot，避免驱动安装问题

五、Ubuntu虚拟机内安装驱动

添加NVIDIA PPA

1 2	sudo add-apt-repository ppa:graphics-drivers/ppa -y sudo apt update

安装推荐驱动
在Manual Driver Search中查看显卡在环境推荐的驱动版本号
sudo apt install nvidia-driver-xxx

禁用nouveau驱动

1 2	echo -e "blacklist nouveau\noptions nouveau modeset=0" \| sudo tee /etc/modprobe.d/blacklist-nouveau.conf sudo update-initramfs -u

重启并验证
1
2
sudo reboot
nvidia-smi

六、常见问题排查

直通成功但nvidia-smi无输出

检查是否在PVE中正确添加了PCI设备，确保勾选了”所有功能”

驱动安装报错

• 确保关闭了安全启动

• 检查内核版本兼容性

• 尝试安装开源版本驱动（对于50系列显卡）

性能问题

• 确保CPU类型设置为host

• 启用NUMA支持

• 配置大页内存（可选）

通过以上步骤，您应该能够在EPYC平台的PVE环境中成功直通英伟达显卡到Ubuntu虚拟机，实现接近原生性能的GPU加速功能。

佛山家具选购经验

发表于 2025-08-18 更新于 2025-12-01 分类于生活
本文字数： 2.3k 阅读时长 ≈ 8 分钟

佛山家具大体介绍

家具大部分都在顺德区。除了几个家居商城，厂家都比较分散，小红书上广告比较多的店，从最北边到最南边要开上30分钟的车。

商场
- 罗浮宫：里面的东西都比较贵，有时间可以去看看，没时间就不用去了
- 顺联北：价格中等。但你自己去逛一般也逛不出什么名堂
- 乐从国际家私城：低端家具。我在桔子酒店住的时候，第二天退房就有工作人员忽悠我去这里，说120可以包一天车，听起来很划算，但我觉得他肯定会想办法拉你去他合作的店来抽成，别贪小便宜。
小红书上比较有名的厂家
太多了不一一列举。这些厂家也大体可以分为中端、中高端，高端。高端我没看，中高端的比如观山，众观，博领，摩登翡丽。中高端比平价能贵出1-2倍。

攻略

行程安排

不论你的预算是多少，我都建议你第一天先去看看比你预算高一档的厂，感受一下更好的货的价格，做工和坐感。
第二天再去你目标价位的厂和比你目标价位更低的厂去看，看看价格相差多少，品质相差多少。

找店一定要先确定店的主营风格，很少有全部风格全都做的，风格不对去了也白去。

除了罗浮宫的进口观需要预约（很麻烦），商场可以直接去。
大部分厂家的直营店去看的话是要预约的。当天预约也行，从小红书找他们账号联系。主要是有的地方没人接待你上都上不去。
不同的获客渠道会给你报不同的价格，这里面门道我还没有摸得太清楚。但我觉得只要有中介就会有抽成，所以不要通过第三方去联系，从小红书直接联系应该是能获得较低报价的。

门店总体价位判断

我在b站上学了一招，很好用。就是找一个标品，看看厂家怎么报价。b站是推荐的标品是外面包裹着钢架+编织布的皮沙发，18元一尺的皮，3个模块，大概3米的样子。这个东西价格成本比较透明，不同厂家都差不多，卖价基本上在12000-18000的样子。我在一个平价店和一个中高端店看到了这个沙发，我问的是布沙发的价格，真就一个报12000一个报18000。

沙发品质判断

对于皮质沙发来说，最重要的区别是全皮\半皮全青\半青

全皮：所有面都是用真皮
半皮：接触面用真皮，非接触面用看起来差不多的人造皮。但不同厂家对“非接触面”的定义不一样
全青：头层皮，通常更贵，更好看
半青：二层皮，通常更便宜，但更耐用

b站上也教了不少其他指标，例如：

海绵硬度（多少多少D，一般硬度越高越贵海绵一般大家都用三层，不同层硬度不同，所以也没有严格的可比性）
海绵高度（多少多少分，就是多少多少厘米我问了好几个销售这个问题，他们都一脸懵逼，看来不是常用指标）
五金材料（铝>不锈钢>铁\高碳钢铁不好，一般是不锈钢）
骨架木料（橡木、胡桃木>松木>桉木、橡胶木一般是用松木）
皮革价格（多少多少钱1尺）

我觉得最有用的还是皮革价格这一指标。其他项大家基本都差不多。

全青皮通常是 25-35元，高的能到50
半青皮通常是 16-20元，低的见过12的
不同的商家，用同样价格的皮，售价有时候能差出1倍，我很震惊。

谈价

谈价部分我说的也仅供参考。因为中高端的我没怎么谈价，中端家具店的谈价空间很小。但总的来说，在厂家报了价后，肯定还有一个折扣是可以谈的。名义上是你买的多，就给你打98、95、90折这样,但有的销售嘴就很松，你买的少也可以尝试争取9折优惠。

去的厂家

奥蓝图/吾距

产品中端，价格中高端。
第一家去的，价格偏贵，东西偏差。
4米迪兰沙发半皮半青报价21000。展厅的迪兰沙发有非常明显的两处瑕疵，我在更便宜的厂都没看到类似问题。
多层板包皮的餐桌要卖到6000，正常是2000的样子。

众观

中高端，东西不错，但很贵。
展厅做得非常好，很新，搭配都不错。博领的销售和我说，众观是靠和买手孙耀合作发展起来的，东西偏贵。在酒店拉客的司机也推荐我去这里，这里的东西渠道溢价可能是比较高的。
3.6米迪兰沙发半青（忘记是全皮还是半皮了）报价41000

博领

中高端，东西不错，价格小贵。
展厅在顺联北，分散有20多个展厅，不停的到处走。东西很多，有好多款式别的地方根本找不到。我们在这里看中的件是最多的，但买不太起。迪兰全皮半青报价32000
博领是意式中高端家具里绕不开的一个店，一定要去看看。完全可以以它为基准。

布兰洛

中端，质量价格都是中等。
属于是中端里面的标杆。展厅比较老了，搭配得也不是特别好，但一看就知道卖得多，参数非常全。
迪兰半皮半青报价18500

摩登翡丽

中高端。相当贵，以轻奢为主，我是极简，随便看了一下，迪兰报价55000。不值当

库兰德

中端，东西还行，价格非常便宜。
是看的这些店最便宜的。迪兰半青半皮报价13500。
地方不太好找，电梯自己不能按，得站里面，老板在上面按才能送上去。但东西是真便宜，质量也不错，仔细看了一下，没有什么瑕疵。我们仔细体验了一下迪兰的坐感，是挺舒服的，但比起标准的迪兰偏软，尺寸比标准的也小了十几公分，但都不算是缺点。
这种就属于是平价的店，比长沙便宜几千。大概率床和沙发在这里买。

方匠

中端，东西挺好，价格便宜。
所有品类都不贵，都是属于合理的价格。没有迪兰沙发，像素沙发全皮全青报价20800，这个价格是相当便宜的了，坐起来非常舒服，用的全青皮说是28.8一尺，一度犹豫要不要买这个沙发。1.6米岩板餐桌2000,1.8米中花白奢石餐桌5300，都属于是非常合理的价格。
在这里看中了休闲椅，餐桌，学习桌，椅子。

观山

中高端。东西很好，但贵。
本来是寄予厚望的，没想到太贵了。同样是18元一尺的半青皮，迪兰半皮沙发报价27295，比库兰德贵一倍。工厂就在展厅下面，我们还去逛了一下工厂，看了一下半成品，东西确实精致。

厂家评价总结表

厂家	定位	质量/做工	价格	典型报价	备注	推荐
奥蓝图/吾距	中端产品，价格中高端	东西偏差，展厅沙发有明显瑕疵	偏贵	4米迪兰半皮半青 21000；多层板包皮餐桌 6000（常见≈2000）	第一家看的，性价比不佳	低
众观	中高端	东西不错、展厅很新	很贵（疑似渠道溢价高）	3.6米迪兰半青 41000（全/半皮不确定）	与买手合作出圈，溢价高	中-
博领	中高端	东西不错、款式多	价格小贵	迪兰全皮半青 32000	顺联北展厅分散多；中高端基准店	中+
布兰洛	中端	质量中等	价格中等	迪兰半皮半青 18500	展厅偏老，参数齐全	中
摩登翡丽	中高端（轻奢）	—	非常贵	迪兰 55000	轻奢为主，对极简不友好	低
库兰德	中端	细看无明显瑕疵，坐感偏软	非常便宜	迪兰半青半皮 13500	地点隐蔽；尺寸比标准略小但可接受	高（沙发/床优先考虑）
方匠	中端	东西挺好，像素沙发坐感佳	便宜且合理	像素沙发全皮全青 20800（皮28.8/尺）；1.6m岩板桌 2000；1.8m中花白奢石桌 5300	全品类价格友好，无迪兰；看中多件品类	高
观山	中高端	做工精致、东西很好	贵	迪兰半皮，半青18/尺报价27295	工厂在展厅下，半成品精致	中

hive数据跨集群迁移方法

发表于 2025-07-07 更新于 2025-12-01 分类于技术笔记
本文字数： 269 阅读时长 ≈ 1 分钟

使用csv为载体

从原集群中导出数据为csv。可以使用语句，也可以使用dbeaver之类的数据库连接软件
删除第一行表头，删除所有双引号
存储到新集群的hdfs中 hadoop dfs -put export.csv /user/username

新hive集群创建分区表，另外创建接受csv数据的临时表。csv文件无法直接导入分区表中，只能额外使用一张临时表过渡一下

drop table db.tablename_csv;
CREATE TABLE db.tablename_csv (
   columns
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '$'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

load data inpath '/user/username/export.csv' into table db.tablename_csv; 
-- ALTER TABLE db.tablename DROP PARTITION (logdate <= 20230605);

在trino中将csv临时表数据导入分区表中

1 2	insert into hive.db.tablename select * from hive.db.tablename_csv where logdate>'20240605';

使用hive export的方式

原集群上导出数据：

hadoop dfs -mkdir /user/username/db.table
hive>export table db.table to '/user/username/db.table';
hadoop dfs -get  /user/username/db.tablename
tar -czvf ./tablename.tar.gz ./db.tablename/

export语句是可以指定分区的，但似乎只能指定一个分区。

新集群上导入数据：

1 2	hadoop dfs -put db.tablename /user/username hive>import table db.tablename from '/user/username/db.tablename';

AI架构展望

发表于 2025-05-12 更新于 2025-12-01 分类于 AI
本文字数： 6.6k 阅读时长 ≈ 24 分钟

架构图

背景

大数据与AI的关系

大数据让人工智能变得更加智能，
人工智能让大数据变得更有价值。

大数据为AI提供“燃料”
- 训练基础：深度学习模型依赖大量数据训练，数据量直接影响模型性能。
- 多样性增强：结构化与非结构化数据的融合（如文本、图像、传感器数据）帮助AI捕捉复杂模式。
- 数据质量提升：清洗与标注技术优化减少AI模型的“垃圾输入”问题。
AI为大数据提炼价值
- 智能分析：AI通过深度学习从数据中自动发现非线性关系。
- 实时决策：结合流数据处理，AI实现秒级甚至毫秒级响应。
- 数据生成与增强：生成式AI可合成虚拟数据，缓解数据稀缺问题。

AI数字化转型路线

基础设施云化与数据资产化
核心目标：构建数字化底座，让数据成为核心资产
- 云原生架构：采用混合云、私有云，提升弹性算力（如中信证券与阿里云合作搭建金融云）。
- 数据中台：整合交易、客户、市场数据，形成统一数据资产（如华泰证券的“数据工厂”）。
- AI 算力储备：部署 GPU/TPU 集群，支持大模型训练（如国泰君安自建 AI 算力中心）。
业务智能化与自动化
核心目标：用 AI 重构核心业务流程，提升效率与体验
- 智能投研：AI 辅助研报生成、舆情分析（如中金公司“AI 策略报告”）。
- 智能投顾：个性化资产配置（如广发证券“贝塔牛”）。
- 智能风控：实时监测异常交易（如东方证券 AI 风控系统）。
- RPA+AI：自动化运营（如东吴证券合同审核效率提升 80%）。
服务场景化与生态化
核心目标：从“单一金融产品”转向“场景化服务生态”
- 嵌入场景：与互联网平台合作（如华泰证券与同花顺、雪球合作）。
- 开放 API：让客户、第三方开发者接入（如中信证券 CAP 开放平台）。
- 数字员工：AI 客服、AI 投顾（如中信证券“数字人助理”）。

层级与组件介绍

数据层

核心作用：为上层提供多模态数据支持，以及各种形态数据的存储、管理、访问。
关键组件：
- 流式数据载体：Kafka（消息队列）
- 结构化数据：Hive（批处理结果）。
- 非结构化数据：多模态数据湖（图像视频/音频/文本/文件等）。
- 搜索工具：ES（全文检索），Milvus（向量管理与检索）。
典型应用：模型训练的数据来源、智能体的知识库基础。

多模态数据湖

以Deep Lake为例，其核心功能包括：

多模态数据支持：
支持图像、视频、音频、文本、PDF、DICOM（医学影像）等数据类型，统一存储为张量格式（如 NumPy 数组），兼容 PyTorch/TensorFlow 等框架。
版本控制：
类似 Git 的分支管理（commit/checkout）、标签功能和合并操作，便于团队协作和实验回溯。
高效查询与检索：
- TQL 查询引擎：支持语义搜索和过滤（如 ds.filter(lambda x: x.label == ‘cat’)）。
- 向量搜索：集成 LangChain/LlamaIndex，适用于 LLM 应用的嵌入检索。
性能优化：
- 流式加载：惰性加载数据，减少训练等待时间。
- 原生压缩：图像/视频保持压缩格式，节省存储空间。

向量数据库

以Milvus（Faiss基础上开发）为例，其搜索功能包括：
KNN 搜索：查找最接近查询向量的前 K 个向量。
过滤搜索：在指定的过滤条件下执行 ANN 搜索。
范围搜索：查找查询向量指定半径范围内的向量。
混合搜索：基于多个向量场进行 ANN 搜索。
全文搜索：基于 BM25 的全文搜索。
Rerankers：根据附加标准或辅助算法调整搜索结果顺序，完善初始 ANN 搜索结果。
获取：根据主键检索数据。
查询：使用特定表达式检索数据。

整体数据流向

基建层

核心能力：行业垂直模型开发与管理、知识库、AI应用程序框架、实时应用框架。
关键模块：
- 模型相关：大语言模型、Embedding生成/检索、模型蒸馏（轻量化）。
- 知识管理：检索增强（RAG）、知识库构建。
- 应用程序框架：LangChain（链式应用框架),Dify(链式应用框架的低代码平台),AutoGPT(自主任务执行），MetaGPT(多智能体协作框架)
目标：支持从通用大模型到垂直领域微调的完整流程。

行业垂直模型

本人对模型了解不多，只给出一些可能方向

金融大语言模型（LLM）
- 微调方式：
  - 指令微调（如“生成某股票的深度分析”）
  - RLHF（人类反馈强化学习）确保合规性（如避免误导性投资建议）
- 精调：数百条高质量样本，强化某些注意力头
- 核心能力：
  - 金融文本理解（如财报摘要、行业趋势分析）
  - 投资逻辑推理（如“为什么某股票近期下跌？”）
  - 合规审核（如识别潜在违规表述）
语音模型（ASR+TTS+NLP）
- 语音识别（ASR）：高精度金融术语识别（如“市盈率”“量化宽松”）。
- 语音合成（TTS）：自然语音播报（如实时行情播报、AI投顾交互）。
- 语音NLP：
  - 客户语音查询理解（如“帮我查一下宁德时代的研报”）
  - 情绪分析（如识别客户投诉或投资焦虑）
多模态模型（视觉+文本）
- 图表理解：解析K线图、财报图表、行业趋势图。
- 文档OCR：扫描合同、研报、公告，提取关键信息。
- 视频分析：解读财经新闻视频、路演直播内容。

RAG

RAG（Retrieval-Augmented Generation，检索增强生成）是AI领域的一项前沿技术，旨在通过结合外部知识检索与生成式模型的能力，提升大型语言模型（LLM）在知识密集型任务中的准确性和时效性。

RAG通过以下几个关键阶段工作：

数据准备：
- 数据提取
  - 数据加载：包括多格式数据加载、不同数据源获取等，根据数据自身情况，将数据处理为同一个范式。
  - 数据处理：包括数据过滤、压缩、格式化等。
  - 元数据获取：提取数据中关键信息，例如文件名、Title、时间等。
- 文本分割(Chunking)：
  文本分割主要考虑两个因素：1）embedding模型的Tokens限制情况；2）语义完整性对整体的检索效果的影响。一些常见的文本分割方式如下：
  - 句分割：以”句”的粒度进行切分，保留一个句子的完整语义。常见切分符包括：句号、感叹号、问号、换行符等。
  - 固定长度分割：根据embedding模型的token长度限制，将文本分割为固定长度（例如256/512个tokens），这种切分方式会损失很多语义信息，一般通过在头尾增加一定冗余量来缓解。
- 向量化（embedding）：
  向量化是一个将文本数据转化为向量矩阵的过程，该过程会直接影响到后续检索的效果。目前常见的embedding模型如表中所示，这些embedding模型基本能满足大部分需求，但对于特殊场景（例如涉及一些罕见专有词或字等）或者想进一步优化效果，则可以选择开源Embedding模型微调或直接训练适合自己场景的Embedding模型。
检索阶段：
- 文本：
  - 利用传统信息检索模型（如BM25）从外部知识库（全文搜索数据库）中检索与用户查询相关的文档片段。
  - 使用词向量，与传统信息检索模型类似
  - 利用上下文相关模型（如BERT）生成句向量进行向量检索
- 多媒体与文件：用户提问时，问题被实时向量化，通过近似最近邻（ANN）算法（如HNSW）快速匹配最相关的知识片段
生成阶段：将检索到的上下文输入LLM，生成基于实际知识的回答，而非仅依赖模型预训练的参数化知识。

检索阶段的优化途径：

查询转换。使用 LLM 作为推理引擎来修改用户输入以提高检索质量。
分层索引。摘要和正文分开索引，先快速检索摘要，再检索正文
假设性问题和 HyDE。LLM 为每个块生成一个问题，并将这些问题嵌入到向量中，在运行时对这个问题向量的索引执行查询搜索（将块向量替换为索引中的问题向量），然后在检索后路由到原始文本块并将它们作为 LLM 获取答案的上下文发送。这种方法提高了搜索质量，因为与实际块相比，查询和假设问题之间的语义相似性更高。还有一种叫做 HyDE 的反向逻辑方法——你要求 LLM 在给定查询的情况下生成一个假设的响应，然后将其向量与查询向量一起使用来提高搜索质量。
检索结果增强。两种选择：一种是将检索出来的较小的文本块的上下文一并返回；另一种是如果检索出的多个小块归属于同一个大块，则将这个大块整个返回
融合检索或混合搜索：同时使用传统全文搜索和向量检索召回结果，通过Reciprocal Rank Fusion 算法进行结果的重排序并且返回。
重排（reranking）和过滤（filtering）根据相似性分数、关键字、元数据过滤掉结果，或使用其他模型（如 LLM）、sentence-transformer 交叉编码器，Cohere 重新排名接口或者基于元数据重排它们。

常见的Embedding生成器

模型名称	类型	支持语言	最大Token	特点	适用场景
OpenAI text-embedding-3-small	文本	多语言	8192	轻量级，检索任务平均分61.0，适合快速验证	通用文本检索、RAG基础版
OpenAI text-embedding-3-large	文本	多语言	8192	高精度，检索任务平均分64.6，延迟较高	高精度语义匹配、复杂问答
BGE-M3	文本	194种	8192	多语言榜首，支持密集/稀疏/多向量检索，长文本处理强	多语言知识库、长文档解析
Sentence-BERT	文本	多语言	512	句子级嵌入，语义相似度计算精准，开源易部署	短文本匹配、推荐系统
ResNet50	图像	-	-	图像特征提取老将，适合以图搜图	电商图片检索、视频帧分析
PANNs	音频	-	-	预训练音频模型，支持音乐分类、语音检索	音频内容识别、智能客服录音分析
CLIP/SigLIP	多模态	多语言	77（文本）	文图互搜，SigLIP优化了zero-shot效果，适合跨模态搜索	广告创意检索、多模态推荐
Word2Vec	文本	单语言	-	经典词向量，训练成本低，但无法处理一词多义	简单语义分析、教学演示

词向量转句向量方法：

短文本：优先尝试BERT的[CLS]向量或SIF加权
长文档：使用LSTM分层编码或分段+池化
资源受限：TF-IDF加权平均+PCA降维
* 领域适配：在目标数据上微调Sentence-BERT

应用程序框架对比

维度	LangChain	Dify	AutoGPT	MetaGPT
产品形态	Python/JS代码库（需编程）	可视化低代码平台（BaaS+LLMOps）	自主任务执行的AI	Agent框架
抽象层级	底层模块化工具链（高灵活性）	高度封装（开箱即用）	任务自动化引擎（目标驱动）	高层工作流编排（角色分工/SOP标准化）
目标用户	开发者/技术团队（需编程能力）	全团队协作（非技术成员可参与）	个人/企业（自动化需求）	企业开发者/AI工程团队（需复杂任务自动化）
模型支持	需手动适配接口（如HuggingFace）	一键切换数百个模型（统一API）	默认依赖GPT系列，社区扩展有限	依赖大模型API（如GPT-4生成代码/规划）
扩展性	高（可集成任意API/数据库）	依赖插件市场，企业功能完善	任务分解能力强，但生态较封闭	模块化设计（可自定义角色/工具链）
核心优势	灵活性高，适合复杂系统	开发效率极快，企业级支持完善	自动化任务执行	标准化协作流程（显式分解复杂任务）
主要短板	学习曲线陡峭，维护成本高	定制能力有限	资源消耗大，稳定性待提升	成本敏感（多Agent调用放大API开销）

实时性支持

实时性支持此处列举得比较简单，但其实施通常是对整个链路的改造，包括以下几个方面：
1. AI agent感知层的实时触发

事件驱动架构：
- 采用消息队列（如Kafka/Pulsar）或边缘设备事件触发器（如IoT传感器），实现毫秒级事件感知。
- 示例：工业质检Agent通过摄像头帧级事件实时捕捉产品缺陷。
流式数据处理：
- 集成流计算框架（Flink/Spark Streaming），对输入数据实时清洗与特征提取。
- 挑战：高并发场景下需平衡吞吐量与延迟（如自动驾驶需<100ms响应）。

RAG流式更新知识
- 动态索引构建：
  - 增量索引技术（如Elasticsearch的_update_by_query）支持文档级实时更新，避免全量重建索引的延迟。
  - 优化点：结合向量数据库（Milvus/Pinecone）的相似度检索，确保新知识即时生效。
- 多级缓存策略：
  - 热点知识缓存在内存（Redis），冷数据下沉至磁盘，平衡实时性与成本。
  - 案例：金融风控Agent实时同步监管政策变更至缓存层。
工具层的实时性支持
- 低延迟工具调用：
  - 工具API设计遵循轻量化原则（如gRPC替代REST），预加载工具上下文减少冷启动延迟。
  - 示例：电商客服Agent调用库存API时，通过HTTP长连接保持会话状态。
- 异步执行与超时熔断：
  - 工具调用采用异步协程（如Python asyncio），超时机制（如Hystrix）避免阻塞主线程。
数据层的实时性支持
- 实时数仓与OLAP优化：
  - 使用实时OLAP引擎（ClickHouse/Doris）或时序数据库（InfluxDB），支持亚秒级聚合分析。
  - 技术选型：Lambda架构兼顾实时流（Flink）与批处理（Hive）数据一致性。
- 分布式状态管理：
  - 通过分布式快照（如Flink Checkpoint）保证Agent状态跨节点实时同步，避免决策偏差。

底层应用

底层应用是AI Agent的工具模块的一部分。由于上下文提示的影响，Agent也可能无法导向正确的知识，甚至产生知识幻觉。再加上缺乏语料库、训练数据以及针对特定领域和场景的调整，在专注于特定领域时，Agent的专业知识也会受到限制。专业化工具能让 LLM 以可插拔的形式增强其专业知识、调整领域知识并更适合特定领域的需求。

业务场景：
- 大数据应用：客户画像、数据血缘分析。
- 垂直业务：智能客服、精准营销、风险处置。
特点：直接解决具体业务问题，依赖下层技术支撑。

AI Agent智能体

架构核心：自主决策与协作系统。
关键设计：
- 单智能体：包含感知→决策→执行的闭环（如零售智能体的推荐逻辑）。
- 多智能体系统：通过通信模块协作（如风控+量化智能体联合决策）。

智能体组成

AI Agent（智能代理）是一个能够感知环境、自主决策并执行动作的智能系统，其核心组成和实现方式通常包括以下部分：
1. 感知模块（Perception）

作用：从环境中获取信息（如传感器数据、用户输入、网络数据等），并将其转化为结构化数据供其他模块处理。
实现方式：
- 传感器：物理设备（如摄像头、麦克风）或软件接口（API、网页爬虫）。
- 自然语言处理（NLP）：解析文本或语音输入（如BERT、GPT）。
- 计算机视觉：处理图像/视频（如CNN、YOLO）。
- 数据预处理：清洗、归一化、特征提取等。

决策模块（Reasoning/Planning）
- 作用：基于感知信息、内部知识库和目标，制定行动策略或生成响应。
- 实现方式：
  - 规则引擎：基于预定义规则（如专家系统）。
  - 机器学习模型：通过强化学习（RL）、深度学习（DL）或符号逻辑推理（如Prolog）。
  - 规划算法：如A*搜索、蒙特卡洛树搜索（MCTS）用于路径规划或任务分解。
  - 大语言模型（LLM）：如GPT-4生成对话或决策建议。

方法	优势	局限性	适用场景	技术依赖
规则引擎	透明、易解释	灵活性低，规则维护成本高	结构化流程（如审批）	专家知识库
规划算法	支持多步骤任务分解	计算复杂，需环境模型	机器人导航、供应链优化	图搜索算法、动态规划
强化学习	自适应动态环境	训练成本高，奖励设计困难	游戏AI、实时控制	深度神经网络、模拟环境
大模型推理	泛化能力强，自然语言交互	可能产生幻觉，算力需求高	开放域问答、创意生成	LLM、RAG、工具调用API

基于大模型的决策方法：

ReAct框架：交替执行推理（Reasoning）和行动（Acting），例如：

while not goal_achieved:
    state = perceive()          # 感知环境
    thought = llm_reason(state) # 生成推理
    action = decide(thought)    # 选择动作
    execute(action)            # 执行

* 思维链（CoT）：引导LLM分步推理，提升复杂任务解决能力.例如：用户：某个城市的 GDP 是否比全国平均值高？Agent（CoT）：首先获取该城市的 GDP 数据 -> 获取全国 GDP 平均值 -> 进行比较 -> 生成答案。

记忆模块（Memory）

作用：存储短期/长期信息，支持上下文理解和学习。
实现方式：
- 短期记忆：缓存当前会话的上下文（如对话历史）。
- 长期记忆：知识图谱、向量数据库（如FAISS）、SQL数据库。
- 检索增强生成（RAG）：结合外部知识库提升回答准确性。

执行模块（Action）

作用：将决策转化为具体行动，影响环境或用户。
实现方式：
- 物理执行器：机器人控制电机、机械臂。
- 软件接口：调用API（如发送邮件、控制智能家居）。
- 自然语言输出：语音合成（TTS）或文本生成（如ChatGPT）。

学习模块（Learning）

作用：通过反馈优化行为（在线学习或离线训练）。
实现方式：
- 监督学习：标注数据训练模型（如分类任务）。
- 强化学习（RL）：通过奖励机制调整策略（如AlphaGo）。
- 联邦学习：分布式数据下的隐私保护学习。

通信模块（Communication）

作用：与用户、其他Agent或系统交互。
实现方式：
- 自然语言交互：基于NLP的对话系统。
- 协议接口：HTTP/RPC、消息队列（如MQTT）。

Agent性能衡量

常见评估指标：

任务成功率（Task Completion Rate）
工具调用准确率（Tool Usage Accuracy）
推理质量（Reasoning Quality）
用户满意度（User Satisfaction）

多智能体

多智能体系统（Multi-Agent System, MAS）是由多个AI Agent组成的协作网络，这些Agent通过通信和协同工作，共同完成复杂任务。多智能体的核心优势在于：
1. 分工协作：不同Agent专精于特定任务（如搜索、数据分析、代码生成等），通过任务拆解和分配实现高效协同。
2. 复杂任务处理：单个Agent难以完成的复杂任务（如全域营销、供应链优化），可通过多Agent协作分阶段解决。
3. 适应性更强：动态环境中，多Agent系统能通过实时交互调整策略，例如无人机编队或金融风控场景。

架构设计

分层协作：参考Manus的三大模块：
- 规划模块：拆解任务并分配子任务（如将“旅游保险分析”拆解为PDF解析、数据对比等步骤）。
- 执行模块：调用专用Agent（如Content Agent生成报告）。
- 验证模块：审核结果准确性后交付用户。
通信协议：采用标准化框架（如InterAgent协议）确保Agent间互操作性，类似区块链中的智能合约协调。

开发框架与工具

开源平台：
- AutoGen：支持多Agent对话和人类参与，适合构建聊天机器人协作系统。
- CrewAI：强调流程化任务分配，适合顺序性强的场景（如自动发邮件流程）。
- MetaGPT：基于角色设计的框架，模拟软件开发团队分工。
商业化应用：如Manus的付费多Agent服务，或微盟的“数字员工”企业级解决方案。

案例

数据分析智能体

以下场景为deepseek生成。（从侧面体现了LLM的决策能力）
提示词：请你设计一个数据分析智能体，用对话的形式，实现“描述性分析”与“探索性分析”两种分析场景。能用到的工具有：数据地图，数据卡片平台，归因分析平台，客户画像系统，数据血缘，埋点平台、客群分析平台等

数据分析智能体对话设计
1.	 启动对话（意图识别）
用户：我想分析最近三个月的销售数据。
智能体：
您好！我将协助您完成分析。请问您需要哪种分析类型？
* 描述性分析：快速了解数据分布（如均值、趋势、异常值）。
* 探索性分析：深入挖掘潜在模式（如归因、客群差异）。
2.	 描述性分析场景（基础统计与可视化）
用户：先做描述性分析。
智能体：
已通过数据地图定位到销售数据集，包含订单量、销售额、地区等字段。以下是关键统计结果：
a.	数据卡片平台生成摘要：
    * 销售额均值：x=120万（环比+15%）
    * 订单量分布：华东占比45%（异常值：3月15日单日订单激增200%）
b.	可视化建议：
    * 折线图（时间趋势）
    * 热力图（地区销售密度）
是否需要进一步拆分维度（如按产品类别）？
3.	 探索性分析场景（深度挖掘）
用户：为什么华东地区销售额突增？
智能体：
正在调用工具链进行多维度归因：
a.	归因分析平台：
    * 关键因子：促销活动（贡献度62%）、新客增长（25%）
b.	客户画像系统：
    * 新客特征：25-35岁女性，偏好高单价品类（通过埋点平台追踪行为路径）
c.	数据血缘验证：
    * 活动数据与销售数据链路完整，无ETL异常
建议下一步：
  * 通过客群分析平台对比华东与其他地区用户画像差异
  * 需检查促销活动ROI吗？
4.	动态交互与工具调度
用户：我想看促销活动的转化漏斗。
智能体：
已从埋点平台提取用户行为事件，生成漏斗图：
  * 曝光→点击转化率：12%（低于平均水平15%）
  * 点击→下单转化率：8%（行业基准7%）
异常定位：
  * 曝光环节流失率高，建议检查广告投放渠道（数据血缘显示部分渠道数据缺失）
5.	 总结与自动化建议
智能体：
分析完成！是否需要：
a.	保存当前分析流程至数据卡片平台供复用？
b.	设置自动化监控（如销售额异动触发归因分析）？

flowchart LR
    %% 分层架构
    subgraph 用户交互层
        A[自然语言输入] --> B[对话引擎]
        B --> C[可视化卡片-图表/表格/摘要]
        C --> D[交互式追问]
    end

    subgraph 分析服务层
        B --> E{分析类型路由}
        E --> |描述性分析| F[查询引擎]
        E --> |探索性分析| G[归因分析平台]
        E --> |探索性分析| H[客群分析平台]
        F --> I[查询可视化平台]
        G --> J[客户画像系统]
    end

    subgraph 数据治理层
        I & G & H --> K[数据地图]
        K --> L[数据湖]
        L --> M[结构化数据]
        L --> N[非结构化数据]
        M --> O[数据血缘]
    end

    subgraph 支撑系统
        Q[元数据管理] --> K
        R[权限控制] --> L
        S[查询缓存] --> F
    end

    %% 关键数据流
    F -.-> |SQL/API| L
    I -.-> |渲染图表| C
    P -.-> |实时事件流| H
    O -.-> |血缘校验| G
    J -.-> |生成摘要| C

可能的方向

员工效率提升
- 重复性工作：数据录入、报表生成、邮件分类等规则明确的流程。
- 预测分析：基于历史数据的销售预测、风险评估。
- 辅助性数据探索工作：ChatBI
- 实时响应：客服聊天机器人（如回答常见问题）。
信息处理与生成
- 内容创作：生成文本（研报、市场简报）、图像/视频合成（研报文生图）。
- 事件驱动分析：识别突发事件对行业的影响（如疫情对航空股冲击）。
- 知识检索：快速搜索并整合信息（投研问答）。
风险管理与合规
- 异常交易监测：识别操纵市场、老鼠仓等模式（如监测账户关联性）。
- 反洗钱（AML）：AI分析资金流水，标记可疑交易
客户服务与营销
- 智能投顾：根据风险问卷生成标准化组合。
- 精准营销：通过用户行为分析推荐产品（如低风险客户推国债逆回购）。
- 合规质检：AI监听客服通话，实时提示违规话术（如承诺收益）。

明日方舟公开招聘4星以上组成速查表

发表于 2025-05-10 更新于 2025-12-01 分类于游戏
本文字数： 161 阅读时长 ≈ 1 分钟

公开招募工具
✓✓✓ = 最多6星 | ✓✓ = 最多5星 | ✓ = 最多4星

词条+词条

词条组合	支援	狙击	远程位	位移	减速	控场	召唤	削弱	爆发	费用回复	近战位	治疗	快速复活	群攻	生存	防护	输出
支援	-				✓✓✓	✓✓✓				✓✓		✓		✓✓✓	✓✓	✓✓✓	✓
狙击		-	✓✓														✓✓
远程位		✓✓	-			✓	✓	✓	✓✓	✓					✓	✓✓
位移				-	✓✓	✓✓✓					✓					✓✓	✓✓
减速	✓✓✓			✓✓	-	✓✓					✓	✓		✓			✓
控场	✓✓✓		✓	✓✓✓	✓✓	-	✓✓			✓✓			✓✓	✓✓✓			✓
召唤			✓			✓✓	-			✓
削弱			✓					-			✓✓		✓✓	✓✓			✓
爆发			✓✓						-					✓✓			✓
费用回复	✓✓		✓			✓✓	✓			-		✓
近战位				✓	✓			✓✓			-		✓
治疗	✓				✓					✓		-					✓✓
快速复活						✓✓		✓✓			✓		-			✓	✓
群攻	✓✓✓				✓	✓✓✓		✓✓	✓✓					-		✓✓	✓
生存	✓✓		✓												-	✓✓
防护	✓✓✓		✓✓	✓✓									✓	✓✓	✓✓	-	✓✓
输出	✓	✓✓		✓✓	✓	✓		✓	✓			✓✓	✓	✓		✓✓	-

词条+职业

词条组合	输出	减速	快速复活	召唤	支援	控场	爆发	位移	狙击	治疗	防护	削弱	生存	远程位
先锋				✓	✓✓					✓				✓
术师		✓			✓✓✓	✓	✓✓			✓✓	✓✓	✓
辅助	✓✓			✓✓	✓✓	✓✓				✓		✓✓	✓✓
重装	✓✓				✓✓✓			✓✓					✓✓
狙击		✓				✓✓✓	✓✓		-			✓	✓
医疗					✓
特种	✓	✓✓	✓		✓✓✓	✓✓		✓			✓	✓✓	✓✓	✓✓✓
近卫		✓					✓				✓✓