Pro 版 AI 引擎
素流 (PureFlow) Pro 版为你的文件管理注入 AI 智能。8 项 AI 功能覆盖语义检索、智能清理、对话式管理、隐私保护等核心场景,所有端侧 AI 能力完全离线可用,文件内容绝不出端。
端侧语义检索引擎
传统文件搜索只能按文件名匹配关键词——你必须记住文件叫什么。端侧语义检索引擎让你用自然语言描述内容,就能找到目标图片和视频。
工作原理
语义检索引擎基于 MobileCLIP2 模型,在设备本地完成图片和视频的向量化处理:
- 本地向量化:MobileCLIP2 模型将每张图片编码为一个高维语义向量,捕捉图片的视觉内容特征
- 语义索引:向量化结果存储在本地数据库中,建立完整的媒体语义索引
- 自然语言查询:输入文字描述(如"海边的日落"、"一只橘猫"),文本同样被编码为语义向量
- 向量匹配:通过计算文本向量与图片向量的余弦相似度,找出语义最接近的结果
核心特性
- 中英文支持:支持中文和英文自然语言查询,"sunset at beach"和"海边日落"都能找到同一张照片
- 完全离线可用:MobileCLIP2 模型运行在设备本地,无需网络连接即可完成语义检索
- 增量索引:新增图片自动纳入索引,无需手动触发全量扫描
- 隐私保障:图片内容的向量化在端侧完成,原始图片和语义向量均不上传到任何服务器
技术细节
素流 (PureFlow) 采用 ONNX Runtime Mobile 作为端侧推理引擎,搭载 Apple MobileCLIP2-S0 视觉编码器(INT8 量化)。该模型专为移动端设计,视觉编码器仅 11.4M 参数,单张图片推理延迟在中端设备上约 50-100ms,内存增量控制在 50MB 以内。
索引采用增量更新机制,支持中断恢复。首次全量索引通过后台任务完成,后续新增文件自动触发增量索引,不影响日常使用体验。
相似图片检测
手机图库中往往积累了大量"几乎一样"的图片:连拍、截图的多次转发、同一图片的裁剪版和压缩版。相似图片检测帮你找出这些冗余,智能推荐保留哪一张。
三层检测机制
相似图片检测将图片相似性分为三个层次,分别处理:
| 层次 | 说明 | 典型场景 |
|---|---|---|
| 精确重复 | 字节完全一致的文件 | 同一文件的多份拷贝 |
| 近重复 | 同一内容的不同编码、尺寸、裁剪、轻微编辑 | 截图二次保存、JPEG 压缩、轻微裁剪 |
| 语义相似 | 内容相近但不完全相同 | 同一场景不同角度、同一主题的多张照片 |
精确重复通过文件大小和哈希值判定;近重复和语义相似通过 MobileCLIP2 向量相似度结合感知哈希(pHash)综合判定。
智能推荐保留策略
检测到相似图片组后,系统会基于多维度评分,为每组推荐最值得保留的那一张:
- 分辨率:优先保留高分辨率版本
- 清晰度:通过拉普拉斯方差评估图片清晰度,优先保留清晰的版本
- 来源目录:
DCIM/Camera等相机目录的原图优先于社交应用缓存目录的副本 - 修改时间:同组图片非常接近时,优先保留较新版本
- 截图标记:截图通常价值较低,但不会一刀切删除
推荐结果仅供参考,你可以手动调整每组的保留项。支持按目录、全局图库、时间范围三种扫描范围。
智能清理建议
智能清理建议不只是"扫垃圾",而是告诉你什么内容可能低价值、为什么低价值、删掉能释放多少空间。
建议类型
| 类型 | 说明 | 风险等级 |
|---|---|---|
| 近重复图片 | 由向量聚类和规则判断输出的重复图片组 | 中 |
| 截图堆积 | 同一时间段内大量截图的累积 | 中 |
| 社交重复 | 社交应用缓存目录中与相机目录重复的图片副本 | 低 |
| 连拍冗余 | 短时间内连续拍摄的高度相似照片 | 中 |
| 模糊/低质量图片 | 极度模糊或分辨率过低的图片 | 低 |
| 高安全建议 | 缓存、缩略图、临时文件、安装包等 | 低 |
建议输出规范
每条清理建议都包含完整的决策依据:
- 建议标题:简明描述建议内容
- 原因说明:解释为什么建议清理这些文件
- 预计可释放空间:清理后能回收的存储空间大小
- 置信度:系统对该建议准确性的评估
- 风险等级:标注清理操作的风险程度(低/中/高)
- 预览样本:提供候选文件的缩略图预览
系统不会输出"建议全删"而不给依据,每条建议都可追溯、可复核。所有清理操作需要你手动确认后才会执行。
智能聚合
图片越来越多,手动分类整理几乎不可能。智能聚合基于 DBSCAN 算法对图片内容进行语义聚类,自动将相似主题的图片归为一组。
工作方式
- 语义向量提取:利用端侧语义检索引擎已建立的向量索引,获取每张图片的语义特征
- DBSCAN 聚类:DBSCAN(基于密度的空间聚类)算法自动发现图片间的语义关联,将内容相近的图片归为同一簇
- 自动分类:聚类结果以分组形式呈现,每组代表一个语义主题(如"宠物"、"风景"、"美食"、"文档截图"等)
为什么选择 DBSCAN
与 K-Means 等需要预设分组数量的算法不同,DBSCAN 能自动确定聚类数量,并且能识别出不属于任何类别的"噪声"图片。这更符合个人图库的实际情况——你不知道自己有多少类图片,也不是每张图片都能归类。
智能伴读
智能伴读为 ePub 电子书阅读提供 AI 辅助能力,包括内容总结和基于书籍内容的智能问答。
功能说明
- 内容总结:AI 自动生成章节摘要或全书概要,帮助你快速把握核心内容
- 智能问答:基于当前书籍的内容进行问答互动,例如"这本书的核心论点是什么?"、"作者对 XX 问题的观点是什么?",AI 会结合书中内容给出回答
使用前提
智能伴读依赖大语言模型(LLM)的推理能力,需要通过 BYOK 模式配置你自己的 LLM API Key 后才能使用。配置方式参见下方 BYOK 模式 章节。
素匣(隐私保险箱)
手机中可能存有身份证照片、银行卡照片、证件扫描件等敏感文件。素匣提供 AI 驱动的隐私文件扫描和密码保护的加密存储,双重保障你的隐私安全。
AI 隐私文件扫描
素匣利用端侧 AI 能力自动扫描设备中的敏感文件,识别类型包括:
- 身份证照片(正面/反面)
- 银行卡照片
- 护照、驾照等证件照片
- 其他包含个人敏感信息的文件
扫描完全在设备本地完成,不上传任何文件内容。扫描结果仅作为建议,由你决定是否将这些文件移入素匣保护。
加密存储
移入素匣的文件受密码保护的加密存储空间管理:
- 独立密码:素匣使用独立的访问密码,与设备锁屏密码分离
- 加密存储:文件以加密形式存储,即使设备被他人访问也无法直接查看素匣内容
- 安全访问:每次打开素匣需要验证密码,确保只有你本人能访问
素流助理(AI Agent)
素流助理是一个对话式文件管理 AI Agent。你可以用自然语言下达文件管理指令,Agent 会理解你的意图、规划执行步骤、调用端侧工具完成任务。
对话式交互
不需要记住复杂的操作路径,直接用大白话描述你想做的事情:
- "帮我找出下载目录里重复的截图"
- "把最近一个月的照片按主题分类整理"
- "分析一下哪些文件夹占空间最多"
- "找出所有和猫有关的图片"
7 个工具链
素流助理内置 7 个端侧工具,覆盖文件管理的核心操作:
| 工具 | 能力 |
|---|---|
| 文件搜索 | 按目录、时间、大小、类型等条件结构化检索文件 |
| 存储分析 | 分析存储空间占用分布,识别大文件和空间占用大户 |
| 相似图片 | 查找指定范围内的近重复和语义相似图片 |
| 语义搜索 | 用自然语言描述查找匹配的图片和视频 |
| 智能清理 | 获取各类型的智能清理建议 |
| 聚类查询 | 查询图片语义聚类结果,按主题浏览图片分组 |
| 文件操作 | 执行移动、删除、归档、重命名等文件操作 |
端云协作架构
素流助理采用"云端智能 + 端侧工具"的协作架构:
- 云端:大语言模型负责理解你的自然语言意图,将其转化为结构化的工具调用计划
- 端侧:原生代码负责实际的文件访问、语义检索、候选分组和操作执行
这种架构确保了云端只接触经过脱敏处理的元数据(如文件类型、大小区间、目录标签等),原始文件内容、完整路径、缩略图和语义向量均不上传到云端。
安全机制
所有破坏性操作(删除、移动、归档等)均需你手动确认后才会执行:
- Agent 生成操作计划并展示受影响的文件列表
- 你确认操作内容无误后,Agent 才会执行
- 执行结果会反馈给你,支持操作审计
Agent 不会在未经确认的情况下自动删除或移动任何文件。
文档语义搜索
文档语义搜索让你按内容含义检索文档,而不仅仅是按文件名匹配。
工作原理
基于 BGE(BAAI General Embedding)模型的文档内容语义检索引擎:
- 内容提取:从文档中提取文本内容
- 语义编码:BGE 模型将文本内容编码为语义向量
- 语义匹配:输入查询文本,通过向量相似度匹配找出内容最相关的文档
中英翻译引擎
内置中英翻译引擎,支持跨语言文档检索。你可以用中文查询英文文档内容,或用英文查询中文文档,翻译在端侧完成,无需网络连接。
BYOK 模式
BYOK(Bring Your Own Key)是素流 (PureFlow) 的开放 AI 接入模式。你使用自己的 API Key 直连大语言模型服务商,素流 (PureFlow) 不做任何中间加价。
工作方式
- 你提供 API Key:在应用设置中配置你自己的 LLM API Key(如 OpenAI、Anthropic 等)
- 直连端点:应用直接调用你配置的 API 端点,请求和响应数据在你的设备与 API 服务商之间直接传输
- 不经过应用服务器:素流 (PureFlow) 的服务器不参与任何 API 调用过程,不中转、不存储、不记录你的请求数据
核心优势
- 零加价:你按 API 服务商的原价计费,素流 (PureFlow) 不加收任何费用
- 数据直达:数据直接发送到你配置的 API 端点,不经过任何中间服务器
- 自由选择:你可以选择任何兼容的 LLM 服务商,不被绑定在特定平台
- 透明可控:API 调用量和费用完全由你在服务商后台查看和管控
适用功能
BYOK 模式目前用于以下需要大语言模型推理能力的功能:
- 智能伴读(ePub 内容总结与问答)
- 素流助理 AI Agent(意图理解与任务规划)
端侧 AI 功能(语义检索、相似图片检测、智能清理、智能聚合、文档语义搜索)基于本地模型运行,不需要 API Key,完全离线可用。
端云协作架构
素流 (PureFlow) 的 AI 能力采用"大脑指挥肌肉"的端云分层架构,在保障隐私的前提下充分发挥云端大模型和端侧原生代码各自的优势。
云端:意图理解与任务规划
云端大语言模型负责"思考":
- 理解用户的自然语言指令
- 将模糊的需求转化为明确的任务计划
- 编排工具调用顺序
- 生成结果解释和操作摘要
云端只接触经过脱敏处理的结构化元数据(文件类型、大小区间、时间区间、目录标签、相似度分数等),不接触原始文件内容。
端侧:文件访问与安全执行
端侧原生代码负责"执行":
- 访问本地文件系统和媒体索引
- 运行端侧 AI 模型(MobileCLIP2、BGE 等)完成向量化和语义检索
- 对云端返回的操作计划进行权限校验和风险评估
- 执行文件操作(移动、删除、归档等),所有破坏性操作需用户确认
隐私红线
以下数据绝不上传到云端:
- 原始文件内容(图片、视频、文档等)
- 文件缩略图
- 语义向量(embedding)
- 完整文件路径和文件名
- OCR 识别的原文内容
如何获取 Pro 版
Pro 版通过 App 内购买流程激活,官网不提供购买激活码服务。
在应用内进入设置页面,找到 Pro 版升级入口,按照引导完成购买即可解锁全部 AI 功能。购买后 Pro 版功能即时生效,无需重启应用。
如需了解更多应用场景,请查看核心应用场景。
