LLM 的 MLOps:Dresscode 案例研究
从概念验证(PoC)转向真正的产品落地非常困难。
我开发了 Dresscode,一款 AI 造型师。它利用 Gemma 4 将衣橱数字化,并根据实时天气推荐穿搭。
一个伟大的想法不仅仅需要一个模型,还需要 MLOps。
MLOps 能确保你的 AI 保持准确、可靠且运行成本低廉。以下是我用于扩展 AI 规模的 7 步流水线。
数据摄取与工程 (Data Ingestion and Engineering) 原始数据是杂乱无章的。对于 Dresscode,用户会上传高分辨率照片。 • 摄取:我们通过 API 将照片移动到云存储。 • 工程:我们将 12MB 的智能手机照片进行压缩,以降低成本并加快处理速度。我们还会清除元数据以保护隐私。 • 文本清洗:我们清洗天气 API 数据,以保持提示词(prompt)简洁高效。
特征存储 (Feature Store) 特征是 AI 用来做出决策的具体细节。 • 对于图像:我们存储数学嵌入(embeddings,即向量)。这可以防止我们对同一张图像进行重复处理。 • 对于天气:我们将原始数据转换为“寒冷”或“多雨”等类别。 • 优势:特征存储允许你即时提取这些细节,而无需重新计算。
模型训练与实验 (Model Training and Experimentation) 我们并不从零开始训练 Gemma 4。我们的重点在于提示工程(Prompt Engineering)和评估。 • 实验:我们测试不同的系统提示词,以确保 AI 输出干净的 JSON 格式。 • CI(持续集成):我们使用包含 100 张照片的“黄金数据集”。每当我们更改提示词时,系统都会检查准确率是否保持在 95% 以上。
模型注册表 (Model Registry) 可以将其理解为模型的“应用商店”。 • 我们存储带有版本的提示词和模型配置。 • 如果新的提示词导致 AI 在夏天推荐外套,我们可以点击“回滚”(Rollback)立即恢复到稳定版本。
持续部署与服务 (Continuous Deployment and Serving) 这是将模型交付给用户的方式。 • 视觉任务:我们使用异步队列。用户上传照片后,我们在后台进行处理,从而保证应用的响应速度。 • 文本任务:我们使用 Token 流式传输。这会逐字显示穿搭建议,这样用户就不会一直盯着加载界面。
持续监控 (Continuous Monitoring) AI 的性能可能会随时间下降。我们监控三个方面: • 系统性能:延迟是否在增加? • 数据漂移 (Data Drift):用户是否在上传我们未预料到的新照片格式? • 模型准确性:AI 是否开始幻觉(hallucinate)出用户并不拥有的物品?
反馈循环 (The Feedback Loop) 系统必须从错误中学习。我们捕获用户的纠正信息,并将这些数据反馈回第一步,以重新训练并改进模型。
MLOps 将一个酷炫的 Demo 变成了一个专业的工具。
Source: https://dev.to/saad4software/mlops-for-llm-a-case-study-on-dresscode-3joj
Optional learning community: https://t.me/GyaanSetuAi
