通过 Vibe Coding 打造功能应用：来自 Gemini 的启示

Translated for your language. 阅读原文.

AI-assisted draft.

本文目录

通过 Vibe-Coding 构建功能应用：来自 Gemini 的启示

随着“vibe-coding”（通过自然语言提示和迭代对话来构建应用程序）成为非技术用户的现实，传统软件开发时代正面临着一场剧变。最近一项使用 Google 的 Gemini 构建专业园艺管理应用的实验，既展示了这种新范式惊人的速度，也揭示了其令人沮丧的技术摩擦。

从提示词到原型仅需几分钟

该项目始于在 Google AI Studio 中输入一段高度详细的提示词。目标是创建一个 Android 应用程序，能够管理复杂的庭院护理任务，根据天气提供建议，并利用图像识别进行植物诊断。

结果立竿见影。Gemini 在几分钟内就生成了一个功能性的 Web 应用预览，其中包含逻辑清晰的不同植物区域板块，以及一个专门的“植物医生”界面。即使当 AI 遇到严重错误时——如提示消息“Channel is unrecoverably broken and will be disposed!”所示——用户也能通过单击一下来解决问题。仅用 233 秒，Gemini 就诊断并修复了“阻塞”和“竞态条件”，展示了其在实时自我修正复杂后端逻辑方面前所未有的能力。

“Vibe-Coding” 的摩擦：UI 与逻辑鸿沟

尽管最初令人兴奋，但从“感觉”到生产级工具的转变揭示了当前 LLM 驱动开发的固有局限性。开发者遇到了几个常见的障碍：

设计美感 vs. 可用性： Gemini 最初默认使用深色模式，并配有难以辨认的深紫色和砖红色点缀。需要特定的自然语言指令才能将其切换为高对比度、易于阅读的配色方案。
理论数据 vs. 现实世界数据： AI 试图使用理论上的气候预设，而不是通过 API 集成实时天气数据，这凸显了 LLM 在感知外部数据集成必要性方面的差距。
逻辑错误与状态管理： 该应用存在严重的逻辑缺陷，包括日期选择器无法工作、无法编辑已创建的任务，以及无法区分一次性任务和循环任务。

这种“请求、等待、调试、重新部署”的循环让开发过程变成了一份兼职，这证明了尽管准入门槛已经降低，但对严谨迭代的需求依然存在。

多模态 AI 的力量：植物医生

虽然应用的管理功能需要大量的工作，但 Gemini 的多模态能力在“植物医生”功能中大放异彩。通过利用图像识别技术，用户可以上传一张患病杜鹃花的照片，并收到一份详细的健康报告单。AI 识别出了关键的健康问题，提出了可能的诱因，并提供了可以立即集成到应用规划器中的可操作建议。

这一成功凸显了开发工作的意义所在：对于像计算机视觉诊断这样特定且高价值的功能，即使周围的软件基础设施仍处于“凭感觉编码”（vibe-coded）的阶段，AI 也能立即为终端用户提供专业级的实用功能。

核心启示

快速原型设计： 像 Gemini 这样的 LLM 可以在短短几分钟内，从复杂的自然语言提示词转变为功能完备、逻辑清晰的应用预览。
迭代循环： “凭感觉编码”并非一劳永逸；它需要通过繁琐的提示词循环来修复 UI 显示不清晰、逻辑错误以及集成衔接问题。
多模态价值： 对于非开发者而言，最直接的价值在于专门的 AI 功能，例如利用图像识别进行诊断任务。