Практика работы с Gemini API
Найти подходящий мем во время переписки — задача непростая.
Ваши папки забиты файлами с названиями вроде IMG_4821.jpg. В ваших альбомах нет никакого порядка. Поиск конкретной шутки занимает слишком много времени.
Я наткнулся на open-source проект под названием MemeTalk. Он использует Python, Streamlit и SQLite. Он сканирует папки и использует OCR с векторными эмбеддингами для поиска изображений. Он работает хорошо, но создан для исследовательских целей. Его нужно запускать в браузере.
Мне же нужен был инструмент для повседневного использования.
Я хотел нативное приложение для Mac с полем поиска. Я хотел вводить слово, видеть мемы и одним кликом копировать изображение в буфер обмена.
Чтобы решить эту проблему, я создал MemeFinder.
Этот проект прошел путь от простой идеи до приложения в строке меню с глобальной горячей клавишей. Я написал его с нуля.
Читайте о полном процессе разработки здесь: https://dev.to/evanlin/gemini-api-hands-on-59dc
Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi