بناء نظام لأرشفة فيديوهات تيك توك
لدي 4,200 فيديو من تيك توك على وحدة NAS في خزانتي.
لفترة طويلة، شعرت أن الأمر يسوده الفوضى. كانت لدي ملفات بأسماء video(1).mp4 و video(2).mp4 مبعثرة عبر ثلاثة أقراص صلبة ومجلد على Google Drive. لم أكن أستطيع العثور على أي شيء.
أدركت أن المشكلة لم تكن في عدد الفيديوهات، بل في غياب النظام.
إذا كنت ترغب في حفظ الفيديوهات القصيرة على نطاق واسع، فأنت بحاجة إلى أرشيف مناسب. حفظ الفيديوهات واحداً تلو الآخر قد ينجح مع 50 ملفاً، لكنه يفشل عند الوصول إلى 500.
إليكم النظام الذي بنيته لإدارة آلاف الفيديوهات.
المشكلات المتعلقة بالحفظ اليدوي • غياب البيانات الوصفية (metadata). عندما يحول صانع المحتوى حسابه إلى خاص، تفقد السياق. • تكرار الملفات. ينتهي بك الأمر بامتلاك نفس الفيديو في أماكن متعددة. • انعدام إمكانية البحث. لا يمكنك العثور على فيديو معين وسط بحر من الملفات غير المسماة. • تشتت التخزين. الملفات موجودة في كل مكان دون وجود مصدر واحد موثوق للحقيقة.
هيكلية الأرشيف أستخدم نظام مجلدات يعتمد على صناع المحتوى والمواضيع.
- videos/creators/@username
- videos/topics/woodworking
- metadata/video_index.json
- thumbnails/cover-images
يتبع كل فيديو قاعدة تسمية صارمة: {YYYY-MM-DD}{creator-handle}{short-description}_{tiktok-id}.mp4
مثال: 2024-03-15_@woodcraftjoe_mortise-and-tenon-joint_7341892056.mp4
السر يكمن في البيانات الوصفية (metadata) ملف الفيديو وحده لا يكفي. أنا أستخدم فهرساً بصيغة JSON لتخزين تفاصيل كل مقطع. أقوم بتسجيل صانع المحتوى، وتاريخ النشر، والوصف، والوسوم (hashtags)، وحتى عدد المشاهدات وقت التحميل.
هذا يجعل البحث فورياً. أستخدم سكربت Python بسيطاً للعثور على الفيديوهات حسب الوسم أو صانع المحتوى في أقل من ثانية واحدة.
أهم 3 دروس
- أرشف البيانات الوصفية منذ اليوم الأول. إن محاولة إضافة البيانات للفيديوهات القديمة هي كابوس حقيقي.
- أتمتة المهام المملة. استخدم أدوات لتحميل ملفات تعريف كاملة في دفعات.
- استخدم مستويات تخزين متعددة. احتفظ بنسخة أساسية على وحدة NAS، ونسخة سحابية مطابقة (cloud mirror)، وتخزين بارد (cold storage) على قرص خارجي.
توقف عن مجرد التحميل. ابدأ بالأرشفة.