Mistral AI ತನ್ನ OCR 4 ಅನ್ನು ಅನಾವರಣಗೊಳಿಸಿದೆ: ಡಾಕ್ಯುಮೆಂಟ್ ಇಂಟೆಲಿಜೆನ್ಸ್‌ನಲ್ಲಿ ಹೊಸ ಮಾನದಂಡ

Mistral AI ಅಧಿಕೃತವಾಗಿ OCR 4 ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ. ಇದು ಸಂಕೀರ್ಣ ಡಿಜಿಟಲ್ ದಾಖಲೆಗಳನ್ನು ಯಂತ್ರಗಳು ಹೇಗೆ ಅರ್ಥೈಸಿಕೊಳ್ಳುತ್ತವೆ ಎಂಬುದನ್ನು ಬದಲಾಯಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಅತ್ಯಾಧುನಿಕ ಹೊಸ ಮಾಡೆಲ್ ಆಗಿದೆ. ಕೇವಲ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯುವುದನ್ನು ಮೀರಿ, ಈ ಮಾಡೆಲ್ ಸ್ವಯಂಚಾಲಿತ ವರ್ಕ್‌ಫ್ಲೋಗಳು ಮತ್ತು AI ಏಜೆಂಟ್ ಇಂಟಿಗ್ರೇಷನ್‌ನಲ್ಲಿ ಡಾಕ್ಯುಮೆಂಟ್ ಪ್ರೊಸೆಸಿಂಗ್‌ನ ಮಾನದಂಡವನ್ನು ಮರು ವ್ಯಾಖ್ಯಾನಿಸುವ ಭರವಸೆ ನೀಡುತ್ತದೆ.

ಕೇವಲ ಪಠ್ಯಕ್ಕಿಂತ ಮಿಗಿಲಾದದ್ದು: ಸುಧಾರಿತ ಬ್ಲಾಕ್ ವರ್ಗೀಕರಣ (Advanced Block Classification)

ಕೇವಲ ಪಠ್ಯವನ್ನು ಮಾತ್ರ ಸಂಗ್ರಹಿಸುವ ಸಾಂಪ್ರದಾಯಿಕ Optical Character Recognition (OCR) ಪರಿಕರಗಳಿಗ Unlike, OCR 4 ಡಾಕ್ಯುಮೆಂಟ್ ಲೇಔಟ್‌ಗಳ ಬಗ್ಗೆ ಆಳವಾದ ರಚನಾತ್ಮಕ ತಿಳುವಳಿಕೆಯನ್ನು ನೀಡುತ್ತದೆ. ಈ ಮಾಡೆಲ್ ಪುಟದಲ್ಲಿರುವ ಅಂಶಗಳ ನಿಖರವಾದ ಸ್ಪೇಷಿಯಲ್ ಕೋಆರ್ಡಿನೇಟ್ಸ್‌ಗಳನ್ನು (spatial coordinates) ಗುರುತಿಸಲು ಮತ್ತು ಅವುಗಳಿಗೆ ನಿರ್ದಿಷ್ಟ ಕಾರ್ಯಕಾರಿ ಪಾತ್ರಗಳನ್ನು ನೀಡಲು ಸಮರ್ಥವಾಗಿದೆ.

ಇದರರ್ಥ ಈ ಮಾಡೆಲ್ ಶೀರ್ಷಿಕೆಗಳು, ಕೋಷ್ಟಕಗಳು (tables), ಸಂಕೀರ್ಣ ಗಣಿತದ ಸಮೀಕರಣಗಳು ಮತ್ತು ಕೈಬರಹದ ಸಹಿಗಳನ್ನು ಸಹ ಪ್ರತ್ಯೇಕಿಸಬಲ್ಲದು. ಈ "ಬ್ಲಾಕ್ ವರ್ಗೀಕರಣ"ವನ್ನು ಮಾಡುವ ಮೂಲಕ, OCR 4 ದಾಖಲೆಗಳನ್ನು ಅರ್ಥಪೂರ್ಣವಾದ, ರಚನಾತ್ಮಕ ವಿಭಾಗಗಳಾಗಿ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ವಿಂಗಡಿಸುತ್ತದೆ. ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು ಡೇಟಾ ಎಂಜಿನಿಯರ್‌ಗಳಿಗೆ ಇದು ಒಂದು ಪ್ರಮುಖ ಪ್ರಗತಿಯಾಗಿದೆ, ಏಕೆಂದರೆ ಇದು RAG (Retrieval-Augmented Generation) ಸಿಸ್ಟಮ್‌ಗಳು ಅಥವಾ ಹೆಚ್ಚಿನ ನಿಖರತೆಯ ಸಂದರ್ಭದ ಅಗತ್ಯವಿರುವ ಸ್ವಾಯತ್ತ AI ಏಜೆಂಟ್‌ಗಳಿಗೆ ದಾಖಲೆಗಳನ್ನು ನೀಡುವಾಗ ಹೆಚ್ಚು ಶುದ್ಧವಾದ ಡೇಟಾ ಇಂಜೆಕ್ಷನ್ ಮಾಡಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.

ಬ್ಲೈಂಡ್ ಟೆಸ್ಟಿಂಗ್‌ನಲ್ಲಿ ಸಾಬೀತಾದ ನಿಖರತೆ

ತನ್ನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ದೃಢೀಕರಿಸಲು, Mistral 600 ಕ್ಕೂ ಹೆಚ್ಚು ದಾಖಲೆಗಳನ್ನು ಒಳಗೊಂಡ ಕಠಿಣ ಬ್ಲೈಂಡ್ ಟೆಸ್ಟ್ ಅನ್ನು ನಡೆಸಿತು. ಇದರ ಫಲಿತಾಂಶಗಳು ಗಮನಾರ್ಹವಾಗಿದ್ದವು: ಸ್ವತಂತ್ರ ವಿಮರ್ಶಕರು 72 ಪ್ರತಿಶತ ಪರೀಕ್ಷಾ ಸಂದರ್ಭಗಳಲ್ಲಿ ಸ್ಪರ್ಧಾತ್ಮಕ ಇಂಡಸ್ಟ್ರಿ ಮಾಡೆಲ್‌ಗಳಿಗಿಂತ OCR 4 ಅನ್ನು ಹೆಚ್ಚು ಇಷ್ಟಪಟ್ಟರು. ಹಳೆಯ OCR ಇಂಜಿನ್‌ಗಳನ್ನು ದಾರಿ ತಪ್ಪಿಸುವ ಸೂಕ್ಷ್ಮತೆಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಈ ಮಾಡೆಲ್‌ನ ಶ್ರೇಷ್ಠ ಸಾಮರ್ಥ್ಯವನ್ನು ಈ ಆದ್ಯತೆಯು ಎತ್ತಿ ತೋರಿಸುತ್ತದೆ.

ಇದಲ್ಲದೆ, OCR 4 ಕಾನ್ಫಿಡೆನ್ಸ್ ಸ್ಕೋರ್‌ಗಳ (confidence scores) ಮೂಲಕ ವಿವರವಾದ ಪಾರದರ್ಶಕತೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ. ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲಾದ ಪ್ರತಿ ಪದ ಅಥವಾ ಪುಟಕ್ಕೆ, ಮಾಡೆಲ್ ತನ್ನ ನಿಖರತೆಯ ಅಂದಾಜನ್ನು ನೀಡುತ್ತದೆ. ಮಾಡೆಲ್‌ನ ಕಾನ್ಫಿಡೆನ್ಸ್ ಒಂದು ನಿರ್ದಿಷ್ಟ ಮಟ್ಟಕ್ಕಿಂತ ಕಡಿಮೆಯಾದಲ್ಲಿ, ಹೆಚ್ಚಿನ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವ ಎಂಟರ್‌ಪ್ರೈಸ್-ಗ್ರೇಡ್ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಲ್ಲಿ ಮಾನವನ ಪರಿಶೀಲನೆ (human-in-the-loop verification) ಅಗತ್ಯವಿರುತ್ತದೆ, ಅಂತಹ ಸಂದರ್ಭಗಳಲ್ಲಿ ಈ ವೈಶಿಷ್ಟ್ಯವು ಅತ್ಯಗತ್ಯವಾಗಿದೆ.

ಬಹುಭಾಷಾ ಬೆಂಬಲ ಮತ್ತು ಸುಲಭ ಲಭ್ಯತೆ

ಜಾಗತಿಕ ದಾಖಲೆ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಭಾಷಾ ಅಡೆತಡೆಗಳು ದೊಡ್ಡ ಸವಾಲಾಗಿವೆ, ಆದರೆ OCR 4 ಇದು 170 ಭಾಷೆಗಳ ಬೆಂಬಲದೊಂದಿಗೆ ಈ ಅಂತರವನ್ನು ಕಡಿಮೆ ಮಾಡುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ. ಕಡಿಮೆ ಬಳಕೆಯಲ್ಲಿರುವ ಅಥವಾ ಕಡಿಮೆ ಸಂಪನ್ಮೂಲವಿರುವ ಭಾಷೆಗಳನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವಾಗಲೂ ಈ ಮಾಡೆಲ್ ಹೆಚ್ಚಿನ ನಿಖರತೆಯನ್ನು ಕಾಯ್ದುಕೊಳ್ಳುತ್ತದೆ ಎಂದು Mistral ಹೇಳಿಕೊಂಡಿದೆ, ಇದು ಅಂತರಾಷ್ಟ್ರೀಯ ಉದ್ಯಮಗಳಿಗೆ ಒಂದು ಬಹುಮುಖಿ ಸಾಧನವಾಗಿದೆ.

ಈ ಮಾಡೆಲ್ ಈಗಾಗಲೇ Mistral API, Mistral Studio ಮತ್ತು Microsoft Foundry ಸೇರಿದಂತೆ ಹಲವಾರು ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ಗಳ ಮೂಲಕ ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು ವ್ಯವಹಾರಗಳಿಗೆ ಲಭ್ಯವಿದೆ. ಬಳಕೆದಾರರನ್ನು ಉತ್ತೇಜಿಸಲು Mistral ಸ್ಪರ್ಧಾತ್ಮಕ ಬೆಲೆ ರಚನೆಯನ್ನು ಸಹ ಜಾರಿಗೆ ತಂದಿದೆ: ರಿಯಲ್-ಟೈಮ್ ವಿನಂತಿಗಳಿಗೆ ಪ್ರತಿ 1,000 ಪುಟಗಳಿಗೆ $4 ವೆಚ್ಚವಾಗುತ್ತದೆ, ಆದರೆ ಹೆಚ್ಚು ವೆಚ್ಚ-ಪರಿಣಾಮಕಾರಿ ಬ್ಯಾಚ್ ಮೋಡ್ ಪ್ರತಿ 1,000 ಪುಟಗಳಿಗೆ $2 ರಂತೆ ಲಭ್ಯವಿದೆ.

AI ಪರಿಸರ ವ್ಯವಸ್ಥೆಗೆ ಇದು ಏಕೆ ಮುಖ್ಯ

OCR 4 ಬಿಡುಗಡೆಯು ಪಠ್ಯವನ್ನು ಕೇವಲ "ಓದುವ" ಬದಲಿಗೆ ಡಾಕ್ಯುಮೆಂಟ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಅನ್ನು "ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ" ಕಡೆಗೆ ಬದಲಾವಣೆಯನ್ನು ಸೂಚಿಸುತ್ತದೆ. LLMಗಳು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯಶಾಲಿಯಾಗುತ್ತಿದ್ದಂತೆ, ಅವುಗಳಿಗೆ ನೀಡಲಾಗುವ ಡೇಟಾದ ಗುಣಮಟ್ಟವೇ ಬುದ್ಧಿವಂತಿಕೆಯ ದೊಡ್ಡ ಸವಾಲಾಗಿರುತ್ತದೆ. PDFs, Word ಫೈಲ್‌ಗಳು ಮತ್ತು PowerPoints ನಿಂದ ರಚನಾತ್ಮಕ, ವರ್ಗೀಕರಿಸಿದ ಮತ್ತು ಹೆಚ್ಚಿನ ಕಾನ್ಫಿಡೆನ್ಸ್ ಹೊಂದಿರುವ ಡೇಟಾವನ್ನು ಒದಗಿಸುವ ಮೂಲಕ, Mistral ಮುಂದಿನ ತಲೆಮಾರಿನ ತಾರ್ಕಿಕ (reasoning-heavy) AI ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ಅಗತ್ಯವಾದ ಉತ್ತಮ ಗುಣಮಟ್ಟದ "ಇಂಧನ"ವನ್ನು ಒದಗಿಸುತ್ತಿದೆ.

ಪ್ರಮುಖ ಅಂಶಗಳು

  • ರಚನಾತ್ಮಕ ಬುದ್ಧಿವಂತಿಕೆ (Structural Intelligence): OCR 4 ಕೇವಲ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯುವ ಬದಲು ಶೀರ್ಷಿಕೆಗಳು, ಕೋಷ್ಟಕಗಳು ಮತ್ತು ಸಮೀಕರಣಗಳನ್ನು ಗುರುತಿಸಲು ಬ್ಲಾಕ್ ವರ್ಗೀಕರಣವನ್ನು ಬಳಸುತ್ತದೆ.
  • ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆ: 600ಕ್ಕೂ ಹೆಚ್ಚು ದಾಖಲೆಗಳ ಬ್ಲೈಂಡ್ ಟೆಸ್ಟ್‌ನಲ್ಲಿ, ಸ್ಪರ್ಧಿಗಳಿಗಿಂತ ಈ ಮಾಡೆಲ್ ಅನ್ನು 72% ರಷ್ಟು ಬಾರಿ ಹೆಚ್ಚು ಇಷ್ಟಪಡಲಾಯಿತು.
  • ಎಂಟರ್‌ಪ್ರೈಸ್ ಸಿದ್ಧತೆ: 170 ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ ಮತ್ತು API ಹಾಗೂ Microsoft Foundry ಮೂಲಕ ರಚನಾತ್ಮಕ ಬೆಲೆಗಳನ್ನು ನೀಡುತ್ತದೆ, ಬ್ಯಾಚ್ ಮೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ 1,000 ಪುಟಗಳಿಗೆ $2 ರಿಂದ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ.