מיסטרל משיקה את Mistral OCR 3: עידן חדש בפענוח מסמכים מורכבים עם יכולות מתקדמות ושיפור ביצועים משמעותי!

Mistral OCR 3: מודל זיהוי כתב מתקדם לארגונים

מבוא

חברת מיסטרל (Mistral AI) השיקה את Mistral OCR 3, הדור החדש של מודל זיהוי תווים אופטי (OCR), המיועד לפענוח מסמכים מורכבים, כולל כתב יד, טפסים וטבלאות צפופות. המודל מצטיין בשימור מבנה המסמך ומספק פלט מובנה ב-Markdown וב-HTML.

מאפיינים עיקריים

שיפור ביצועים

Mistral OCR 3 מציע שיפור משמעותי בביצועיו בהשוואה לדור הקודם, ניצב עם שיעור הצלחה של 74% בתרחישים עסקיים. המודל נועד להתגבר על אתגרים קשים כגון פענוח כתב יד מחובר, הערות על טפסים מודפסים, וטקסט מעורב, שנחשבו בזמנו אתגרים עבור מערכות OCR קלאסיות.

יכולת שחזור מבנה

בנוסף לזיהוי טקסט, המודל מצליח לזהות מבני טבלאות מורכבים, תאים מאוחדים, כותרות והיררכיות עמודות, כאשר הפלט כולל תגיות HTML המאפשרות הבנה מעמיקה יותר של ההקשר המבני.

ביצועים ובדיקות

Mistral מדווחת כי המודל מציע כישורים שבהם הוא עולה על פתרונות עיבוד מסמכים ארגוניים מסורתיים, וכי בדיקות הביצועים התבססו על מדדי התאמה (Fuzzy-match) מול נתוני אמת שנאספו מתרחישי שימוש עסקיים.

יכולות נוספות ושימושים

שילוב ב-Document AI

המודל משולב באופן מלא עם Document AI שבפלטפורמת Mistral AI Studio, המאפשרת למפתחים להעלות קובצי PDF או תמונות ולקבל פלט טקסט נקי או בפורמט JSON מובנה. יכולת זו מסייעת בתהליכי עבודה בתעשיות עתירות ניירת כמו פיננסים, ביטוח ובריאות.

פלט גמיש

המודל גם תומך בפלט בפורמט Markdown המועשר ב-HTML, דבר שהופך אותו לאידיאלי להזנת נתונים למערכות RAG (Retrieval-Augmented Generation) וגם להנגשה עבור טכנולוגיות מסייעות.

זמינות ומחירים

Mistral OCR 3 זמין לשימוש מיידי דרך ה-API של החברה ובפלטפורמת Mistral AI Studio, במחיר של 2 דולר לכל 1,000 עמודים. שימוש בעיבוד באצוות (Batch Processing) צונח במחיר ל-1 דולר לכל 1,000 עמודים.

האיום של המודלים החכמים על תהליכי העבודה המסורתיים מוביל לפיתוחים חדשים ושיפורים עסקיים, וכעת Mistral OCR 3 מציע לעסקים פתרון מתקדם לעיבוד ואנליזה של מסמכים בצורה קלה ויעילה.

Scroll to Top