כלים ללכידה ולהמרה של האינטרנט

חלץ טקסט מתמונות

לעתים קרובות ניתן לשמור מידע טקסטואלי חשוב בתמונות. למרות זאת מגרד האינטרנט של GrabzIt מספק את היכולת לחלץ מידע זה באופן אוטומטי באמצעות זיהוי תווים אופטי. אם כי מכיוון שזו סוג של מלאכותי intההבנה התוצאות לא תמיד מושלמות.

כדי לחלץ טקסט מתמונות עליך להשתמש ב- Utility.Image.extractText שיטה כמוצג להלן.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

דוגמאות אלה מקבלות את כל כתובות האתר לתמונות מדף האינטרנט ואז מעבירות את ה- URL לשיטת extractText שמנסה לחלץ נתונים טקסטואליים מכל תמונה ומחזירה כל התאמה כמערך של strings.

אם הטקסט בתמונה נמצא בשפה אחרת, עליך לציין את קוד השפה הנכון באמצעות תבנית שתי האותיות (ISO 639-1) כמוצג להלן.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');