כלים ללכידה ולהמרה של האינטרנט

גרד כתובות דוא"ל מאתר

שתי הדוגמאות הבאות הן חלק מאותו דבר תבנית.

מגרד האינטרנט של GrabzIt מספק מספר שיטות שירות מיוחדות כדי להקל על חילוץ כתובות דוא"ל מאתר. הדוגמה הבאה מקבלת את כל תוכן ה- HTML מדף אינטרנט ואז מעבירה אותו דרך Utility.Text.extractAddresses שיטה למצוא את כל כתובות הדוא"ל התקפות לפני שמירת הכתובות intoa מערך נתונים, שנשלח לאחר מכן למשתמש.

לחלופין, ניתן לחלץ רק את כתובת הדוא"ל התואמת הראשונה באמצעות Utility.Text.extractAddress שִׁיטָה.

Data.save(Utility.Text.extractAddresses(Page.getHtml()));

גרד כתובות דוא"ל ממסמכי PDF

ניתן לגרד גם מסמכי PDF עבור כתובות דוא"ל באופן דומה לאופן גירוד דפי האינטרנט למעלה. כפי שתוכלו לראות בדוגמה הבאה, התהליך זהה לחלוטין למעט ה- PDF.getText() משתמשים בשיטה במקום Page.getHtml() שִׁיטָה.

Data.save(Utility.Text.extractAddresses(PDF.getText()));

גרד כתובות דוא"ל מתמונות

ל- GrabzIt יש את היכולת לחלץ טקסט מתמונות המשמעות היא שניתן למנף יכולת זו גם כדי לחלץ כתובות דוא"ל מתמונות. הדוגמה למטה מחלצת כתובות דוא"ל מכל התמונות שבדף אינטרנט.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));

ואילו הוראות השריטה שלהלן מחלצות תוספות דוא"ל מתמונות שנמצאות במסמכי PDF.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));