כלים ללכידה ולהמרה של האינטרנט

חלץ קישורים מאתר

דוגמא זו זמינה גם כ תבנית.

משימה נפוצה היא לחלץ קישורים מאתר אינטרנט, ובמיוחד קישורי HTML. למרבה המזל זה קל בעת השימוש מגרד האינטרנט של GrabzIt. ראשית כל צור גרד חדש עם הפרטים הרגילים כמו עמוד הפתיחה של הגרד וכל אפשרויות אחרות.

לאחר מכן עבור אל הוראות לגרד לחץ על הכרטיסייה כפתור דף אינטרנט כפתור. זה ייכנס ל- Page מילות מפתח into הוראות הגרד ותפתח נפתח למטה. בחר getTagAttributes מהרשימה. הבא להוסיף 'href' כפרמטר הראשון, זה אומר למגרד האינטרנט לחלץ את התכונה href ואז להקליד פסיק.

לחץ על הבא לחצן סינון זה מאפשר לך לומר למגרד האינטרנט מאילו רכיבים יש לחלץ את התכונה href. בחלון המסנן ודא שהסוג מוגדר כ- 'דף אינטרנט' וההגבלה היא 'שם תג' ו'שווה ל- '. ואז נכנסים a בתיבת הטקסט ואז לחץ על כפתור הוסף ואז על כפתור הכנס מסנן. סיים את ההוראות על ידי הוספת מעי הגס למחצה לקצה התור.

אתה צריך להישאר עם משהו כמו המוצג להלן.

Page.getTagAttributes('href', {"tag":{"equals":"a"}});

הקוד שלמעלה יחלץ את כל כתובות האתר של הקישור מדף האינטרנט, אולם כעת עלינו לעשות זאת save אלה קישוריות של URL. לשם כך נעטוף את הפקודה הזו מינוס המעי הגס במחצה Data.save פקודה. לשם כך עבור לתחילת הקו ובחר כפתור נתונים כפתור. ואז בתפריט הנפתח בחר save, עבור אל סוף השורה והוסף פסיק. לאחר מכן הוסף את מה שאתה רוצה לקרוא למערך הנתונים כמו 'האתר שלי', ואז הוסף פסיק נוסף ואז הוסף פרמטר נוסף כדי לתאר את העמודה כגון 'קישורים' ואז סגור את הפקודה עם ) לפני המעי הגס.

כעת עליך לקבל את הוראות הגרוט הבאות.

Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');

כעת אם תפעיל את השריטה, תמצאי את כל הקישורים מהאתר. זה יוצר טבלה עם שם אתרי האינטרנט שלי, עם שם עמודה של קישורים שאפשר לייצא לאחר מכן into פורמטים רבים ושונים כגון XML, CSV או גיליון אלקטרוני. ניתן היה להשיג את ההדרכה הזו גם באמצעות לחצן האשף בסרגל הכלים Scrape הוראות.