כלים ללכידה ולהמרה של האינטרנט

כיצד להוריד אתר אינטרנט ואת כל תוכנו?

אתר

ישנם מקרים שבהם חשוב להוריד אתר שלם, ולא רק את התוצאה המוגמרת. אבל דפי אינטרנט של HTML, משאבים כמו CSS, סקריפטים ותמונות.

זה אולי בגלל שאתה רוצה גיבוי של הקוד אך אינך יכול עוד להגיע למקור המקורי מסיבה כלשהי. או אולי אתה רוצה תיעוד מפורט של האופן בו אתר אינטרנט השתנה לאורך זמן.

למרבה המזל מגרד האינטרנט של GrabzIt יכול להשיג זאת על ידי סריקה על כל דפי האינטרנט באתר. ואז בכל דף אינטרנט המגרד מוריד את ה- HTML יחד עם כל המשאבים המופנים בדף.

צור גרד להורדת אתר שלם

כדי להקל על הורדת האתר שלך ככל האפשר GrabzIt מספק תבנית גרד.

להתחיל טען תבנית זו.

ואז הזן את כתובת אתר של יעד, כתובת אתר זו נבדקת אוטומטית אחר שגיאות וכל השינויים הנדרשים שבוצעו. שמור את ה התחל באופן אוטומטי לגרד תיבת הסימון מסומנת, והשריטה שלך תתחיל אוטומטית.

התאמה אישית של הגרד שלך

אם ברצונך לשנות את התבנית, בטל את הסימון של התחל באופן אוטומטי לגרד תיבת סימון. שינוי אחד יהיה להפעיל את השריטה בלוח זמנים קבוע, למשל, ליצור עותקים רגילים של אתר. על לוח הזמנים לגרד לחץ על הכרטיסייה חזור על הגרד בחר בתיבת הסימון ואז בחר באיזו תדירות תרצה שהשריטה תחזור. ואז לחץ עדכון להתחיל את הגרד.

שימוש באתר האינטרנט שהורדת

לאחר השלמת הגרד תקבל קובץ ZIP. הבא לחלץ את קובץ ה- ZIP ובפנים הממוקם בספריה בשם קבצים יהיו כל דפי האינטרנט והמשאבים באתר שהורדת. יהיה גם עמוד HTML מיוחד שנקרא data.html בשורש הספרייה. פתח קובץ זה בדפדפן אינטרנט ותמצא טבלת HTML עם שלוש עמודות:

  • כתובת אתר למשאבים - זוהי כתובת האתר שמגרד האינטרנט מצא את המשאב בה. אז למשל: http://www.example.com/logo.jog
  • סוג משאבים - זהו סוג המשאב שהורד. ישנם ארבעה סוגים של משאבים.
    • דף האינטרנט
    • תמונה
    • משאב חיצוני - כל משאב שהורד מתג קישור
    • תסריט
  • שם קובץ חדש - שם הקובץ החדש שהיה המשאב saveד מתחת. שים לב שעמודה זו מכילה גם קישור לקובץ, מה שמקל על בדיקת כל המשאב שהורדת.

קובץ זה נועד לעזור לכם למפות את שמות הקבצים החדשים למיקומם הישן. זה נחוץ מכיוון שלא ניתן למפות כתובת URL ישירות למבנה קובץ מכיוון שכתובת אתר יכולה להיות גדולה מכדי שתוכל לאחסן אותה ישירות בנתיב הקובץ.

כמו כן, יכולות להיות הרבה פרמוטציות, במיוחד כאשר דף אינטרנט יכול לייצג הרבה מאוד תוכן שונה על ידי שינוי שאילתות שונות string פרמטרים! אז במקום זאת אנו מאחסנים את האתר במבנה שטוח בתיקיית הקבצים ונותנים לך קובץ data.html כדי למפות קבצים אלה למבנה המקורי.

כמובן שבגלל זה אינך יכול לפתוח דף HTML שהורדת ולצפות לראות את דף האינטרנט שראית באינטרנט. לשם כך תצטרך לשכתב מחדש את נתיבי המשאבים לתמונה, סקריפט ו- CSS וכו ', כך שקובץ HTML יוכל למצוא אותם במבנה הקבצים המקומי שלך.

קובץ נוסף שייכלל בשורש קובץ ה- ZIP נקרא Website.csv. זה מכיל את אותו מידע בדיוק כמו הקובץ data.html. עם זאת זה כלול למקרה שתרצה לקרוא ולעבד את הורדת האתר באופן תכנותי, אולי באמצעות המיפוי מכתובת האתר לקבצים כדי ליצור מחדש את האתר שהורדת.