כלים ללכידה ולהמרה של האינטרנט

המרת דפי אינטרנט ו- HTML ל- PDF

ממשק API של פייתון

בעת המרת דפי אינטרנט ו- HTML ל- PDF ממשק ה- API של GrabzIt Python מספק את התכונות הבאות שעוזרות intאיחוד GrabzIt into המערכת שלך בקלות רבה ככל האפשר. עם זאת לפני שתתחיל לזכור את זה לאחר התקשר אל URLToPDF, HTMLToPDF or FileToPDF שיטות Save or SaveTo יש לקרוא לשיטה לצילום צילום המסך PDF.

אפשרויות בסיסיות

לעתים קרובות בעת המרת דף אינטרנט intoa מסמך PDF יוצר דפים רבים על מנת לייצג את כל דף האינטרנט. כדי להמיר דף אינטרנט נדרש פרמטר אחד בלבד intמסמך PDF או ל- המרת HTML ל- PDF כפי שמוצג בדוגמאות שלהלן.

grabzIt.URLToPDF("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html")
# Then call the Save or SaveTo method

מזהה מותאם אישית

אתה יכול להעביר מזהה מותאם אישית אל ה- PDF שיטות כמוצג להלן, ערך זה מוחזר לאחר מכן למטפל GrabzIt Python שלך. לדוגמה, מזהה מותאם אישית זה יכול להיות מזהה בסיס נתונים, המאפשר לשייך צילום מסך לרשומת מסד נתונים מסוימת.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.URLToPDF("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.FileToPDF("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

כותרות עליונות ותחתונות

כשאתה יוצר צילום מסך PDF אתה יכול לבקש שתרצה להחיל מסוים תבנית ל- PDF שנוצר. תבנית זו חייבת להיות saved מראש ופרט את תוכן הכותרת העליונה התחתונה יחד עם כל משתנים מיוחדים. בקוד הדוגמה למטה המשתמש משתמש בתבנית שלו שנקראת "התבנית שלי".

אם אין שולי עליון או תחתון גדולים מספיק לכותרת העליונה או התחתונה בהתאמה, זה לא יופיע ב- PDF. בדוגמה להלן קבענו את השוליים העליונים והתחתונים ל- 20 כדי לספק מקום רב.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.marginTop = 20
options.marginBottom = 20
options.templateId = "my template"

grabzIt.FileToPDF("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

המר אלמנט HTML ל- PDF

אם ברצונך להמיר אלמנט HTML כגון div או span ישירות intoa מסמך PDF אתה יכול עם ספריית Python של GrabzIt. עליך לעבור את בורר CSS של אלמנט ה- HTML שברצונך להמיר ל- targetElement פָּרָמֶטֶר.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

בדוגמה זו ברצוננו ללכוד את כל התוכן בטווח שיש לו מזהה Articleלכן אנו מעבירים זאת ל- GrabzIt כמוצג להלן.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.targetElement = "#Article"

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

כיצד ניתן לקצץ PDF בעת מיקוד לאלמנט HTML יכול להיות מבוקר באמצעות טכניקות אלה.