כלים ללכידה ולהמרה של האינטרנט

כיצד GrabzIt ממיר HTML ל- DOCX

HTML יכול לייצג מבנים מסובכים רבים כגון DIVs מוטבעים או SPAN של זה לצד זה. רכיבי HTML חופפים וגבולות מוחלים על רכיבי HTML שונים. לרוב זו לא תהיה גישה הגיונית ב-DOCX בעוד שניתן יהיה ליצור floatאם תשתמש ברכיבי HTML עם תיבות טקסט, זה יביא לכך שכמעט כל התוכן יהיה כלול בתיבות טקסט וכתוצאה מכך יהיה מסמך Word מאוד מכוער ומבולגן.

זה בגלל הנושא הזה אנחנו מתעלמים floatשילוב של רכיבי HTML וגבולות של רוב רכיבי HTML. עם זאת, אנו מכבדים גבולות ברכיבי HTML מסוימים כמו תאי טבלה ויישור ברכיבי תמונה למשל.

האם זה אומר שאתה לא יכול למקם תוכן זה לצד זה? לא. זה עדיין אפשרי באמצעות שימוש תכונות CSS של העמודה, טבלאות HTML ועצירות טאבים כמתואר להלן.

אם אתה רוצה שמסמך HTML ייקלט בדיוק כפי שמוצג על המסך, עדיף לעשות זאת להמיר את ה-HTML ל-PDF שכן פורמט קובץ ה-PDF משתמש במיקום מוחלט.

עצירות טאב

עצירות טאב הם תכונת DOCX מיוחדת שמופעלת אם floatרכיבי HTML, עם יישור טקסט, כלולים בתוך רכיב HTML של 100% רוחב שאין לו יישור טקסט ספציפי בעצמו. זה חשוב מכיוון שזה אומר שאין להחיל יישור רגיל על רכיבי הילד. זה נעשה על ידי שימוש text-align:start. שים לב ש-Tab Stops לא יפעלו בתוך טבלה או רשימה.

דוגמה לכך מוצגת להלן.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>

שפת טקסט

כדי להפוך את הטקסט במסמך DOCX לשפה מסוימת. ה HTML רכיב התג של מסמך ה-HTML צריך להיות בעל א lang תְכוּנָה. או אלמנט HTML אחר בתוך מסמך ה-HTML כגון a P לתג צריך לציין LAN.

אם לרכיב HTML הצאצא אין תג lang שצוין, השפה חוזרת לברירת המחדל של המסמך. אם לא צוין, משתמשים באנגלית.