שימוש בXpath – איך לחלץ בקלות נתונים מתוך עמוד

אחת היכולות המתקדמות של הצפרדע המצווחת היא היכולת לקרוע מתוך הקוד אלמנטים שחוזרים על עצמם מתוך האתר. למשל, כמו במקרה שאדגים עכשיו, איך מוציאים ברגע מעמוד קטגוריית מוצר – את כל שמות המוצרים והמחירים שלהם.

בדוגמא אני מראה איך עושים את זה על עמוד אחד – אבל בקלות אפשר להריץ את ההגדרות האלה על כל האתר שלכם (או של המתחרים) ולייצא בשניה את כל המוצרים והמחירים שלהם.

בדוגמא אני עושה שימוש בxpath, ובאמצעות הDevTool של כרום – מצאתי בקלות את כתובת הXpath של הנתונים שרציתי לקרוע. שימו לב – אל תעתיקו את הFull Xpath – כי אז הוא יתייחס רק לנתון הספציפי שבדקתם. הXpath הרגיל יוציא את כל הנתונים שמשתמשים בו.

כדאי לקפץ גם...

האטת סריקה – או: איך לסרוק אתרים על שרת שחוסם סריקה חיצונית

נתקלתם בשרת שחוסם לכם את הסריקה בצפרדע? יש לא מעט שרתים (גם בארץ וגם בחו"ל) שכשהם מזהים סריקה של כלי חיצוני כמו Screaming Frog - הם חוסמים אותו. איך עוקפים את החסימה?

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.