שימוש בXpath לספירת כמות המילים בפוסטים באתר

הצפרדע יכולה להיות מאוד מדויקת בדברים מסוימים כמו אורך טייטלים, כמות תווים בדסקריפשן, משקל העמוד והתמונות וכו' – אבל יש כמה סעיפים שהרובוטיות של הצפרדע לא נותן לנו מענה רלוונטי – ואחד מהם הוא ספירת המילים.

כברירת מחדל – Screaming Frog מציגה לנו את כמות המילים שיש בעמוד. אבל מדובר בכל המילים שיש בעמוד. כולל הכותרות, התפריטים, סרגל הצד, הפוטר ועוד. ולא ניתן לבודד את כמות המילים הממשית בפוסט בודד מכלל המילים בעמוד.

אבל כמובן שיש דרך לשלוף את כמות המילים – וזה נעשה באמצעות Costum Extraction ואקסל.

הדרך שבה נוכל למצא את כמות המילים בצורה פשוטה היא למעשה – בשליפה של הטקסט מתוך הפוסט ואז נשים את הטקסטים באקסל ונפעיל נוסחה לספירת מילים.

צעד ראשון – נשלוף את הטקסטים מהפוסט:

  • נכנס לעמוד הפוסט, נלחץ F12,
  • נבחר את אזור הטקסט של האתר (נוודא שרק אזור הטקסט מסומן)
  • נלחץ מקש ימני בעכבר על הDIV שכלי הDevTool מציג לנו ונבחר "copy path"
  • נלך לצפרדע ונכנס ל Configuration -> Custom -> Extraction
  • נלחץ על ADD
  • נדביק בשדה המיועד את מה שהעתקנו מה DevTool
  • נשנה את Extract Inner HTML – ל Extract test – על מנת שישלוף לנו רק את הטקסט ולא את תווי הקוד שאין לנו שימוש בהם.
  • ונריץ את הצפרדע על האתר (או על העמודים שאנחנו רוצים)
  • בסיום הריצה נלך לטאב "Custom Extraction" – וסביר להניח שלא נראה כלום. למה? כי הטקסטים ממש ארוכים ולצפרדע יש קצת בעיה להציג אותם. זה לא אומר שהם לא שם! תוכלו לראות אם תסמנו משבצת, תעתיקו את התוכן ותדביקו בnotepad.
  • נבחר את הFilter שבחרנו ונייצא קובץ XLSX למחשב.

צעד שני נוסחת ספירת המילים באקסל

  • בעמודה חדשה בסוף השורה השניה (בעמודהE2) נוסיף את הנוסחה הבאה שסופרת את כמות המילים בתא ספציפי:

    =IF(LEN(TRIM(D2))=0,0,LEN(TRIM(D2))-LEN(SUBSTITUTE(D2," ",""))+1)

    (שימו לב שD2 מייצג את התא שבו נמצא הטקסט הראשון. אם אצלכם זה שונה משום מה – תעדכנו בהתאם)

  • ואז תגררו עם הפלוס את הנוסחא לכל אורך האקסל – וכך תקבלו את כמות המילים שיש בכל פוסט.

שימו לב שיהיו עמודים שיחזירו תוצאה 0. אלו פשוט עמודים אחרים שהם לא פוסטים אלא עמודי קטגוריה, עמודים סטטיים וכו שבנויים בצורה אחרת. אם תרצו לשלוף את הטקסט מהם – תצטרכו למצוא את הXpath הרלוונטי ולעבוד באותה השיטה.

זהו הכל!

 

כדאי לקפץ גם...

איך מזהים Cloaking שנוצר באתר בעקבות פריצה

גוגל שלח הודעה דרך הקונסול שיש שוני בין האתר הנייח לאתר המובייל - שוני שלא אמור להיות מכיוון שמדובר באתר רספונסיבי. בדיקה מהירה באתר הראתה שהכל תקין. אבל אולי משהו מסתתר מתחת לפני השטח? אז איך מוצאים פרצות קלוקינג באמצעות הצפרדע? התשובות בפנים!

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.