האם הצפרדע יודעת לנתח את תוכן העמוד ולהתריע על תוכן משוכפל?
על פניו – לא.
אבל!
הצפרדע יודעת למצוא עמודים זהים. כלומר – מספר עמודים, עם URL שונה (על אותו דומיין) שמכילים בדיוק בדיוק את אותו התוכן.
למשל – אם יש לכם עמוד בכתובת:
www.domain.com/page
ואותו עמוד מופיע (וזה קורה המון באתרי מג'נטו שלא עברו אופטימיזציה) תחת הכתובת
www.domain.com/category/page
הצפרדע תדע למצוא אותם – וכך תוכלו לאתר עמודים משוכפלים ולבצע קישורי קנוניקל בניהם (או למצוא פתרון אחר להכפלה)
הולכים לטאב uri
ובוחרים את הסינון duplicate.
מה שהצפרדע עושה זה שהיא מחשבת את כל הקוד של האתר לקידוד שנקרא hash (לא יודע מה הפירוש ולא מעניין). וזה אומר שלכל עמוד יש hash ייחודי – אז אם יש מספר כתובות עם אותו התוכן בדיוק ברמת הפסיק – זה אומר שתהיה להם אותה תוצאת hash – וכך ניתן למצוא עמודים זהים ולעשות להם קנוניקל או להעיף את המיותרים – או בכללי למצוא גליצ'ים במערכת שמייצרת את אותו עמוד במלא כתובות.
הערה חשובה: במידה והשכפול הוא רק ברמת התוכן ולא כל העמוד משוכפל – הצפרדע לא תציג את העמודים ככפולים. רק אם העמודים זהים לחלוטין. למציאת תוכן משוכפל באתר יש להשתמש בכלים חיצוניים כמו copyscape ודומיו.