השפעת קישורים חיצוניים על מנועי החיפוש לאורך ההיסטוריה

שימוש בקישורים כדרך למדוד את חשיבות האתר אל מול אתרים אחרים היא אחד המדדים לפיהם גוגל מחליט איזה אתר צריך להופיע בראש תוצאות החיפוש. הקונספט הפך לפופולרי לראשונה ע"י גוגל, שיישמה את אלגוריתם ה- PageRank שלה (אחרים הספיקו לכתוב תאורטית לפני כן על שימוש בקישורים כגורם דירוג, אבל בסיס המשתמשים הרחב של גוגל הפך את זה לפופולארי).

במילים פשוטות, כל קישור לדף אינטרנט הוא קול הצבעה עבור אותו דף. עם זאת, זה לא פשוט כמו שזה נשמע, כי הקישורים והאתרים שהם יוצאים מהם לא שווים ביניהם, ולחלקם יש משקל גבוה יותר באלגוריתם מאשר לאחרים.

המפתח להבנת התאוריה הזו היא הבסיס לפיו קישורים מייצגים את חכמת ההמונים באינטרנט. עם זאת, כאשר מפרסמים למדו על הכוח של הקישורים, חלקם התחילו לחבל ולעשות מניפולציה בקישורים באמצעות מגוון שיטות. זה יצר סיטואציות בהן הקישור לא היווה קול הצבעה לגיטימי, אלא עוד כלי במניפולציה של מקדמי האתרים על גוגל. הדבר גרם לגוגל לשכלל ולשפר את אלגוריתם הדירוג שלה.

על מנת שנוכל להבין את האלגוריתם הנוכחי, נבחן ראשית את האלגוריתם המקורי לעומק.

אלגוריתם ה- PageRank

אלגוריתם ה- PageRank נבנה על בסיס תיאוריית ה- PageRank המקורית של סרגיי ברין ולארי פייג' בזמן שהם היו סטודנטים לתואר ראשון באוניברסיטת סטנפורד.

במילים פשוטות, כל קישור לדף אינטרנט הוא קול עבור אותו דף. יחד עם זאת, כפי שצוין קודם, לא לכל קול יש משקל זהה. לכן על מנת שניתן יהיה להבין בצורה טובה יותר איך זה עובד, נסביר את אלגוריתם ה- PageRank בכלליות. ראשית, כל הדפים מקבלים כמות קטנה אך טבעית של PageRank.

לאחר מכן דפים יכולים להגדיל את דירוג ה- PageRank שלהם ע"י קבלת קישורים מדפים אחרים.

כמה PageRank יכול דף אחד להעביר לדף אחר דרך קישורים? בוודאות פחות מה-PageRank של הדף המקורי. ב-2009 מאט קאטס כתב פוסט בו לדעתו דף יכול להעביר לחברו 85-90% מה-PageRank שלו.

אם הדף הנ"ל מקושר לדף אחד בלבד, הוא מעביר את כל ה- PageRank שביכולתו להעביר לאותו דף.

יחד עם זאת, התרחיש הופך למורכב יותר מכיוון שדפים יהיו מקושרים ליותר מדף אחד בלבד. כאשר זה קורה, ה- PageRank שהדף יכול להעביר יחולק בין כל הדפים אליהם הוא מקושר.

בנוסחת ה- PageRank המקורית, משקל הקישור מחולק באופן שווה במספר הקישורים בדף. זה ללא ספק לא נכון כיום, אבל זה עדיין משמעותי על מנת להבין את המטרה המקורית.

קישוריות בהצלבה הופכת את חישוב ה- PageRank למורכבת הרבה יותר.

המסקנה המרכזית כאן היא שכאשר דף B מקושר לדף A, כדי להפוך את הקישוריות להדדית, ה- PageRank של דף A (x) הופכת תלויה ב- f(y), חלק ה- PageRank שדף B יכול להעביר, שהוא במקרה גם תלוי ב- f(x)! בנוסף לכך, ה- PageRank שדף A מעביר לדף C מושפע גם הוא מהקישוריות בין דף B לדף A. כל זה יוצר סיטואציה מאוד מסובכת, בה חישוב ה- PageRank של כל דף אינטרנט חייב להיקבע על פי ניתוח רקורסיבי.

הגדרנו כמה פרמטרים חדשים על מנת לייצג את זה: q, ה- PageRank שדף B צובר בעקבות הקשר שלו עם דף A (אחרי כל החישובים האיטרטיביים); ו- z, ה- PageRank שדף A צובר בעקבות הקשר שלו עם דף B (שוב, אחרי כל החישובים האיטרטיביים).

כך לדוגמא, מכיוון שדף B מקושר לויקיפדיה, חלק מה- PageRank של העמוד נשלח לשם, במקום לדפים האחרים שדף B מקושר אליהם (דף A בדוגמא הנוכחית).

הרעיון של "דליפת" ה- PageRank מסמל פגם בסיסי באלגוריתם הנ"ל. ברגע שמעצבי דפים חקרו את העקרונות המנחים של PageRank, הם הבינו שיצירת קישוריות החוצה מהאתר שלהם תגרום להם יותר נזק מתועלת. בזמנו, אם מספר רב של בוני אתרים או מקדמי אתרים היו מאמצים את הגישה הזו, זה יכול היה לפגום משמעותית ברעיון ה"קישורים כקולות הצבעה" ובכך, למעשה, לפגוע באיכות של האלגוריתם של גוגל. כמובן שגוגל תיקנה במהירות את הפגם הזה באלגוריתם שלה. כתוצאה מהתיקון אין צורך לדאוג יותר לגבי "דליפת PageRank". אתרים איכותיים אמורים לקשר לאתרים רלוונטים ואיכותיים אחרים ברחבי הרשת.

גם אחרי השינויים הללו, קישורים פנימיים מדפים עדיין מעבירים PageRank מסוים, ולכן עדיין יש להם ערך.

גוגל כל הזמן משנה ומגדירה מחדש את הדרך שבה היא משתמשת בקישורים כדי להשפיע על הדירוג, והאלגוריתם הנוכחי כבר לא מבוסס על PageRank המקורי. יחד עם זאת, היכרות והבנה של האלגוריתם המקורי ללא ספק מועילה לאלו שמנסים להבין את הרציונל מאחורי האלגוריתם של גוגל על מנת להגיע לתוצאות קידום אורגני מרשימות.

כל החלק של הקישורים באלגוריתם הדירוג של גוגל בנוי על בסיס ההנחה שברוב המקרים הקישורים שמתקבלים הם קישורים לגיטימיים שהאתר המקשר ייצר לאתר שלך מסיבה טובה. מי שמקשר לאתר אחר עושה זאת מכיוון שהוא מאמין שהוא מקשר את הגולשים שלו למקור מידע רלוונטי ומצוין.

בעולם אידיאלי, קישורים יהיו זהים לאזכורים אקדמאיים שתמצא בסוף מאמר מדעי, המפנים את הקורא למקורות אחרים שעזרו לו לבסס את המחקר שלו.

אם בעל האתר המקשר יתוגמל על כך, הערך של הקישור למנוע החיפוש יורד משמעותית, ועלול בסופו של דבר לפגוע משמעותית ברמת הדיוק של התוצאות. תגמול יכול להיות כסף, אך יכול גם להיות יחס מיוחד. נדבר על זה בהרחבה בהמשך המאמר.

גורמים נוספים שמשפיעים על ערך הקישור

PageRank קלאסי הוא לא הגורם היחיד שמשפיע על הערך של קישור. קיימים גורמים נוספים שיכולים להשפיע על הערך שקישור מעביר.

טקסט עוגן (Anchor Text)

טקסט עוגן מתייחס לחלק שניתן ללחוץ עליו בקישור מדף אינטרנט אחד לאחר.

טקסט העוגן לקישור הראשון ברשימת הדפים הפופולריים  הוא Refinancing. מנוע החיפוש משתמש בטקסט העוגן הזה כדי להבין על מה מדבר הדף שמקבל את הקישור. כתוצאה מכך, מנוע החיפוש יפרש את הקישור כאחד שאומר שהדף שמקבל את הקישור מדבר על Refinancing, ולפיכך ידרג את הדף גבוה יותר בתוצאות החיפוש בתווית החיפוש הזו.

בשלב מסוים, טקסט העוגן היה כל כך חזק ומשמעותי שמקדמי האתרים התחילו לבצע פעולה שנקראת Google Bombing ("הפצצת גוגל") – קישור מספר רב של אתרים באמצעות אותו טקסט עוגן לאתר עמוד ספציפי באתר אחד יכול לגרום לו להיות מדורג עבור ביטוי העוגן גם אם הדף כלל לא קשור לביטוי, ולא מכיל אותו בכלל.

הפצצת גוגל מפורסמת במיוחד הייתה קמפיין ששם לעצמו למטרה את דף הביוגרפיה של ג'ורג' וו בוש באתר WhiteHouse.gov עם טקסט העוגן "כישלון חרוץ". כתוצאה מכך, הדף הזה דורג במקום הראשון בחיפוש כישלון חרוץ עד שגוגל תיקנה את האלגוריתם שלה כדי להקטין את ההשפעה של תופעה זו.

הפצצות גוגל לא היו ההשלכות החמורות ביותר של הכוח של טקסט עוגן. השימוש בטקסט עוגן כגורם מדרג הוא שימושי באלגוריתמי חיפוש רק בתנאי אחד: אם האתר בו נמצא הקישור בוחר את טקסט העוגן שלו באופן טבעי ורלוונטי. אם הוא מתוגמל על בסיס שימוש בטקסט עוגן ספציפי, ערך הקישור כגורם מדרג יורד.

חמור מכך, חברות לקידום אתרים החלו לנצל את המערכת וליישם תוכניות שבונות קישורים המעוצבים סביב טקסט עוגן על מנת לשפר את הדירוג של הביטויים אותם הם רצו לקדם. כתוצאה מכך, מפרסמים שלא הצטרפו לזרם ולא פתחו בקמפיינים לבניית קישורים כאלה סבלו מחיסרון חמור. לבסוף, המצב נהיה חמור במיוחד והחל להשפיע בצורה משמעותית על השימוש בקישורים כקולות הצבעה אמינים, וגוגל החלה לפעול בנושא.

בתחילת שנת 2012, גוגל החלה לשלוח לבעלי אתרים אזהרות "קישור בלתי-טבעי" דרך Google Search Console, וב-24 באפריל 2012, גוגל שחררה את הגרסה הראשונה של אלגוריתם הפינגווין שלה.

טקסט העוגן הוא עדיין חלק חשוב מאלגוריתמי החיפוש, אך כעת מנועי החיפוש עושים שני דברים:

1. מחפשים תבניות לא-טבעיות של טקסט עוגן

2. מורידים את הדירוג לביטויים בהם ברור שנעשה שימוש בתבנית אשר מנסה להשפיע בצורה מלאכותית על טקסט העוגן של של הקישורים שמובילים לאתר המקודם

רלוונטיות

קישורים שמקורם באתרים/דפים באותו נושא כמו הנושא של האתר המקודם, או נושאים דומים, שווים יותר מאשר קישורים שמגיעים מאתר שהתוכן שלו לא קשור.

אפשר לחשוב על זה בצורה כזו: כל קישור נבחן לפי ההקשר הספציפי של ביטוי החיפוש אותו הזין המשתמש. כלומר, אם משתמש הזין "מכוניות יד שניה בתל אביב" והמפרסם קיבל קישור לדף המכוניות יד 2 בתל אביב באתר "yad2", הקישור יחזק את אמונת מנוע החיפוש שהדף אכן קשור למכוניות משומשות שנמצאות בעיר תל אביב.

באופן דומה, אם למפרסם יש קישור נוסף מאתר של מגזין שפרסם סקירה על אתרי מכוניות יד 2, זה יחזק את ההנחה שהאתר צריך להיות מוגדר כאתר מכוניות יד 2. כשמתייחסים להכל ביחד, שני הקישורים הללו יכולים להיות משמעותיים ולעזור למפרסם להיות מדורג גבוה בביטוי ל-מכוניות משומשות בתל אביב.

סמכותיות

סמכותיות באינטרנט הוא תחום שנחקר רבות לאחרונה. אחד מהמאמרים המפורסמים ביותר, שנכתב ע"י אפוסטלוס גראסוליוס ואחרים באוניברסיטת ראטגרס ונקרא " DiscoWeb: Applying Link Analysis to Web Search" (יישום ניתוח קישורים בחיפושי אינטרנט), הפך לבסיס של האלגוריתם Teoma, שנרכש מאוחר יותר ע"י חברת AskJeeves והפך לחלק מאלגוריתם האתר Ask.com.

מה שהפך את האלגוריתם הזה למיוחד היה ההתמקדות שלו בבדיקת קישורים על בסיס הרלוונטיות שלהם לאתר המקושר. אלגוריתם ה- PageRank המקורי של גוגל לא כלל את הרעיון של רלוונטיות הנושאים של האתרים, ולמרות שהאלגוריתם של גוגל עושה זאת היום, Teoma הייתה למעשה מנוע החיפוש הראשון שהציע יישום בפועל של רלוונטיות הקישורים.

Teoma הציגה את הרעיון של hubs (רכזים), – האתרים שמקושרים לרוב האתרים החשובים והרלוונטיים לנושא מסוים, ו- authorities (בעלי סמכות), – האתרים שיש קישור אליהם ע"י רוב האתרים הרלוונטיים לנושא מסוים.

הרעיון המרכזי כאן הוא שלכל נושא שמשתמש יכול לחפש יהיו אתרי בעלי סמכות ספציפיים לאותו נושא. אתרי בעלי הסמכויות למכוניות יד 2 שונים מאתרי בעלי הסמכויות לבייסבול.

אז, אם למפרסם יש אתר על מכוניות יד 2, הוא צריך לחפש ולרצות למצוא קישורים מאתרים שמנועי החיפוש מגדירים כאתרים סמכותיים בתחום המכוניות יד 2 (או אולי ברמה כללית יותר, בנושא מכוניות). יחד עם זאת, מנוע החיפוש לא יאמר לך אילו אתרים הוא מגדיר כאתרים בעלי סמכות – מה שהופך את עבודת מקדם האתרים לקשה הרבה יותר.

המודל לארגון האינטרנט לקהילות נושא וכיול הרכזים ובעלי הסמכויות והרשויות הוא מודל שחשוב להבין. בוני הקישורים הטובים ביותר מבינים את המודל הזה לעומק וממנפים אותו לטובתם.

אמון (Trust)

אמון הוא פרמטר נוסף, אשר שונה מסמכותיות. עצם היות אתר בעל סמכות לא עונה על השאלה האם הדף או הדומיין המקשר מאפשר לאנשים להפיץ ספאם, לפרוץ למחשבים של גולשים או לפגוע בהם בצורה אחרת. אמון, לעומת זאת, כן לוקח זאת בחשבון.

בדיקת האמון של אתר מסוים בדרך כלל תכלול בדיקת "שכונת הקישורים" שלו (link neighborhood) כדי לבחון אילו אתרים אמינים אחרים מקושרים אליו. קישורים נוספים מאתרים אמינים אחרים ייעלו את רמת אמון האתר.

ב-2004, יאהו ואוניברסיטת סטנפורד פרסמו מאמר שנקרא "Combating Web Spam with TrustRank". המאמר הציע להתחיל עם בסיס של אתרים אמינים (שיבחרו ע"י בחינה ידנית אנושית) כדי לבצע ניתוח PageRank, במקום להשתמש בסט אקראי של דפים כפי שנעשה בתיאוריית ה- PageRank המקורית.

שימוש בטקטיקה הזו מפחית את הסיכון שמגיע עם שימוש בגישה אלגוריתמית בלבד כדי לבחון את האמינות של אתר, גישה שבאופן פוטנציאלי יכולה להצביע על False Negatives או False Positives.

רמת האמינות של אתר תיקבע על פי מרחק הקליקים בו הוא נמצא מאתרי הבסיס האמינים שנבחרו ידנית. אתר שנמצא מרחק קליק אחד מאתר אמין יצבור אמינות גבוהה; מרחק שני קליקים, קצת פחות אמינות; מרחק שלושה קליקים, אפילו פחות אמינות, וכך הלאה.

החוקרים של מאמר ה-TrustRank פרסמו גם מאמר שמתאר את הרעיון של Mass Spam. המאמר הזה מתמקד בניתוח ההשפעה של קישורי ספאם על דירוג האתר. ככל שההשפעה של הקישורים הללו גדלה, כך ישנו סיכוי גבוה יותר שהאתר בעצמו הוא אתר ספאם. אם אחוז גבוה מקישורי האתר נרכשו בכסף, זו הגדרה נוספת לספאם. מקדמי אתרים יצירתיים יכולים לקחת בחשבון גם פעילות התקפית בה בניית קישורי ספאם לאתר מתחרה יפחית את ה TrustRank שלו וכך יוריד את מיקומי הביטויים אותם התוקף מנסה לעקוף.

ישנו סיכוי גבוה שגוגל ובינג משתמשות בפורמט כלשהו של מדד אמון כדי לבחון אתרים. זה כנראה נעשה באמצעים שונים ממה שהוסבר ב-TrustRank ובמאמרים בנושא הספאם. קיימת אפשרות שהדבר מיושם בשיטות לפיהן מנועי החיפוש מחשבים סמכותיות אתרים, אבל כך או כך האמון נחשב לאחד הגורמים המשמעותיים ביותר בדירוג אתרים. עבור מקדמי אתרים, מדידת אמון יכולה להיות משימה קשה. כרגע Moz Trust של Open Site Explorer ו Trust Flow של Majestic נחשבים לכלים יחסית טובים לבדיקת רמת האמון.

איך מנועי חיפוש משתמשים בקישורים

מנועי חיפוש משתמשים בקישורים בעיקר כדי לגלות דפי אינטרנט חדשים, ולספור את הקישורים כהצבעות לאותם דפי אינטרנט. אבל איך הם משתמשים במידע הזה ברגע שהם משיגים אותו?

הוספה לאינדקס

מנועי חיפוש צריכים להחליט אילו דפים לכלול באינדקס שלהם. סריקת דפי אינטרנט (בעקבות קישורים) היא דרך אחת לגלות דפי אינטרנט (דרך נוספת היא דרך שימוש ב-XML, קבצי מפת האתר). בנוסף לכך, מנועי החיפוש לא כוללים דפים שהם מגדירים כדפים בעלי ערך נמוך במיוחד, מכיוון שהצפת האינדקס שלהם בדפים כאלו תהפוך את חווית השימוש לשלילית. ערך הקישור המצטבר הוא גורם בקבלת ההחלטה הזו.

קצב/תדירות סריקה

העכביש של מנוע החיפוש יוצא מהמאורה שלו מדי יום (למען האמת, כל הזמן) וסורק את האינטרנט שוב ושוב. זו אינה משימה פשוטה, והיא מתחילה בהחלטה איפה להתחיל ולאן ללכת. גוגל הצהירה רשמית שהיא מתחילה את הסריקה שלה לפי סדר PageRank. במילים אחרות, בשלב הראשון היא סורקת אתרי PageRank 10, בשלב השני אתרי PageRank 9, וכך הלאה. אתרי PageRank גבוהים יותר נסרקים בצורה עמוקה יותר מאחרים. רוב הסיכויים שגם בינג מתחילה את הסריקה שלה מהאתרים החשובים ביותר.

זה נשמע הגיוני, מכיוון ששינויים באתרים החשובים ביותר הם אלו שמנועי החיפוש רוצים לגלות הכי מהר. בנוסף לכך, אם אתר מאוד חשוב מקשר למקור מידע חדש בפעם הראשונה, מנועי החיפוש נוטים לתת אמון רב באותו קישור ורוצים לכלול את הקישור החדש (כקול הצבעה) לתוך האלגוריתם כמה שיותר מהר מהר. ביוני 2010, גוגל שיחררה את Caffeine, עדכון לתשתית שלה שהגדיל משמעותית את יכולה ומהירות הסריקה שלה (ועדיין, כמובן, המצאות גבוה בסדר העדיפות של הסריקה הוא תמיד דבר טוב).

דירוג

קישורים מהווים תפקיד חשוב בדירוג. לדוגמא, התייחסו לשני אתרים בהם כמות התוכן שבדף רלוונטי שווה בנושא כלשהו. למשל אתרי הקניות אמאזון והאתר הפחות פופולרי YossisShoppingSite.com (לא אתר אמיתי).

מנוע החיפוש צריך דרך להחליט מי מקבל את המקום הגבוה יותר: אמאזון או אתר הקניות של יוסי. כאן קישורים מתחילים לשחק תפקיד. קישורים יכולים להשיג את הקולות המכריעים. אם יותר אתרים, במיוחד אתרים חשובים, מקשרים לאמאזון, זה כנראה אתר חשוב יותר, ולכן ידורג גבוה יותר מאתר הקניות של יוסי.

בחינה עמוקה יותר בדרך במנועי החיפוש שופטים קישורים

אספקטים רבים מעורבים בדירוג קישור מסוים. כפי שהראנו לפני רגע, הגורמים המובילים הם סמכות, רלוונטיות, אמון וטקסט עוגן. יחד עם זאת, ישנם גורמים אחרים שמשחקים תפקיד, ועליהם נדבר בחלק הבא.

קריטריונים נוספים לבחינת/שיפוט קישורים

בחלק הבא, נדון בחלק מהגורמים היותר חשובים שמנועי חיפוש לוקחים בחשבון כאשר הם בוחנים את ערך הקישור.

עצמאות המקור

קישור מהאתר שלך חזרה לאתר שלך הוא כמובן, לא "קול הצבעה" עצמאי לאתר שלך. במילים אחרות, מנועי החיפוש יוצאים מנקודת ההנחה שאתה תמיד תערוב לאתר של עצמך.

תחשוב על האתר שלך ככזה שצבר ערך סמכותיות קישור בהתבסס על כל הקישורים שהוא קיבל מאתרים צד-שלישי, ואת מבנה הקישוריות הפנימי שלך כדרך שבה אתה מחלק את הסמכותיות הזו לדפים באתר שלך. מבנה הקישוריות הפנימי שלך חשוב בצורה בלתי רגילה, אבל השפעתו זניחה על ערך סמכותיות הקישור הכולל של האתר שלך.

בניגוד לכך, קישורים ממקורות עצמאיים לחלוטין הם משמעותיים הרבה יותר. כדי להרחיב על כך, בוא נניח שיש לך מספר אתרים. אולי יש להם נתונים משותפים ברשומות Whois (כמו למשל השם והאימייל של מי שקנה את הדומיין). מנועי חיפוש ישתמשו בסימן כזה כדי להתייחס לקישוריות המשותפת/הדדית בין האתרים הללו יותר כקישוריות פנימית מאשר כקישורים נכנסים שהתקבלו בזכות.

גם אם יש לך רשומות Whois שונות לחלוטין לאתרים שלך אבל יש ביניהם קישוריות הדדית, מנועי החיפוש יכולים לזהות את התבנית הזו בקלות. קח בחשבון שלאתר בלי קישורי צד-שלישי עצמאיים אליו אין שום כוח קישור שיכול להוות קול הצבעה רלוונטי לאתרים אחרים.

אם מנוע חיפוש מזהה אשכול של אתרים שיש ביניהם קישוריות הדדית גבוהה ולרוב האתרים אין כמעט קישורים שמגיעים אליהם, מנוע החיפוש יתעלם מהקישורים מאותם האתרים באשכול.

ברמת הרעיון, ניתן לחשוב על אשכול כזה של אתרים כאתר יחיד. קישוריות הדדית אליהם יכול להפוך באלגוריתם לקישורים פנימיים, וקישורים ביניהם לא יוסיפו לציון סמכותיות הקישור הכולל לאף אחד מאותם האתרים. האשכול ייבחן בהתבסס על קישורים נכנסים לאשכול כיחיד, כגוף אחד.

כמובן, ישנם מספר דרכים שונות ליישם אשכול שכזה, אבל חייבים לקחת בחשבון שאין ערך קידומי לבניית מספר רב של אתרים רק כדי ליצור קישוריות הדדית ביניהם.

קישורים רבים מאותו אתר

השגת קישור סמכותי לאתר שלך מאתר צד-שלישי זה בדרך כלל דבר טוב. אבל אם ככל שיש לך יותר קישורים זה יותר טוב, למה לא להשיג קישורים מכל דף מהאתרים הללו אם אתה יכול? בתיאוריה, זה רעיון טוב, אבל מנועי חיפוש לא בהכרח סופרים מספר קישורים מצטבר מדומיין.

כאשר מנוע החיפוש של גוגל הוקם, האלגוריתם מבוסס-הקישור שלו היה מהפכני. כשספאמרים למדו איך עובד אלגוריתם ה-PageRank, הם הבינו שלכל דף באינטרנט באופן טבעי יש כמות קטנה של PageRank טבועה בתוכו. לא לקח הרבה למפיצי ספאם להבין שהם יכולים ליצור אתר אינטרנט עם יותר ממיליון דפים, גם אם היה להם תוכן חלש, ולאחר מכן להשתמש בכל דף של אותו אתר, ולקשר אותו לדף החשוב ביותר באתר (ידוע כ- sitewide link) או אפילו לדף באתר אחר. לחלופין, הם פשוט קנו קישורים רוחביים בחלק התחתון (footer) של אתרים גדולים מאוד.

בימים הראשונים של גוגל, זה עבד בצורה טובה מאוד. אך כאשר גוגל הבינה מה קורה, היא הבינה שמספר קישורים באתר אחד כנראה מסמלים קול הצבעה בודד (בעוד שמספר אתרים עם קישור אחד בכל אתר ככל הנראה מסמלים מספר החלטות עריכה). כתוצאה מכך, גוגל הציבה "משתנה מפחית" (dampener) על הערך המצטבר של יותר מקישור אחד מאתר. כל קישור נוסף מאותו אתר מעביר ערך נמוך יותר ויותר בכל עמוד נוסף שהוא מופיע בו.

בנוסף לכך, לאורך זמן, גוגל הפכה אקטיבית יותר בענישת אתרים שמשתמשים בטכניקות בניית-קישורים פסולות, כמו קניית קישורים, טקטיקה שניתן לזהות על פי השימוש בקישורים רוחביים. המשמעות היא שקישור רוחבי עלול אפילו לפגוע באתר שלך.

בוני-קישורים וספאמרים הצליחו להערים על כך ולהתאים את האסטרטגיה שלהם. הם החלו להתמקד בהשגת קישורים על כמות מקסימלית של דומיינים. זה השפיע בעיקר על אסטרטגיה שידועה בשם "פוסט אורח". האסטרטגיה הזו היא למעשה הרעיון של כתיבת תוכן עבור אתר אחר, ופרסומו שם.

למרות שיצירת "פוסט אורח" היא אסטרטגיית שיווק תוכן לגיטימית כאשר משתמשים בה נכון, הספאמרים ניצלו אותה. ניסוי מחשבתי קצר מדגים את הבעיה. דמיינו ששטח השוק שלכם כולל 100 אתרים. 3 מהם באיכות מעולה, עוד 5 באיכות טובה, 12 סבירים וכך הלאה.

ברור שגם אם הפוסטים הראשונים שלך מתפרסמים באתרים הטובים ביותר בשוק, אם תכתוב 66 פוסטים הם כבר ילכו לאתרים גרועים. אין היגיון שגוגל תתייחס לתוכן הזה כחשוב יותר ממערכות היחסים השוטפות בין אתרי הסמכות המרכזיים בשוק שלך.

במקרה של פוסטים אורחים, כמו גם אסטרטגיות שיווק תוכן אחרות, עדיף לך באופן חד משמעי להשיג מספר קטן יותר של אפשרויות לפרסום פוסט באתרי-סמכות איכותיים יותר ובכך, להשיג קישורים חוזרים מאותם האתרים. יתרה מזאת, כדאי לא לחשוב על המטרה כ"פרסום כמה שיותר פוסטים אורחים". עדיף הרבה יותר להפוך ל"תורם/תומך קבוע" בבלוגים מכובדים.

מגוון מקורות

קבלת קישורים ממגוון רחב של מקורות הוא גם גורם חשוב בבחינת קישורים. כבר נגענו בשני חלקים של הנושא: קבלת קישורים מדומיינים שלא בבעלותך (לעומת קבלת קישורים מהרבה דומיינים שונים), וקבלת קישורים מדומיינים רבים (לעומת קבלת מספר קישורים מאותו דומיין). יחד עם זאת, יש המון אספקטים אחרים שיש לקחת בחשבון.

לדוגמא, אם כל הקישורים שלך באים מבלוגים שעוסקים בנושא האתר שלך, יש לך מגוון מקורות נמוך. ניתן לחשוב בקלות על סוגים אחרים של מקורות קישור: אתרי מדיה לאומיים, אתרי מדיה מקומיים, אתרים שהם אמנם רלוונטיים אך גם מכסים יותר מאשר רק את תחום האתר שלך, אתרי אוניברסיטאות עם תוכניות לימוד מתאימות, וכיוצא בזה.

מנועי החיפוש מעריכים את סוג הגיוון הזה. אם כל הקישורים שלך מגיעים מקבוצה דומה של אתרים (לדוגמא, כאמור, בלוגים), ישנו סיכוי גבוה יותר שזה קורה כתוצאה ממניפולציה, ומנועי החיפוש לא אוהבים זאת. אם יש לך קישורים שמגיעים מסוגים שונים של מקורות, מנועי החיפוש מבינים שהתוכן שלך רציני וחשוב.

סיבה נוספת היא שמנועי החיפוש מכוונים ומשפרים באופן קבוע את האלגוריתמים שלהם. אם כל הקישורים שלך מגיעים מבלוגים ומנועי החיפוש מבצעים שינוי שמפחית בערך של קישורים שמגיעים מבלוגים, זה עלול לפגוע בדירוג שלך. ברמת העיקרון, אתה פשוט תהיה כבול לאסטרטגיה אחת, וזה אף פעם לא רעיון טוב.

מה שכן רעיון טוב הוא לבחון את מגוון המקורות שלך בהשוואה למתחרים שלך שמדורגים גבוה בתוצאות החיפוש. כנראה שהם עושים משהו נכון.

גורמים זמניים

מנועי חיפוש שומרים נתונים מפורטים על הזמן בו הם מגלים קישור חדש, או על זמן ההיעלמות של קישור. הם יכולים לבצע ניתוח מעניין עם סוג כזה של נתונים. הנה מספר דוגמאות:

מתי הקישור הזה הופיע לראשונה?

זה מעניין במיוחד כאשר בוחנים זאת ביחס להופעה של קישורים אחרים. האם זה קרה מיד לאחר שכתבו עליך בעיתון מוכר?

מתי הקישור הזה נעלם?

העלמות קישורים יכולה להיות עניין שגרתי, כמו כאשר קישורים שהופיעו בדף הראשי של בלוג נשלחים בשלב מסוים לדפי הארכיון. יחד עם זאת, אם קישור לאתר שלך נעלם מיד לאחר שעשית שינויים נרחבים לאתר שלך, זה יכול להיראות ע"י מנועי החיפוש כסימן שלילי; הם עלולים לצאת מנקודת ההנחה שהקישור הוסר מכיוון שהשינויים שעשית הפחיתו את הרלוונטיות או את האיכות של האתר.

כמה זמן החזיק הקישור?

למנוע חיפוש יש את האפשרות להתייחס לקישור כמשמעותי יותר, או פחות, בהתחשב בכמות הזמן שהוא החזיק. בקשר לשאלה האם ואיך זה יוגדר כמשמעותי יותר או פחות, זה תלוי בסמכותיות ובמידת האמון של האתר שמספק את הקישור, כמו גם בגורמים אחרים.

כמה מהר נוספו הקישורים? (ידוע גם כמהירות קישור)

שינויים דרסטיים בקצב הוספת הקישורים גם יכולים להיות סימן משמעותי, לטוב ולרע. לדוגמא, אם האתר שלך מוצג בסיקור חדשות נרחב, זה עשוי להיות טוב. אם אתה מתחיל לקנות אלפי קישורים, זה עלול להיות רע. חלק מהאתגר של מנועי החיפוש הוא לקבוע כיצד לפרש את הסימן.

הקשר/רלוונטיות

למרות שטקסט עוגן הוא סימן מרכזי בנוגע לרלוונטיות של דף אינטרנט (ולכן הוא נבדק באופן מעמיק יותר החל ממרץ 2014), מנועי חיפוש בוחנים הקשרים הרבה יותר עמוקים מכך. הם יכולים לבדוק סימנים אחרים של רלוונטיות, כמו:

קישורים חיצוניים לדף המקשר

האם לדף שכולל את הקישור שלך יש גם קישורים חיצוניים? אם הדף שמקשר לאתר שלך זוכה לקבל קישורים מאתרי צד-שלישי, זה יהפוך את האתר שלך למשמעותי יותר.

קישורים קרובים

האם הקישורים בדף מקשרים לאתרים שאכן מאוד קשורים לתחום ומאוד איכותיים? זה יהווה סימן חיובי למנועי החיפוש, שכן האתר שלך יוגדר כאיכותי יותר רק מעצם הקירבה. לחלופין, אם שני הקישורים לפני שלך מקשרים לויאגרה, קזינו, והקישור שאחריך הוא לאתר פורנוגרפי, זה סימן רע.

מיקום בדף

האם הקישור שלך הוא בגוף התוכן? או בפינה הימנית התחתונה של האתר, ליד בלוק שלם של קישורים? מיקום קישור טוב יותר יכול להיות גורם דירוג.

טקסט קרוב

האם הטקסט שלפני ואחרי הקישור נראה קשור לטקסט העוגן של הקישור ולתוכן האתר שלך אליו הקישור מקשר? אם כן, זה עשוי להיות סימן חיובי נוסף.

כותרת/כותרת משנה קרובה

מנועי חיפוש בוחנים לעומק את ההקשר של הסעיף בדף בו מופיע הקישור שלך. זו יכולה להיות כותרת המשנה הקרובה ביותר, או הטקסט המודגש הקרוב ביותר, במיוחד אם הטקסט המודגש משמש ככותרת (2-4 מילים מודגשות שנמצאות לבד בשורה או בפסקה).

הקשר דף כללי

הרלוונטיות וההקשר של הדף המקשר הם גם גורמים בדירוג. אם טקסט העוגן שלך, הטקסט מסביב והכותרת הקרובה ביותר כולם קשורים אחד לשני, זה טוב. אם ההקשר הכללי של הדף המקשר הוא גם רלוונטי, זה בונוס נוסף.

הקשר אתר כללי

סימן נוסף הוא ההקשר של האתר המקשר כולו (או לפחות של החלק באתר שמקשר אליך). לדוגמא, אם לאתר יש מאות דפים שרלוונטיים לנושא שלך והוא מקשר אליך מדף רלוונטי, עם כותרות, טקסט מקיף וטקסט עוגן רלוונטיים, זה מחזק את ההשפעה החיובית. כך, לקישור תהיה השפעה גדולה יותר מאשר אם לאתר יש רק דף אחד רלוונטי לתוכן שלך.

מקור סיומת אינטרנט (Source TLDs)

ישנו מיתוס רווח שקישורים מאתרי סיומת אינטרנט מסוימים, כמו .gov.il או .ac.il באופן אוטומטי שווים יותר מקישורים מאתרי סיומת אינטרנט אחרים, כמו .com, .co.il, , אך המיתוס הזה פשוט שגוי. אין שום הגיון בכך שמנועי חיפוש יבחנו את העניין הזה בצורה בסיסית כל כך.

מאט קאטס, לשעבר ראש מחלקת ספאם אינטרנט של גוגל, הגיב על הנושא בראיון עם סטפן ספנסר (9).

"אין שום דבר באלגוריתם עצמו שאומר: 'אה, אוקיי, זה קישור מאתר ממשלתי – תן לקישור הזה משקל גדול יותר".

קאטס הוסיף:

"יכול להיות לך קישור ממשלתי מיותר בדיוק כמו שיכול להיות לך קישור .com מעולה".

ישנם המון פורומים, בלוגים, דפי סטודנטים ודפים אחרים בדומיינים ממשלתיים או אקדמיים שספאמרים יכולים לתמרן על מנת לזכות בקישורים לאתר שלהם. משום כך, מנועי חיפוש לא יכולים פשוט להקנות לאתר רמת אמון מסוימת מכיוון שהוא בכתובת ממשלתית.

יחד עם זאת, ישנה אמת מסוימת בטענה שכתובות אקדמיות למשל הן בדרך כלל כאלו שאפשר לסמוך עליהם. זה נובע כתוצאה מניתוח הקישור שמגדירה אוניברסיטה מסוימת כאתר שאפשר בהחלט לסמוך עליו במספר נושאים. התוצאה היא שיכולים להיות (ואכן יש) דומיינים שניתן לסמוך עליהם בנושא אחד או יותר בחלקים מסוימים של האתר, אך יש להם חלקים אחרים בהם אין כמעט ערך או חלקים שספאמרים השתלטו עליהם.

מנועי חיפוש מתמודדים עם הבעיה הזו ע"י גיוון ושינוי ההערכה שלהם לאמינות הדומיין לאורך חלקים שונים שלו. יכול להיות שחלק הפרסום באתר http://yourdomain.co.il/furniture הוא אמין בנושא ריהוט, אך http://yourdomain.co.il/couches עלול להיות לא אמין בנושא ספות.

בסופו של דבר, כל אתר נבחן לפי הקישורים שיש לו לפי נושא. יתרה מזאת, כל חלק וכל דף באתר גם נבחן על פי קריטריונים אלו. פרופיל קישורים באיכות גבוהה נותן לדף יותר אמינות בנושא מסוים, מה שמגדיל את הסיכוי של אותו דף להיות מדורג גבוהה יותר בביטוי חיפוש לאותו נושא. זה נותן לאתר יותר קישורים טובים שאתרים שקשורים לנושא יוכלו לקשר לאותו אתר.

קישורים וניתוח ערך העמוד הם נושאים קשורים ואף חופפים במצבים מסוימים, מה שיוצר מאות גורמים שנמדדים באופן אינדיבידואלי ומסוננים באלגוריתמים של מנועי החיפוש (האלגוריתמים משמשים למעשה כסט הנחיות שאומר למנועי החיפוש כמה חשיבות לתת לכל גורם). לאחר מכן האלגוריתמים בוחנים את הציון לעמוד ובמצב אידיאלי מונים את התוצאות בסדר יורד של רלוונטיות וחשיבות.

איך מנועי חיפוש קובעים את ערך הקישור

קמפיין שיווק תוכן חכם בדרך כלל מתחיל במחקר לגבי אילו אתרים יספקו יתרונות חשיפה ומוניטין מקסימליים למפרסם. יחד עם זאת, דבר שימושי נוסף יהיה להבין איך מנועי חיפוש בוחנים ונותנים הערכה לקישור. למרות שישנם מדדים שונים לבחינת קישור, כפי שדובר קודם לכן, למשווק תוכן כלשהו קשה לקבוע ולהעריך חלק מהנתונים הללו (לדוגמא: קשה לו לקבוע מתי קישור צורף לראשונה לאתר).

להלן הגישה בה יש להשתמש כיום, ללא שימוש מאסיבי בכלים מיוחדים. הגורמים שאתה יכול לכלול הם:

· רלוונטיות הדף המקשר ורלוונטיות הדומיין לאתר שלך.

· ה- PageRank של דף הבית של האתר שמספק את הקישור. יש לציין שגוגל לא מפרסמת את ה-PageRank של אתר שלם, אלא רק את ה-PageRank של דפים אינדיבידואליים. מקדמי אתרים נוטים להיעזר בדף הבית של אתר כפרוקסי לדירוג ה-PageRank הכולל של האתר, מכיוון שדף הבית של האתר הוא זה שמקבל את רוב הקישורים. ניתן להשתמש ב- Domain Authority מהכלי Moz's Open Site Explorer על מנת לקבל הערכה מגורם צד-שלישי של PageRank של דומיין.

· רמת הסמכותיות והאמון של האתר. למרות שישנו קשר בין אמון ו-PageRank, זה לא קשר 1:1. סמכותיות מתייחסת לאיך אתרים בשטח בתחום מסוים מקושרים אחד לשני ע"י אתרים משמעותיים אחרים באותו תחום, בעוד ש-PageRank מודד ערך קישור גולמי מבלי לקחת בחשבון את התחום.

· כך שלאתרי-סמכות מובילים בדרך כלל גם יהיה דירוג PageRank גבוה יותר, אך קיימים יוצאי דופן.

· ה-PageRank של האתר המקשר.

· סמכותיות/אמון של הדף המקשר.

· מיקום הקישור בדף המקשר.

· מספר הקישורים היוצאים בדף המקשר. זה חשוב מכיוון שהדף המקשר יכול להעביר ("להצביע") את ה-PageRank שלו לדפים שאליהם הוא מקשר, אך כל דף מקבל חלק מאותו PageRank, מה שמשאיר פחות לדפים האחרים. דרך פשוטה לבטא זאת בצורה מתמטית היא כך: — לדף עם n PageRank שהוא יכול להעביר ו- r קישורים יוצאים:

— ה-PageRank המועבר = n/r

כנראה שהאלגוריתם המקורי שמנועי החיפוש משתמשים בו הוא שונה. לדוגמא, כמות ה-PageRank עשויה להשתנות בהתאם למיקום הקישור בדף.

שי בנקהלטר
מייסד ומנכ"ל אימוג'ו. עוסק בנושאי ייעוץ ו- SEO ובעיקר במחקר טכנולוגיות ואסטרטגיות קידום שונות. חי את השיווק באינטרנט ומתעניין מאוד בחקר טכנולוגיות הקיימות בעולם.