כשנתוני הדיור לא שלמים, גם AI לא באמת יודע מה קורה בשוק

הוויכוחים האחרונים סביב מדדי מחירים, מלאי דירות וכללי מס חושפים בעיה רחבה יותר: מערכות חכמות נשענות על נתונים ציבוריים שלא תמיד מספרים את כל הסיפור.

הבעיה הגדולה של AI בשוק הדיור הישראלי לא מתחילה בהכרח באלגוריתם. היא מתחילה הרבה לפני כן: בקובץ האקסל, בטבלת הלמ"ס, בהנחיה שלא הוגדרה עד הסוף, ובנתון רשמי שנראה מדויק אך מחמיץ חלק מן המציאות. ארבעה דיווחים מהימים האחרונים, על מסים, מלאי דירות, מדדי מחירים וקרן חניה, מצטרפים יחד לתמונה אחת: עוד לפני ששואלים מה בינה מלאכותית יכולה לחזות, צריך להבין על מה בדיוק היא מסתכלת.

הנקודה הזו חשובה במיוחד עכשיו. יותר ויותר גופים בענף הנדל"ן, במגזר הפיננסי וגם בתקשורת הכלכלית נשענים על מודלים לצורך ניתוח מגמות, הערכת סיכונים, תמחור, זיהוי הזדמנויות ואוטומציה של החלטות. אבל המערכות האלה אינן "מבינות את השוק" במובן האנושי. הן לומדות דפוסים מתוך נתונים. כשהנתונים עצמם חלקיים, לא עקביים או מושפעים מכללים שאינם שקופים, גם התובנות שמופקות מהם נעשות מוגבלות.

מדד אחד, כמה מציאויות

הדוגמה הבולטת ביותר היא מדד מחירי הדירות. על פניו, זו אחת מנקודות הייחוס המרכזיות בכל דיון על השוק. בפועל, הביקורת שעלתה כלפי אופן הצגת הנתונים חושפת פער לא קטן בין המדד לבין מה שקורה בעסקאות עצמן. אם רוב העסקאות נעשות ביד שנייה, אבל המידע הזמין לציבור עליהן חלקי או לא מפורט דיו, מתקבלת תמונה חסרה. ואם במחירי דירות חדשות לא מובאים בחשבון מבצעי מימון שמגלמים בפועל הנחה כלכלית, גם כאן התוצאה עלולה להיות מעוותת.

מבחינת AI, זו לא הערת אגב. מודל שמנסה לענות על שאלה כמו "האם המחירים עולים?" עלול להישען על מדד רשמי ובדרך לפספס את מבנה העסקה בפועל. הוא יראה מחיר נקוב, אבל לא תמיד יזהה את ההטבה הפיננסית, את דחיית התשלומים או את העובדה שחלק מהמחירים משקפים תוכניות מסובסדות שנקבעו בתנאים של שנים קודמות. במילים אחרות, אם שכבת הנתונים מתארת רק חלק מן העסקה ולא את העסקה עצמה, גם הניתוח האוטומטי נשאר חלקי.

קראו:  לא רק מגדלים ואייקונים: מה ארבע ערים גדולות מלמדות על חשיבה השקעתית

מלאי הדירות ירד, אבל מה זה בעצם אומר

כך גם לגבי הנתון על ירידה של חודש שלישי ברציפות במלאי הדירות הלא מכורות. במבט ראשון זה נראה חד וברור. בפועל, המשמעות מורכבת יותר. ירידה במלאי היא בהחלט אינדיקציה מעניינת, במיוחד אחרי תקופה של לחץ על קבלנים. אבל כשבמקביל נרשמת צניחה חדה בהיקף העסקאות החודשיות, קריאה פשוטה מדי של הנתון עלולה להטעות.

מערכת AI שמחפשת כותרת בתוך הנתונים עלולה לזהות "ירידה במלאי" ולתרגם זאת אוטומטית ל"התאוששות בשוק" או "התחזקות הביקוש". זה לא בהכרח שגוי, אבל גם לא בהכרח נכון. מלאי יכול לרדת מסיבות שונות, וחלקן זמניות או טכניות. בלי פירוק עמוק יותר לפי אזורים, סוגי דירות, קצב התחלות בנייה, תנאי מימון וקצב העסקאות בפועל, האלגוריתם עלול לייצר פרשנות מסודרת מדי למציאות שהיא הרבה פחות מסודרת.

וזו אולי אחת הבעיות השכיחות בעבודה עם מודלים גנרטיביים וכלי אנליטיקה. הם מצטיינים בזיהוי תבניות, אבל פחות טובים בזיהוי מה שחסר בטבלה. כשאדם מנוסה קורא נתונים, הוא עשוי לשאול מיד אילו הנחות חבויות כאן, מה לא נמדד, ומה השתנה במתודולוגיה. מערכת אוטומטית, אם לא תוכננה לכך במפורש, בדרך כלל לא עוצרת בנקודה הזאת.

אי בהירות רגולטורית היא גם בעיית דאטה

הפסיקה בעניין מיסוי הקרקעות שנרכשו במכרזי רמ"י מוסיפה שכבה נוספת לדיון. ועדת הערר אמנם דחתה את עמדת הקבלנים וקבעה שיש לראות בהוצאות הפיתוח חלק מן התשלום הכולל עבור הקרקע, אך גם מתחה ביקורת על רשות המסים שלא הבהירה מראש את כללי המשחק. מזווית טכנולוגית, זהו סיפור על רגולציה, אבל לא פחות מזה על איכות נתונים.

למה זה חשוב? משום שמערכות AI שמנסות להעריך עלויות פרויקט, לחשב רווחיות או להשוות בין מכרזים תלויות בהגדרות משפטיות ומיסויות עקביות. אם כלל מהותי אינו מנוסח מראש באופן שקוף, הנתון הבסיסי של "עלות הקרקע" כבר מפסיק להיות נתון אחיד. בחלק מן המקרים הוא יכלול פרשנות מסוימת, ובאחרים לא. כך נוצר מאגר נתונים שבו פריטים שנראים דומים אינם בהכרח בני השוואה.

קראו:  כשהסיכון עולה, המשבר כבר לא נשאר בבורסה

זה לא אומר שאי אפשר להשתמש ב-AI בתחום. להפך. אבל זה כן אומר שמי שבונה מודלים לנדל"ן צריך להכניס שכבת זהירות: לבדוק מה נכלל במחיר, אילו רכיבים נדחו לעתיד, ואיפה קיימת תלות בהחלטה רגולטורית שעשויה להשתנות. מודל שלא עושה את זה עלול להיראות מדויק מאוד, עד לרגע שבו מתברר שהוא חישב דברים שונים תחת אותו שם.

כשנתוני הדיור לא שלמים, גם AI לא באמת יודע מה קורה בשוק

גם החלטות עירוניות מבלבלות מכונות

המקרה התל אביבי של קרן החניה מחדד בעיה מסוג אחר. כאן כבר לא מדובר במדד מאקרו, אלא במדיניות מקומית. העירייה אוסרת במקרים מסוימים הקמת חניון מטעמי תכנון ותחבורה, אך באותו הקשר ניסתה לחייב תשלום לקרן חניה. ועדת הערר קבעה שלא ניתן לעשות זאת בנסיבות המתוארות.

מבחינת אדם, זהו מקרה שממחיש מתח בין מדיניות תחבורתית לבין מנגנון תשלום ישן יותר. מבחינת מכונה, זו מלכודת של ממש. מערכת AI שמדרגת כדאיות של פרויקטים לפי היטלים, עלויות נלוות או דרישות עירוניות צריכה לדעת לא רק מה כתוב בנוהל, אלא גם איך הוא מיושם, מתי הוא נסוג מפני מדיניות אחרת ואילו חריגים נקבעו בערר. בלי ההבחנות האלה, היא עלולה לייצר תחזית שנראית קוהרנטית, אבל נשענת על הנחה שכבר נסדקה מבחינה משפטית.

וכאן מתחדדת נקודה רחבה יותר. שוק הנדל"ן הישראלי אינו רק שוק של מספרים. זהו שוק של חריגים, פרשנויות, תוכניות עבר, מבצעי מימון, החלטות ועדה ומדיניות עירונית משתנה. AI עובד היטב יותר כשהעולם שלפניו עקבי יחסית. הנדל"ן המקומי, לעומת זאת, רחוק מלהיות עקבי תמיד.

מה זה אומר על כלי AI שמבטיחים "לקרוא את השוק"

בשנה האחרונה התרבו כלים שמציעים ניתוח אוטומטי של שוק הדיור: סיכום מגמות, הערכת מחיר, חיזוי שכונות חמות, זיהוי פערי תמחור ואפילו איתור סיכונים רגולטוריים. חלקם עשויים להיות שימושיים מאוד, כל עוד מבינים היטב את גבולות הגזרה שלהם.

קראו:  ביג דאטה ככלי אסטרטגי בניהול השקעות

אם הנתונים הציבוריים חלקיים, הכלי לא ישלים לבדו את החסר. הוא עשוי לנחש, לאלתר או לבחור בפרשנות שנראית לו סבירה ביותר על סמך העבר. לפעמים זה יספיק. ולפעמים זה יחמיץ בדיוק את הנקודה הקריטית: ההנחה שמסתתרת בתוך מבצע המימון, הסיווג המיסויי הלא ברור, החריג התכנוני ברחוב מסוים או העובדה שמדד רחב אינו משקף את מה שקורה בפלח הרלוונטי.

לכן השאלה הנכונה איננה אם AI טוב או רע בנדל"ן. שאלה מועילה יותר היא אם סביבת המידע שבה הוא פועל בשלה מספיק לניתוח אמין. נכון לעכשיו, לפי הדוגמאות שעלו, התשובה מורכבת. יש שפע של נתונים, אבל לא תמיד שקיפות מלאה. יש מדדים, אבל לא תמיד פירוט שמסביר מה נשאר מחוץ לתמונה. יש כללים, אבל לא בכל מקרה הם מנוסחים מראש באופן שמאפשר אוטומציה נקייה.

האתגר האמיתי הוא לא עוד מודל, אלא תשתית מידע טובה יותר

מי שמחפש את פריצת הדרך הבאה ב-AI לנדל"ן נוטה לחשוב קודם כול על מודלים מתקדמים יותר. בפועל, ייתכן שהשדרוג המשמעותי נמצא דווקא במקום אפור ופחות זוהר: סטנדרטיזציה של נתונים, שקיפות מתודולוגית, סימון ברור של הטבות מימון, פירוט רחב יותר על עסקאות יד שנייה והנגשה עקבית של החלטות רגולטוריות ותכנוניות.

בלי התשתית הזאת, גם המערכות המתקדמות ביותר ימשיכו להיתקל באותה מגבלה. הן יוכלו לנסח היטב, לזהות מגמות במהירות ולהצליב מסדי נתונים מרשימים, אבל עדיין יהיו תלויות בחומר הגלם. וכשחומר הגלם עצמו אינו סגור עד הסוף, גם את המסקנות צריך לקרוא בזהירות.

הלקח מארבעת הסיפורים האלה אינו טכנולוגי בלבד. במידה רבה, הוא כמעט ניהולי: לפני שמבקשים מ-AI להסביר את שוק הדיור, כדאי לוודא שהשוק מסביר את עצמו.

השאירו תגובה

תגובות
    קטגוריות
    טעינת הפוסט הבא...
    עקוב
    פופולרי
    טעינה

    חתימת ב - 3 שניות...

    חותם-את 3 שניות...