בניית מעריך ציון Digital SAT שקוף
רוב מחשבוני הציון משתמשים בשיטה פשוטה. מזינים תשובות נכונות, מחילים טבלה, ורואים ציון.
השיטה הזו נכשלת מול ה-Digital SAT.
המבחן הוא אדפטיבי. מודל הניקוד הוא פרטי. ה-College Board לא מפרסם טבלת המרה אוניברסלית.
כשבניתי מעריך ציון חינמי, עמדו בפניי שתי אפשרויות:
- להציג דיוק כוזב.
- להפוך את חוסר הוודאות לחלק מהמוצר.
בחרתי באפשרות השנייה.
הכלי שלי לא טוען שהוא מספק ציון מדויק. הוא לא טוען שהוא יודע מהו המסלול האדפטיבי הספציפי של התלמיד. הוא לא טוען שהוא תואם לדוח הציון הרשמי.
במקום זאת, הוא עונה על שאלה אחת: מהו טווח הציון הרחב שיהיה מועיל לתכנון לימודים?
המיקוד הזה משנה את אופן הפעולה של הכלי. ב-Digital SAT יש שני מודולים לכל סעיף. הביצועים במודול הראשון משנים את רמת הקושי של השני.
הממשק מבקש ארבע תשובות ספציפיות:
- מספר התשובות הנכונות במודול 1 של המתמטיקה.
- מספר התשובות הנכונות במודול 2 של המתמטיקה.
- מספר התשובות הנכונות במודול 1 של Reading and Writing.
- מספר התשובות הנכונות במודול 2 של Reading and Writing.
הקוד משתמש בסיכומים הללו כדי לבחור טווחי תכנון רחבים. תוצאה כמו 700-770 מעבירה ביטחון טוב יותר מאשר מספר מזויף כמו 742.
השתמשתי בלוגיקת סף פשוטה עבור מעריך המתמטיקה:
if (total >= 41) return "760-800"; if (total >= 36) return "700-770"; if (total >= 31) return "640-710";
הגישה הזו היא כנה. היא נמנעת מהסתרת נוסחאות ספקולטיביות מאחורי ספרות אחרי הנקודה העשרונית.
גם הצבתי מגבלות ליד התוצאה במקום להסתיר אותן ב-footer. המשתמשים צריכים לדעת:
- הטווח מבוסס על סך התשובות הנכונות.
- הוא אינו משחזר את מודל הניקוד הרשמי.
- גרסאות שונות של המבחן מניבות ציונים שונים.
- לציון הרשמי ב-Bluebook יש עדיפות.
הוספת ספרות נוספות גורמת לתשובה להיראות מדויקת. זה לא הופך את המודל למדויק. טווח הוא מוצר כנה יותר כאשר הנתונים אינם מלאים.
המטרה שלי היא לא לבצע הנדסה לאחור למערכת פרטית. המטרה היא לבנות כלי תכנון שקוף.
האם בניתם כלים המשתמשים בנתונים חסרים? איך אתם מתקשרים חוסר ודאות למשתמשים שלכם?