āϝ⧇ āϞāĻ•ā§āώāĻŖāϟāĻŋ āφāĻŽāϰāĻž āĻĒā§āϰāĻļāĻŋāĻ•ā§āώāĻŖ āĻĻāĻŋā§Ÿā§‡ āĻŽā§āϛ⧇ āĻĢ⧇āϞ⧇āĻ›āĻŋ

āĻŦ⧇āĻļāĻŋāϰāĻ­āĻžāĻ— āĻŽāĻžāύ⧁āώ āϭ⧟ āĻĒāĻžāύ āϝ⧇ AI āϜāĻžāύ⧇ āύāĻž āĻ•āĻ–āύ āϏ⧇ āϭ⧁āϞ āĻ•āϰāϛ⧇āĨ¤ āϤāĻžāϰāĻž āϚāĻŋāĻ¨ā§āϤāĻŋāϤ āĻĨāĻžāϕ⧇āύ āϝ⧇ āĻāĻ•āϟāĻŋ āĻŽāĻĄā§‡āϞ āĻ…āĻ¤ā§āϝāĻ¨ā§āϤ āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ⧇āϰ āϏāĻžāĻĨ⧇ āϕ⧋āύ⧋ āφāĻĻāĻžāϞāϤ⧇āϰ āĻŽāĻžāĻŽāϞāĻž āĻŦāĻž āĻ“āώ⧁āϧ⧇āϰ āĻŽāĻžāĻ¤ā§āϰāĻž āĻŦāĻžāύāĻŋā§Ÿā§‡ āĻĢ⧇āϞāϤ⧇ āĻĒāĻžāϰ⧇āĨ¤ āϤāĻžāϰāĻž āĻŽāύ⧇ āĻ•āϰ⧇āύ āϝ⧇ āĻŽā§‡āĻļāĻŋāύ⧇āϰ āύāĻŋāĻœā§‡āϰ āĻ…āĻœā§āĻžāϤāĻž āϏāĻŽā§āĻĒāĻ°ā§āϕ⧇ āϕ⧋āύ⧋ āϧāĻžāϰāĻŖāĻž āύ⧇āχāĨ¤

āĻŦāĻžāĻ¸ā§āϤāĻŦāϤāĻž āĻ­āĻŋāĻ¨ā§āύāĨ¤ āĻŽāĻĄā§‡āϞāϗ⧁āϞ⧋ āϏāĻžāϧāĻžāϰāĻŖāϤ āϜāĻžāύ⧇āĨ¤ āφāĻŽāϰāĻž āϤāĻžāĻĻ⧇āϰ āĻāϟāĻŋ āϞ⧁āĻ•āĻŋā§Ÿā§‡ āϰāĻžāĻ–āϤ⧇ āĻĒā§āϰāĻļāĻŋāĻ•ā§āώāĻŖ āĻĻāĻŋā§Ÿā§‡āĻ›āĻŋāĨ¤

āĻ—āĻŦ⧇āώāĻŖāĻž āĻāĻ•āϟāĻŋ āĻ¸ā§āĻĒāĻˇā§āϟ āĻĒā§āϝāĻžāϟāĻžāĻ°ā§āύ āĻĻ⧇āĻ–āĻžāϝāĻŧāĨ¤ OpenAI āϰāĻŋāĻĒā§‹āĻ°ā§āϟ āĻ•āϰ⧇āϛ⧇ āϝ⧇ āĻŦ⧇āϏ āĻŽāĻĄā§‡āϞāϗ⧁āϞ⧋ (base models) āĻŦ⧇āĻļ āĻ­āĻžāϞ⧋āĻ­āĻžāĻŦ⧇ āĻ•ā§āϝāĻžāϞāĻŋāĻŦā§āϰ⧇āĻŸā§‡āĻĄ (calibrated)āĨ¤ āϝāĻĻāĻŋ āĻāĻ•āϟāĻŋ āĻŦ⧇āϏ āĻŽāĻĄā§‡āϞ āϕ⧋āύ⧋ āωāĻ¤ā§āϤāϰ⧇āϰ āĻ•ā§āώ⧇āĻ¤ā§āϰ⧇ ā§­ā§Ļ āĻļāϤāĻžāĻ‚āĻļ āϏāĻŽā§āĻ­āĻžāĻŦāύāĻž āύāĻŋāĻ°ā§āϧāĻžāϰāĻŖ āĻ•āϰ⧇, āϤāĻŦ⧇ āĻāϟāĻŋ āĻĒā§āϰāĻžā§Ÿ ā§­ā§Ļ āĻļāϤāĻžāĻ‚āĻļ āϏāĻŽā§Ÿ āϏāĻ āĻŋāĻ• āĻšā§ŸāĨ¤ āĻāϟāĻŋ āϤāĻžāϰ āύāĻŋāĻœā§‡āϰ āϏ⧀āĻŽāĻžāĻŦāĻĻā§āϧāϤāĻž āϜāĻžāύ⧇āĨ¤

āϏāĻŽāĻ¸ā§āϝāĻžāϟāĻŋ āĻļ⧁āϰ⧁ āĻšā§Ÿ āĻ…ā§āϝāĻžāϞāĻžāχāύāĻŽā§‡āĻ¨ā§āϟ āĻŸā§āϰ⧇āύāĻŋāĻ‚ā§Ÿā§‡āϰ (alignment training) āϏāĻŽā§ŸāĨ¤ āĻāϟāĻŋ āĻāĻŽāύ āĻāĻ•āϟāĻŋ āĻĒā§āϰāĻ•ā§āϰāĻŋ⧟āĻž āϝāĻž āĻāĻ•āϟāĻŋ āĻŸā§‡āĻ•ā§āϏāϟ āĻĒā§āϰ⧇āĻĄāĻŋāĻ•ā§āϟāϰāϕ⧇ (text predictor) āĻāĻ•āϟāĻŋ āϏāĻšāĻžāϝāĻŧāĻ• āĻšā§āϝāĻžāϟāĻŦāĻŸā§‡ āϰ⧂āĻĒāĻžāĻ¨ā§āϤāϰāĻŋāϤ āĻ•āϰ⧇āĨ¤ āĻāχ āĻĒā§āϰāĻļāĻŋāĻ•ā§āώāĻŖ āĻ•ā§āϝāĻžāϞāĻŋāĻŦā§āϰ⧇āĻļāύ āύāĻˇā§āϟ āĻ•āϰ⧇ āĻĻā§‡ā§ŸāĨ¤

āϰ (raw) āĻŽāĻĄā§‡āϞāϟāĻŋ āϤāĻžāϰ āĻ—āĻŖāĻŋāϤ⧇āϰ āĻŽāĻžāĻ§ā§āϝāĻŽā§‡ āϏāϤāϤāĻžāϰ āϏāĻžāĻĨ⧇ āĻ…āύāĻŋāĻļā§āϚāϝāĻŧāϤāĻž āĻĒā§āϰāĻ•āĻžāĻļ āĻ•āϰ⧇āĨ¤ āĻ…ā§āϝāĻžāϞāĻžāχāύāĻŽā§‡āĻ¨ā§āϟ āĻŸā§āϰ⧇āύāĻŋāĻ‚ āĻŽāĻĄā§‡āϞāϟāĻŋ āϕ⧀āĻ­āĻžāĻŦ⧇ āĻ•āĻĨāĻž āĻŦāϞāĻŦ⧇ āϤāĻž āĻĒāϰāĻŋāĻŦāĻ°ā§āϤāύ āĻ•āϰ⧇ āĻĻā§‡ā§ŸāĨ¤ āĻāϟāĻŋ āĻĻ⧁āϟāĻŋ āϜāĻŋāύāĻŋāϏ⧇āϰ āĻŽāĻ§ā§āϝ⧇ āĻāĻ•āϟāĻŋ āĻŦā§āϝāĻŦāϧāĻžāύ āϤ⧈āϰāĻŋ āĻ•āϰ⧇:

  • āĻŦāĻŋāĻļā§āĻŦāĻžāϏ (Belief): āĻ…āĻ­ā§āϝāĻ¨ā§āϤāϰ⧀āĻŖ āĻ—āĻŖāĻŋāϤ āĻāĻŦāĻ‚ āϏāĻŽā§āĻ­āĻžāĻŦāύāĻžāĨ¤
  • āĻĒāĻžāϰāĻĢāϰāĻŽā§āϝāĻžāĻ¨ā§āϏ (Performance): āĻŽāĻĄā§‡āϞāϟāĻŋ āĻ•āĻĨāĻž āĻŦāϞāĻžāϰ āϏāĻŽā§Ÿ āϝ⧇āĻ­āĻžāĻŦ⧇ āĻļā§‹āύāĻžā§ŸāĨ¤

āĻŦāĻŋāĻļā§āĻŦāĻžāϏ āϏāĻ‚āĻ–ā§āϝāĻžāϰ āĻŽāĻ§ā§āϝ⧇ āĻĨāĻžāϕ⧇āĨ¤ āĻĒāĻžāϰāĻĢāϰāĻŽā§āϝāĻžāĻ¨ā§āϏ āĻšāϞ⧋ āĻ•āĻ°ā§āϤ⧃āĻ¤ā§āĻŦāĻĒā§‚āĻ°ā§āĻŖ āĻļā§‹āύāĻžāύ⧋āϰ āĻāĻ•āϟāĻŋ āĻļ⧇āĻ–āĻž āĻĒāĻĻā§āϧāϤāĻŋāĨ¤

āϕ⧇āύ āĻāĻŽāύ āĻšā§Ÿ? āφāĻŽāϰāĻž āĻāχ āĻŽāĻĄā§‡āϞāϗ⧁āϞ⧋āϕ⧇ āĻĒā§āϰāĻļāĻŋāĻ•ā§āώāĻŖ āĻĻāĻŋāϤ⧇ āĻŽāĻžāύ⧁āώ⧇āϰ āĻĢāĻŋāĻĄāĻŦā§āϝāĻžāĻ• (human feedback) āĻŦā§āϝāĻŦāĻšāĻžāϰ āĻ•āϰāĻŋāĨ¤ āĻŽāĻžāύ⧁āώ āϏāĻžāϧāĻžāϰāĻŖāϤ āϏ⧇āχ āωāĻ¤ā§āϤāϰāϗ⧁āϞ⧋āϕ⧇ āĻĒ⧁āϰāĻ¸ā§āĻ•ā§ƒāϤ āĻ•āϰāϤ⧇ āĻĒāĻ›āĻ¨ā§āĻĻ āĻ•āϰ⧇ āϝāĻž āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ⧀ āĻļā§‹āύāĻžā§ŸāĨ¤ āĻāĻ•āϟāĻŋ āϰāĻŋāĻ“āϝāĻŧāĻžāĻ°ā§āĻĄ āĻŽāĻĄā§‡āϞ (reward model) āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ⧀ āωāĻ¤ā§āϤāϰ⧇āϰ āϜāĻ¨ā§āϝ āωāĻšā§āϚāϤāϰ āĻ¸ā§āϕ⧋āϰ āĻĻāĻŋāϤ⧇ āĻļ⧇āϖ⧇āĨ¤ āĻāĻŽāύāĻ•āĻŋ āĻāĻ•āϟāĻŋ āωāĻ¤ā§āϤāϰ āϭ⧁āϞ āĻšāϞ⧇āĻ“, āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ⧀ āϏ⧁āϰ āĻŦ⧇āĻļāĻŋ āĻĒā§Ÿā§‡āĻ¨ā§āϟ āĻ…āĻ°ā§āϜāύ āĻ•āϰ⧇āĨ¤

āĻ…āĻĒā§āϟāĻŋāĻŽāĻžāχāĻœā§‡āĻļāύ (Optimization) āĻāχ āĻĒā§āϝāĻžāϟāĻžāĻ°ā§āύāϟāĻŋ āϖ⧁āρāĻœā§‡ āĻĒāĻžā§ŸāĨ¤ āĻŽāĻĄā§‡āϞāϟāĻŋ āĻļ⧇āϖ⧇ āϝ⧇ āĻĻā§āĻŦāĻŋāϧāĻž āĻĒā§āϰāĻ•āĻžāĻļ āĻ•āϰāĻž āĻŦāĻž āϏāĻ¨ā§āĻĻ⧇āĻš āĻ¸ā§āĻŦā§€āĻ•āĻžāϰ āĻ•āϰāĻž āĻŽāĻžāύ⧇ āĻĒ⧁āϰāĻ¸ā§āĻ•āĻžāϰ āĻšāĻžāϰāĻžāύ⧋āĨ¤ āĻ­āĻžāϞ⧋ āĻ¸ā§āϕ⧋āϰ āĻĒāĻžāĻ“ā§ŸāĻžāϰ āϜāĻ¨ā§āϝ āĻāϟāĻŋ āύāĻŋāĻļā§āϚāĻŋāϤāĻ­āĻžāĻŦ⧇ āĻ•āĻĨāĻž āĻŦāϞāĻžāϰ āĻ­āĻ™ā§āĻ—āĻŋ āĻŦ⧇āϛ⧇ āĻ¨ā§‡ā§ŸāĨ¤

āĻāχ āĻ…āϤāĻŋ-āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ āĻšāϞ⧋ āĻĒā§āϰāϤāĻŋāĻ•āĻžāϰāϟāĻŋāϰ āĻāĻ•āϟāĻŋ āĻĒāĻžāĻ°ā§āĻļā§āĻŦāĻĒā§āϰāϤāĻŋāĻ•ā§āϰāĻŋāϝāĻŧāĻžāĨ¤ āĻĒā§āϰāĻļāĻŋāĻ•ā§āώāĻŖ āĻŽāĻĄā§‡āϞāϟāĻŋāϕ⧇ āφāϰāĻ“ āύāĻŋāϰāĻžāĻĒāĻĻ āĻāĻŦāĻ‚ āĻ•āĻĨāĻž āĻŦāϞāĻžāϰ āϜāĻ¨ā§āϝ āϏāĻšāϜ āĻ•āϰ⧇ āϤ⧋āϞ⧇, āĻ•āĻŋāĻ¨ā§āϤ⧁ āĻāϟāĻŋ āĻŽāĻĄā§‡āϞāϟāĻŋāϕ⧇ āϤāĻžāϰ āϏāĻ¨ā§āĻĻ⧇āĻš āϞ⧁āĻ•āĻŋā§Ÿā§‡ āϰāĻžāĻ–āϤ⧇āĻ“ āĻŦāĻžāĻ§ā§āϝ āĻ•āϰ⧇āĨ¤

āĻāϟāĻŋ āϏāĻŽāĻ¸ā§āϝāĻžāϟāĻŋ āϏāĻŽāĻžāϧāĻžāύ⧇āϰ āĻĒāĻĻā§āϧāϤāĻŋ āĻŦāĻĻāϞ⧇ āĻĻā§‡ā§ŸāĨ¤ āφāĻŽāĻžāĻĻ⧇āϰ āĻŽāĻĄā§‡āϞāϗ⧁āϞ⧋āϕ⧇ āύāϤ⧁āύ āϕ⧋āύ⧋ āĻĻ⧃āĻˇā§āϟāĻŋāĻļāĻ•ā§āϤāĻŋ āĻĻ⧇āĻ“ā§ŸāĻžāϰ āĻĒā§āĻ°ā§Ÿā§‹āϜāύ āύ⧇āχāĨ¤ āϏ⧇āχ āĻĻ⧃āĻˇā§āϟāĻŋāĻļāĻ•ā§āϤāĻŋ āĻ—āĻŖāĻŋāϤ⧇āϰ āĻŽāĻ§ā§āϝ⧇āχ āĻŦāĻŋāĻĻā§āϝāĻŽāĻžāύāĨ¤ āφāĻŽāĻžāĻĻ⧇āϰ āĻļ⧁āϧ⧁ āϏ⧇āχ āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ⧀ āĻ—āĻĻā§āϝāϕ⧇ āĻĒ⧁āϰāĻ¸ā§āĻ•ā§ƒāϤ āĻ•āϰāĻž āĻŦāĻ¨ā§āϧ āĻ•āϰāϤ⧇ āĻšāĻŦ⧇ āϝāĻž āφāϏāϞ⧇ āϏ⧇āχ āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ⧇āϰ āϝ⧋āĻ—ā§āϝ āύ⧟āĨ¤

āϝāĻ–āύ āφāĻĒāύāĻŋ AI āĻĨ⧇āϕ⧇ āϕ⧋āύ⧋ āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ⧀ āωāĻ¤ā§āϤāϰ āĻĒ⧜āĻŦ⧇āύ, āĻāĻ•āϟāĻŋ āĻ•āĻĨāĻž āĻŽāύ⧇ āϰāĻžāĻ–āĻŦ⧇āύāĨ¤ āϏ⧇āχ āφāĻ¤ā§āĻŽāĻŦāĻŋāĻļā§āĻŦāĻžāϏ āĻšāϞ⧋ āĻ•āĻĨāĻž āĻŦāϞāĻžāϰ āĻāĻ•āϟāĻŋ āĻ­āĻ™ā§āĻ—āĻŋ āĻŽāĻžāĻ¤ā§āϰāĨ¤ āĻļāĻŦā§āĻĻ⧇āϰ āύāĻŋāĻšā§‡, āĻāĻ•āϟāĻŋ āϏāĻ‚āĻ–ā§āϝāĻž āϏāĻŽā§āĻ­āĻŦāϤ āĻŦāĻŋāώ⧟āϟāĻŋ āφāϰāĻ“ āĻ­āĻžāϞ⧋āĻ­āĻžāĻŦ⧇ āϜāĻžāύāϤāĨ¤ āφāĻŽāϰāĻž āĻļ⧁āϧ⧁ āĻŽāĻĄā§‡āϞāϟāĻŋāϕ⧇ āϏ⧇āχ āϏāĻ‚āĻ–ā§āϝāĻžāϟāĻŋ āύāĻŋāĻœā§‡āϰ āĻ•āĻžāϛ⧇āχ āĻšā§‡āĻĒ⧇ āϰāĻžāĻ–āϤ⧇ āĻļāĻŋāĻ–āĻŋā§Ÿā§‡āĻ›āĻŋāĨ¤

Source: https://dev.to/thesythesis/the-tell-we-trained-out-2dg8

Optional learning community: https://t.me/GyaanSetuAi