നിരന്തരമായി പഠിക്കാനും സ്വയം മെച്ചപ്പെടുത്താനും കഴിവുള്ള ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് (AI) നിർമ്മിക്കുന്നതിനുള്ള സുപ്രധാന ചുവടുവയ്പ്പായി, സ്വയം പരിഷ്കരിക്കുന്ന ഘടനയുള്ള ഒരു പുതിയ മെഷീൻ ലേണിംഗ് മോഡൽ വികസിപ്പിച്ചതായി ഗൂഗിൾ ഗവേഷകർ അറിയിച്ചു. ‘HOPE’ (ഹോപ്പ്) എന്ന് പേരിട്ടിരിക്കുന്ന ഈ പുതിയ മോഡൽ, നിലവിലുള്ള മികച്ച AI മോഡലുകളേക്കാൾ ദീർഘകാല സന്ദർഭങ്ങളെ കൈകാര്യം ചെയ്യാനും ഓർമ്മയിൽ സൂക്ഷിക്കാനും കഴിവുള്ളതാണെന്ന് ഗൂഗിൾ വ്യക്തമാക്കി.
ഗൂഗിൾ ഗവേഷകർ വികസിപ്പിച്ചെടുത്ത ‘നെസ്റ്റഡ് ലേണിംഗ്’ (Nested Learning) എന്ന നൂതനമായ സമീപനത്തിൻ്റെ ഒരു പ്രൂഫ്-ഓഫ്-കോൺസെപ്റ്റ് എന്ന നിലയിലാണ് HOPE മോഡൽ പ്രവർത്തിക്കുന്നത്. ഒരു ഒറ്റ മോഡലിനെ, “ഒരേ സമയം ഒപ്റ്റിമൈസ് ചെയ്യുന്ന, പരസ്പരം ബന്ധിപ്പിച്ച, ബഹുതല പഠന പ്രശ്നങ്ങളുടെ ഒരു സംവിധാനമായി” കാണുന്ന രീതിയാണിത്. ഇത് AI പരിശീലനത്തെ ഒരു ഒറ്റ തുടർച്ചയായ പ്രക്രിയയായി കാണുന്ന പരമ്പരാഗത രീതിയിൽ നിന്ന് തികച്ചും വ്യത്യസ്തമാണ്. തുടർച്ചയായ പഠനം (Continual Learning) പോലുള്ള പരിമിതികൾ മറികടക്കാൻ ‘നെസ്റ്റഡ് ലേണിംഗ്’ സഹായിക്കുമെന്നാണ് ഗൂഗിളിൻ്റെ പ്രതീക്ഷ. മനുഷ്യസമാനമായ ബുദ്ധിയായ ആർട്ടിഫിഷ്യൽ ജനറൽ ഇൻ്റലിജൻസിലേക്കുള്ള (AGI) നിർണായക ചുവടുവയ്പ്പാണ് തുടർച്ചയായ പഠനം.
- എന്താണ് തുടർച്ചയായ പഠനം? എന്തുകൊണ്ട് ഇത് വെല്ലുവിളിയാകുന്നു?
AI ചാറ്റ്ബോട്ടുകൾക്ക് ശക്തി നൽകുന്ന ലാർജ് ലാംഗ്വേജ് മോഡലുകൾക്ക് (LLMs) നിലവിൽ നിമിഷങ്ങൾക്കുള്ളിൽ കവിതകൾ എഴുതാനും കോഡ് നിർമ്മിക്കാനും കഴിയും. എന്നിരുന്നാലും, അനുഭവങ്ങളിൽ നിന്ന് സ്വയം പഠിക്കാനുള്ള പ്രാഥമിക ശേഷിക്ക് പോലും ഇപ്പോഴത്തെ മോഡലുകൾക്ക് കഴിയുന്നില്ല. തുടർച്ചയായി പഠിക്കുകയും മെച്ചപ്പെടുത്തുകയും ചെയ്യുന്ന മനുഷ്യ മസ്തിഷ്കത്തിൽ നിന്ന് വ്യത്യസ്തമായി, ഇന്നത്തെ LLM-കൾക്ക്, അവർക്കറിയാവുന്ന കാര്യങ്ങൾ മറക്കാതെ പുതിയ അറിവോ കഴിവുകളോ നേടാൻ കഴിയില്ല. ഈ കഴിവില്ലായ്മയെയാണ് ‘കറ്റാസ്ട്രോഫിക് ഫൊർഗെറ്റിംഗ്’ (Catastrophic Forgetting – വിനാശകരമായ മറവി) എന്ന് വിശേഷിപ്പിക്കുന്നത്.
വർഷങ്ങളായി, മോഡലിൻ്റെ ഘടനയിൽ മാറ്റങ്ങൾ വരുത്തിയും മികച്ച ഒപ്റ്റിമൈസേഷൻ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ചും ഈ പ്രശ്നം പരിഹരിക്കാൻ ഗവേഷകർ ശ്രമിക്കുന്നുണ്ട്. എന്നാൽ, മോഡലിൻ്റെ ഘടനയും അതിനെ പരിശീലിപ്പിക്കാൻ ഉപയോഗിക്കുന്ന നിയമങ്ങളും (ഒപ്റ്റിമൈസേഷൻ അൽഗോരിതം) അടിസ്ഥാനപരമായി ഒരേ ആശയങ്ങളാണെന്ന് ഗൂഗിൾ ഗവേഷകർ വാദിക്കുന്നു. ഈ അടിസ്ഥാന ഘടന തിരിച്ചറിയുന്നതിലൂടെ, നെസ്റ്റഡ് ലേണിംഗ്, കൂടുതൽ കഴിവുള്ള AI-കൾ രൂപകൽപ്പന ചെയ്യുന്നതിന് പുതിയൊരു മാനം നൽകുന്നു, ഇത് വിനാശകരമായ മറവി പോലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ സഹായിക്കുമെന്ന് ഗവേഷകർ പറയുന്നു.
- നെസ്റ്റഡ് ലേണിംഗ് എന്നാൽ എന്ത്?
സങ്കീർണ്ണമായ ഒരു മെഷീൻ ലേണിംഗ് മോഡലിനെ, “പരസ്പരം ബന്ധിപ്പിച്ചതോ സമാന്തരമായി പ്രവർത്തിക്കുന്നതോ ആയ ഒപ്റ്റിമൈസേഷൻ പ്രശ്നങ്ങളുടെ ഒരു കൂട്ടമായി” കാണുന്ന സമീപനമാണ് നെസ്റ്റഡ് ലേണിംഗ്. “ഈ ആന്തരിക പ്രശ്നങ്ങളിൽ ഓരോന്നിനും അതിൻ്റേതായ സന്ദർഭ പ്രവാഹമുണ്ട് – അത് പഠിക്കാൻ ശ്രമിക്കുന്ന വിവരങ്ങളുടെ അതിൻ്റേതായ വ്യതിരിക്തമായ ഒരു കൂട്ടം,” എന്നും ഗവേഷകർ കൂട്ടിച്ചേർത്തു.
ഈ തത്വങ്ങൾ പ്രയോജനപ്പെടുത്തുന്നതിലൂടെ, ഡെവലപ്പർമാർക്ക് LLM-കളിൽ കൂടുതൽ കമ്പ്യൂട്ടേഷണൽ ഡെപ്തുള്ള പഠന ഘടകങ്ങൾ നിർമ്മിക്കാൻ സാധിക്കും. നെസ്റ്റഡ് ലേണിംഗ് തത്വങ്ങൾ ഉപയോഗിച്ച് നിർമ്മിച്ച HOPE ആർക്കിടെക്ചർ, ഭാഷാ മോഡലിംഗ്, കോമൺ-സെൻസ് റീസണിംഗ് ടാസ്ക്കുകൾ എന്നിവയിൽ നിലവിലെ LLM-കളെ അപേക്ഷിച്ച് മികച്ച പ്രകടനം കാഴ്ചവെച്ചതായും കുറഞ്ഞ ‘പെർപ്ലക്സിറ്റി’യും (Perplexity) ഉയർന്ന കൃത്യതയും പ്രകടിപ്പിച്ചതായും ഗൂഗിൾ അറിയിച്ചു.
















