paint-brush
WLTech இன் AI முகவர் $1 மில்லியன் சவாலில் பெரிய மதிப்பெண்களைப் பெற்றார்மூலம்@wltechai
121 வாசிப்புகள்

WLTech இன் AI முகவர் $1 மில்லியன் சவாலில் பெரிய மதிப்பெண்களைப் பெற்றார்

மூலம் WLTech.AI (WebLab Technology)12m2025/01/06
Read on Terminal Reader

மிக நீளமானது; வாசிப்பதற்கு

அறிவு மற்றும் திறன்களை உண்மையிலேயே பொதுமைப்படுத்தக்கூடிய AI அமைப்புகளை உருவாக்குவதை AGI நோக்கமாகக் கொண்டுள்ளது. இது முற்றிலும் புதிய சூழ்நிலைகளுக்குப் பயன்படுத்தக்கூடிய அடிப்படைக் கொள்கைகளைக் கற்றுக்கொள்ள முடியும். தற்போதைய AIக்கு ஆயிரக்கணக்கான மணிநேர பயிற்சி தரவு தேவைப்படும்.
featured image - WLTech இன் AI முகவர் $1 மில்லியன் சவாலில் பெரிய மதிப்பெண்களைப் பெற்றார்
WLTech.AI (WebLab Technology) HackerNoon profile picture


வாகனம் ஓட்ட கற்றுக்கொள்வது பற்றி சிறிது நேரம் சிந்திப்போம். நம்மில் எவரும் வாகனம் ஓட்டுவதற்கான அடிப்படைக் கொள்கைகளை ஒருசில ஆர்ப்பாட்டங்களில் இருந்து கற்றுக் கொள்ளலாம், ஸ்டீயரிங், முடுக்கம் மற்றும் பிரேக்கிங் போன்ற கருத்துக்களைப் புரிந்துகொண்டவுடன், அந்த திறன்களை எந்த காருக்கும் - சிறிய செடான் முதல் பெரிய டிரக் வரை பயன்படுத்தலாம். இந்தத் திறன்களைக் கொண்டு, வெவ்வேறு சாலை நிலைமைகள், வானிலை மற்றும் போக்குவரத்துச் சூழ்நிலைகளை நாம் இதற்கு முன் சந்தித்திராவிட்டாலும், அவற்றை விரைவாக மாற்றியமைக்க முடியும். இருப்பினும், தற்போதைய AI க்கு ஒவ்வொரு குறிப்பிட்ட வாகனம் மற்றும் நிபந்தனைக்கு ஆயிரக்கணக்கான மணிநேர பயிற்சி தரவு தேவைப்படும், அதே நேரத்தில் AGI வாகனம் ஓட்டுவதற்கான அடிப்படைக் கொள்கைகளைப் புரிந்துகொண்டு அவற்றை பரவலாகப் பயன்படுத்த முடியும்.


AGI ஆனது அறிவு மற்றும் திறன்களை உண்மையிலேயே பொதுமைப்படுத்தக்கூடிய AI அமைப்புகளை உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளது - முற்றிலும் புதிய சூழ்நிலைகளுக்குப் பயன்படுத்தக்கூடிய அடிப்படைக் கொள்கைகளைக் கற்றல். கார் ஓட்டுதல், சீஸ் விளையாடுதல், கோ, Minecraft போன்றவை. இது LLMகள் உட்பட இன்றைய AI அமைப்புகளிலிருந்து குறிப்பிடத்தக்க அளவில் வேறுபடுகிறது, இவை முதன்மையாக பரந்த பயிற்சி தரவுத்தொகுப்புகளில் அதிநவீன முறை பொருத்தம் மூலம் செயல்படுகின்றன.


நவீன எல்.எல்.எம்.கள் அறிவார்ந்த உரையாடலில் ஈடுபடலாம் மற்றும் சிக்கலான சிக்கல்களைத் தீர்க்க முடியும் என்றாலும், பயிற்சியின் போது அவர்கள் சந்தித்த வடிவங்களை அங்கீகரித்து மீண்டும் இணைப்பதன் மூலம் அவை அடிப்படையில் செயல்படுகின்றன. உண்மையான புரிதல் மற்றும் பொதுமைப்படுத்தலைக் காட்டிலும் இது மிகவும் மேம்பட்ட மனப்பாடம் மற்றும் புள்ளிவிவர தொடர்புக்கு மிகவும் ஒத்ததாகும், ஏனெனில் அவை உண்மையான காரண மாதிரிகள் அல்லது உலகின் சுருக்கமான பிரதிநிதித்துவங்களை உருவாக்கவில்லை. அவர்கள் பொதுமைப்படுத்துவது போல் தோன்றும்போது, அவர்கள் பொதுவாக ஆழ்ந்த கொள்கைகளைப் புரிந்துகொள்வதற்குப் பதிலாக அவர்களின் பயிற்சித் தரவில் நுட்பமான புள்ளிவிவர வடிவங்களைக் கண்டுபிடிப்பார்கள்.

ARC ஏன் முக்கியமானது?

AI ஆராய்ச்சியில் ஒரு முக்கியமான அளவீட்டு சிக்கலை ARC நிவர்த்தி செய்கிறது - AI அமைப்பு பொதுமைப்படுத்த முடியுமா என்பதை எவ்வாறு சோதிப்பது?


பாரம்பரிய வரையறைகள் பொதுவாக பெரிய பயிற்சி தரவுத்தொகுப்புகளுடன் குறிப்பிட்ட பணிகளின் செயல்திறனை அளவிடுகின்றன, ஆனால் அதிக மதிப்பெண்கள் உண்மையான பொதுமைப்படுத்தல் திறனைக் குறிக்க வேண்டிய அவசியமில்லை. ஒரு உண்மையான புரிதலை வளர்த்துக் கொள்வதற்குப் பதிலாக பயிற்சித் தரவில் உள்ள வடிவங்களை மனப்பாடம் செய்வதன் மூலம் AI சிறப்பாகச் செயல்படலாம்.


F. Chollet எழுதுவது போல்: "நம்முடைய அறிவுக்கு எட்டிய வரை, தற்போதுள்ள எந்த இயந்திரக் கற்றல் நுட்பத்தாலும் (ஆழமான கற்றல் உட்பட) ARC அணுகக்கூடியதாகத் தெரியவில்லை".


முக்கிய சிரமங்கள் பின்வருமாறு:

- எதிர்பார்க்கப்படும் வெளியீடு ஒரு லேபிள் அல்லது லேபிள்களின் தொகுப்பாக இல்லை, ஆனால் 30x30 வரை அளவுகள் மற்றும் 10 வெவ்வேறு வண்ணங்களைக் கொண்ட வண்ணக் கட்டம். எனவே, இது கட்டமைக்கப்பட்ட கணிப்பு களத்தில் விழுகிறது.

- கணிக்கப்பட்ட வெளியீடு எதிர்பார்த்த வெளியீட்டுடன் சரியாகப் பொருந்த வேண்டும். ஒரு செல் தவறாக இருந்தால், பணி தோல்வியடைந்ததாகக் கருதப்படுகிறது. அதை ஈடுசெய்ய, ஒவ்வொரு உள்ளீட்டு கட்டத்திற்கும் மூன்று முயற்சிகள் அனுமதிக்கப்படுகின்றன.

- ஒவ்வொரு பணியிலும், பொதுவாக இரண்டு முதல் நான்கு பயிற்சி நிகழ்வுகள் (உள்ளீட்டு கட்டம் + வெளியீடு கட்டம்) மற்றும் ஒன்று அல்லது இரண்டு சோதனை நிகழ்வுகள் கணிக்கப்பட வேண்டும்.

- ஒவ்வொரு பணியும் உள்ளீட்டு கட்டத்திலிருந்து வெளியீட்டு கட்டத்திற்கு ஒரு தனித்துவமான மாற்றத்தை சார்ந்துள்ளது. குறிப்பாக, பயிற்சிப் பணிகளில் கற்றுக்கொண்ட மாற்றத்தை மீண்டும் பயன்படுத்துவதன் மூலம் எந்த மதிப்பீட்டுப் பணியையும் தீர்க்க முடியாது. ஒவ்வொரு பணியும் ஒரு தனித்துவமான கற்றல் பிரச்சனையாகும், மேலும் ARC மதிப்பிடுவது ஒரு பரந்த பொதுமைப்படுத்தல் மற்றும் சில ஷாட் கற்றல் ஆகும்.


ஒவ்வொரு புதிரையும் 3-5 மாதிரிகள், சில ஷாட்கள் மட்டுமே வழங்குவதன் மூலம் ARC மிகவும் கடுமையான பொதுமைப்படுத்தல் சோதனையை வழங்குகிறது. இந்த குறைந்தபட்ச பயிற்சித் தரவு என்பது AI ஆனது விரிவான வடிவப் பொருத்தத்தை நம்பியிருக்க முடியாது - இது அடிப்படைக் கொள்கைகளைப் பிரித்தெடுத்து, மனிதர்களைப் போலவே புதிய சூழ்நிலைகளுக்குப் பயன்படுத்த வேண்டும். குறுக்குவழி தீர்வுகள் அல்லது மனப்பாடம் செய்யும் உத்திகளை எதிர்க்கும் வகையில் புதிர்கள் வேண்டுமென்றே வடிவமைக்கப்பட்டுள்ளன.


ARC ஐ குறிப்பாக மதிப்புமிக்கதாக்குவது என்னவென்றால், அது பொதுமைப்படுத்தல் திறனின் அளவிடக்கூடிய அளவை வழங்குகிறது. ஒரு AI அமைப்பு உண்மையிலேயே சில தத்துவ அர்த்தத்தில் "புரிகிறதா" என்று விவாதிப்பதற்குப் பதிலாக, கவனமாக வடிவமைக்கப்பட்ட இந்த பகுத்தறிவு பணிகளில் உறுதியான செயல்திறனை அளவிட முடியும். இது செயற்கை பொது நுண்ணறிவை நோக்கிய முன்னேற்றத்திற்கான தெளிவான அளவுகோலை ஆராய்ச்சியாளர்களுக்கு வழங்குகிறது.


ARC பெஞ்ச்மார்க் மற்றும் AI மேம்பாட்டிற்கான அதன் அர்த்தம் என்ன என்பதைப் பற்றி மேலும் அறிய விரும்பினால், இந்த வீடியோ தொடங்குவதற்கு ஒரு சிறந்த இடம்:

ARC ஐ தீர்ப்பதற்கான அணுகுமுறைகள்

  1. ப்ரூட்-ஃபோர்ஸ் அணுகுமுறைகள்

2020 Kaggle போட்டி, ARC-ஐத் தீர்ப்பதற்கான முதல் அணுகுமுறைகளில் ஒன்றை வெளிப்படுத்தியது - முன் வரையறுக்கப்பட்ட மாற்றங்களின் மூலம் மிருகத்தனமான தேடல். வெற்றிகரமான தீர்வு 142 கையால் வடிவமைக்கப்பட்ட கட்ட செயல்பாடுகளைக் கொண்ட டொமைன்-குறிப்பிட்ட மொழியை (DSL) உருவாக்கியது. இந்த செயல்பாடுகளின் சேர்க்கைகள் மூலம் முறையாகத் தேடுவதன் மூலம், இது தனிப்பட்ட மதிப்பீட்டுப் பணிகளில் 20% துல்லியத்தை அடைந்தது. உருமாற்றத் தேடலுக்கு வழிகாட்டும் இலக்கண பரிணாமத்தைப் பயன்படுத்தி இதேபோன்ற மற்றொரு தீர்வு 3–7.68% துல்லியத்தை எட்டியது.


அவற்றின் ஆரம்ப வெற்றிக்கு குறிப்பிடத்தக்கதாக இருந்தாலும், இந்தத் தீர்வுகள் ஒரு முக்கிய வரம்பைக் காட்டுகின்றன: அவை எந்தவொரு உண்மையான புரிதல் அல்லது பொதுமைப்படுத்துவதற்கான திறனை வளர்ப்பதற்குப் பதிலாக, முன் திட்டமிடப்பட்ட விதிகளின் முழுமையான தேடலை நம்பியுள்ளன. நிரல் தேடலுக்கும் உண்மையான நுண்ணறிவுக்கும் இடையிலான இந்த இடைவெளி, பொதுமைப்படுத்தல் திறன்களை அளவிடுவதற்கு ARC ஒரு சவாலான அளவுகோலாக ஏன் உள்ளது என்பதை நிரூபிக்கிறது.


  1. குறைந்தபட்ச விளக்க நீளம் (MDL)

தற்போதைய அணுகுமுறை ( https://github.com/sebferre/ARC-MDL/tree/master ) ஒரு அடிப்படைக் கொள்கையை அடிப்படையாகக் கொண்டது, இது வடிவங்களைக் கண்டறியவும், சாத்தியமான மிகச் சுருக்கமான முறையில் தரவை சிறப்பாக விளக்கும் மாதிரிகளை உருவாக்கவும் பயன்படுகிறது. அதன் மையத்தில், MDL, "சில தரவுகளுக்கான சிறந்த மாதிரியானது, பெரும்பாலான தரவைச் சுருக்குகிறது" என்று கூறுகிறது.


கட்டம் வடிவங்களை திறமையாக விவரிக்க, தீர்வு ஒரு சிறப்பு மாதிரியாக்க மொழியைப் பயன்படுத்துகிறது. உள்ளீடு மற்றும் வெளியீட்டு கட்டங்கள் இரண்டையும் அடிப்படைக் கூறுகளின் சேர்க்கைகளாகப் பிரதிநிதித்துவப்படுத்த இந்த மொழி ஒரு கட்டமைக்கப்பட்ட வழியை வழங்குகிறது:


மிக உயர்ந்த மட்டத்தில், ஒவ்வொரு புதிரும் ஒரு ஜோடியாகக் குறிப்பிடப்படுகிறது மற்றும் இரண்டு கட்டங்களைக் கொண்டுள்ளது:

● ஒரு உள்ளீட்டு கட்டம் (இன்)

● ஒரு வெளியீடு கட்டம் (அவுட்)


ஒவ்வொரு கட்டமும் மூன்று கூறுகளால் வரையறுக்கப்படுகிறது:

  1. ஒரு அளவு திசையன் (உயரம் மற்றும் அகலத்தை வரையறுக்கிறது)
  2. ஒரு பின்னணி நிறம்
  3. பொருள்களைக் கொண்ட அடுக்குகளின் பட்டியல்


பொருள்கள் நிலைப்படுத்தப்பட்ட வடிவங்கள், அங்கு ஒவ்வொரு வடிவமும் இருக்கலாம்:

● ஒற்றை நிற புள்ளி

● குறிப்பிட்ட அளவு, நிறம் மற்றும் முகமூடியுடன் கூடிய செவ்வகம்


முகமூடி அமைப்பு குறிப்பாக சக்தி வாய்ந்தது, செவ்வகங்கள் பல்வேறு வடிவங்களை எடுக்க அனுமதிக்கிறது:

● முழு (திட செவ்வகம்)

● பார்டர் (அவுட்லைன் மட்டும்)

● செக்போர்டு வடிவங்கள் (இரட்டை அல்லது ஒற்றைப்படை)

● குறுக்கு வடிவங்கள் (கூடுதல் அல்லது நேர வடிவம்)

● தனிப்பயன் பிட்மேப் வடிவங்கள்


சிக்கலான கட்ட வடிவங்களை சுருக்கமாக விவரிக்க இந்த மொழி கணினியை அனுமதிக்கிறது. எடுத்துக்காட்டாக, 10x10 கிரிட் பிக்சலை பிக்சல் மூலம் (100 மதிப்புகள்) சேமிப்பதற்குப் பதிலாக, "3x3 சிவப்பு செவ்வக நிலையில் (2,2) உள்ள கருப்புப் பின்னணியில்" - அத்தியாவசிய கட்டமைப்பைக் கைப்பற்றும் போது மிகக் குறைவான மதிப்புகளைப் பயன்படுத்தி அதைச் சேமிக்கலாம்.


வடிவங்களைத் தேடும்போது, இந்த மொழியைப் பயன்படுத்தி உள்ளீடு மற்றும் வெளியீட்டு கட்டங்கள் இரண்டின் சுருக்கமான விளக்கத்தைக் கண்டறிய கணினி முயற்சிக்கிறது. நல்ல தீர்வுகள் உள்ளீடு மற்றும் வெளியீட்டிற்கு இடையே உள்ள கூறுகளை மீண்டும் பயன்படுத்த முனைகின்றன (உள்ளீட்டிலிருந்து ஒரு வடிவத்தை எடுத்து அதை வெளியீட்டில் மாற்றுவது போன்றவை), இது குறுகிய விளக்கங்களுக்கும் சிறந்த சுருக்கத்திற்கும் வழிவகுக்கிறது.


இந்த அணுகுமுறையின் வெற்றி (94/400 பயிற்சிப் பணிகள் தீர்க்கப்பட்டன) குறிப்பிட்ட எடுத்துக்காட்டுகளுக்கு மிகைப்படுத்தப்படுவதைத் தவிர்ப்பதற்கு போதுமான அளவு கட்டுப்படுத்தப்பட்ட நிலையில், ARC புதிர்களில் இருக்கும் பல முக்கிய வடிவங்களை இந்த மொழி படம்பிடிக்கிறது.


  1. அடிப்படை LLMகளுடன் நேரடி வெளியீடு கணிப்பு

LLMகள் பல டொமைன்களில் ஈர்க்கக்கூடிய திறன்களைக் காட்டினாலும், ARCயைத் தீர்க்க அவற்றை நேரடியாகப் பயன்படுத்துவது வாய்ப்புகள் மற்றும் சவால்கள் இரண்டையும் அளிக்கிறது. அப்பாவி அணுகுமுறையானது LLM க்கு உள்ளீடு-வெளியீட்டு எடுத்துக்காட்டுகளுடன் வழங்குவதும், புதிய உள்ளீடுகளுக்கான பதிலைக் கணிக்கக் கேட்பதும் அடங்கும். இருப்பினும், இந்த முறை குறிப்பிடத்தக்க வரம்புகளைக் கொண்டுள்ளது. இந்த சூழலில் எல்எல்எம்கள் மிகவும் வரையறுக்கப்பட்ட இடஞ்சார்ந்த பகுத்தறிவு திறன்களை வெளிப்படுத்துகின்றன மற்றும் கட்டம் மாற்றங்களைக் கணிக்க முயற்சிக்கும்போது மாயத்தோற்றங்களுக்கு அதிக வாய்ப்புள்ளது.


  1. LLM பிரச்சனை-தீர்விற்கான சிந்தனை விரிவாக்கம்

உள்ளீடு-வெளியீட்டு ஜோடிகளில் கவனிக்கும் வடிவங்களை பகுப்பாய்வு செய்து விவரிக்க LLM ஐ முதலில் கேட்பதன் மூலம் இந்த அணுகுமுறை நேரடி கணிப்பு முறையை உருவாக்குகிறது. இந்த கூடுதல் பகுத்தறிவு படி LLM சிக்கலைச் சிதைக்க உதவுவதன் மூலம் சிறந்த முடிவுகளைத் தருகிறது என்றாலும், அது இன்னும் அதே அடிப்படை வரம்புகளைக் கொண்டுள்ளது. சாத்தியமான வடிவங்களைக் கண்டறிந்த பிறகும், இறுதி வெளியீடுகளைக் கணிக்க முயற்சிக்கும்போது, மாடல் அதிக விகிதத்தில் மாயத்தோற்றத்தை வெளிப்படுத்துகிறது. ARC சவால்களைத் தீர்ப்பதில் LLM இன் இடஞ்சார்ந்த பகுத்தறிவு வரம்புகளைக் கடக்க, வெளிப்படையான பகுத்தறிவு படிகளைச் சேர்ப்பது மட்டும் போதாது என்று இது அறிவுறுத்துகிறது.

AI முகவர்கள் மற்றும் AGI இல் அவர்களின் பங்கு

WLTech.AI இல், AGI ஐப் பின்தொடர்வதில் AI முகவர்களின் பெரும் பங்கு மிகவும் முக்கியத்துவம் வாய்ந்ததாக இருப்பதைக் காண்கிறோம். அவர்கள் தங்கள் அமைப்புகளுடன் மாறும் வகையில் தொடர்புகொள்வதற்கும், அவர்கள் கற்றுக்கொண்டவற்றின் அடிப்படையில் மாற்றியமைப்பதற்கும், தாங்களாகவே கற்றுக்கொள்வதற்கும் வடிவமைக்கப்பட்டுள்ளனர். ஒருமுறை மட்டுமே பயிற்சியளிக்கப்பட்ட நிலையான மாதிரிகள் போலல்லாமல், AI முகவர்கள் நடந்துகொண்டிருக்கும் தொடர்புகளிலிருந்து கற்றுக் கொள்ளலாம் மற்றும் மாறிவரும் சூழ்நிலைகளுக்கு ஏற்றவாறு அவற்றை AGI இன் வளர்ச்சியில் ஒரு முக்கிய அங்கமாக மாற்றலாம்.


AI முகவர்கள் செயல்பாட்டின் மூளையாகும், ஒரு பணியின் குறிப்பிட்ட கோரிக்கைகளுக்கு ஏற்றவாறு பலவிதமான நுட்பங்களை ஒருங்கிணைக்கிறது. குறியீட்டு அமைப்புகள் துல்லியமான, விதி அடிப்படையிலான பகுத்தறிவில் சிறந்தவை, இது சுழற்சிகள் அல்லது பிரதிபலிப்புகள் போன்ற மாற்றங்களைப் புரிந்து கொள்ள வேண்டிய பணிகளுக்கு அவற்றைச் சரியானதாக்குகிறது. நரம்பியல் நெட்வொர்க்குகள் வடிவங்களை அங்கீகரிப்பதிலும் தரவுகளிலிருந்து பொதுமைப்படுத்துவதிலும் சிறந்தவை, இது ARC பணிகளில் அடிப்படை கட்டமைப்புகளை அடையாளம் காண மிகவும் பயனுள்ளதாக இருக்கும்.


இருப்பினும், ARC இன் சவால்கள் குறியீட்டு கையாளுதல் அல்லது வடிவ அங்கீகாரத்துடன் முடிவடையவில்லை. புதிய விதிகளை உருவாக்குதல், இணைப்புகளை உருவாக்குதல் மற்றும் புதிய சூழ்நிலைகளுக்கு ஏற்றவாறு மாற்றியமைத்தல் உள்ளிட்ட பல பணிகளுக்கு மிகவும் மேம்பட்ட அளவிலான சுருக்கம் தேவைப்படுகிறது. மொழி மாதிரிகள் இங்கே பயனுள்ளதாக இருக்கும், ஏனெனில் அவை நிரல் தொகுப்பு மற்றும் சுருக்கமான பகுத்தறிவு போன்ற விஷயங்களுக்கு பயன்படுத்தப்படலாம். தேடல் வழிமுறைகள் பெட்டியில் உள்ள மற்றொரு கருவியாகும், ஏனெனில் அவை தீர்வுகளை அடையாளம் காண சாத்தியமான மாற்றங்களை திறமையாக ஆராயலாம். திட்டமிடல் அமைப்புகள், மறுபுறம், ஒரு நேரத்தில் ஒரு படி சிக்கலான சிக்கல்களை உடைத்து சமாளிக்கும் கட்டமைப்பை வழங்குகின்றன.


AI முகவர்களை மிகவும் புத்திசாலியாக்குவது என்னவென்றால், அவர்கள் இந்த வெவ்வேறு அணுகுமுறைகளை ஒன்றிணைக்க முடியும். அவர்கள் ஒரு நேரத்தில் ஒரு முறையை மட்டும் பயன்படுத்துவதில்லை. அவர்கள் ஒவ்வொரு தனிப்பட்ட சிக்கலையும் தீர்க்க சிறந்த நுட்பங்களின் கலவையை மதிப்பீடு செய்து பயன்படுத்துகின்றனர். பறக்கும்போது மாற்றியமைக்கும் இந்த திறன் மனிதர்களை வேறுபடுத்துகிறது மற்றும் AGI ஐ முன்னேற்றுவதில் ஒரு முக்கிய பகுதியாகும்.

அவர்களின் மையத்தில், AI முகவர்கள் அடிப்படையில் அறிவார்ந்த ஒருங்கிணைப்பாளர்கள். கடந்த கால அனுபவங்களில் இருந்து அவர்கள் கற்றுக்கொள்ளும் வகையில், என்ன வேலை செய்கிறது மற்றும் எது செய்யாது என்பதைப் பற்றிய பதிவுகளை அவர்கள் வைத்திருக்கிறார்கள்.


எங்களின் ஏஜென்டிக் AI தீர்வை நீங்கள் இங்கே காணலாம்: https://colab.research.google.com/drive/1-rQoqrGRGQE6M8bMpfzqf6tV3TnUi-Mp?usp=sharing அல்லது Github இல்: https://github.com/weblab-technology/ ஆர்க்-சவால்-2024-10



எங்களின் முன்னேற்றம், மனித பிரச்சனைகளை தீர்க்கும் நடத்தையைப் பிரதிபலிப்பதில் இருந்து வந்தது: உதாரணங்களை பகுப்பாய்வு செய்தல், விதிகளை அனுமானித்தல், சோதனை செய்தல் மற்றும் செம்மைப்படுத்துதல். முரட்டு சக்திக்கு பதிலாக, எங்கள் AI தலைமுறை செயல்பாடுகளை எழுதுவதில் கவனம் செலுத்துகிறது - மாற்றங்களை வரையறுக்கும் பைதான் குறியீடு - உடனடியாக அவற்றை பயிற்சி தரவுகளில் சோதிக்கிறது.

முக்கிய படிகள்:

  1. வடிவங்களை பகுப்பாய்வு செய்யுங்கள்: உள்ளீடு-வெளியீட்டு ஜோடிகளில் உள்ள உறவுகளை AI அடையாளம் காட்டுகிறது.
  2. செயல்பாட்டை உருவாக்கு: இது ஒரு உருமாற்றத்தை (உள்ளீடு) எழுதுகிறது: கவனிக்கப்பட்ட வடிவங்களின் அடிப்படையில் வெளியீட்டு செயல்பாடு.
  3. உடனடி சோதனை: செயல்பாடு பயிற்சி உள்ளீடுகளில் சோதிக்கப்படுகிறது. வெளியீடுகள் சரியாகப் பொருந்தினால், தீர்வு சரியானதாகக் கருதப்பட்டு சோதனை உள்ளீடுகளுக்குப் பயன்படுத்தப்படும்.
  4. மீண்டும் செய்யவும்: சோதனைகள் தோல்வியுற்றால், செயல்பாடு சுத்திகரிக்கப்பட்டு மீண்டும் சோதிக்கப்படும்.


எங்கள் அணுகுமுறையில் ஒரு ஆச்சரியமான கண்டுபிடிப்பு என்னவென்றால், மீண்டும் மீண்டும் செய்யும் மேம்பாடுகள் பெரும்பாலும் உதவுவதை விட முன்னேற்றத்தைத் தடுக்கின்றன. ஒரு தலைமுறை செயல்பாட்டிற்குப் பின்னால் உள்ள ஆரம்ப அனுமானம் குறைபாடுடையதாக இருந்தால், அதைச் செம்மைப்படுத்த முயற்சிப்பது பொதுவாக பிழையை சரிசெய்வதற்குப் பதிலாகப் பெருக்கும். இந்த உணர்தல் அடிப்படையில் எங்கள் வழிமுறையை மறுவடிவமைத்தது.

சுத்திகரிப்புக்கு மேல் புதிய யோசனைகள்

தவறான அனுமானங்களைச் செம்மைப்படுத்துவதற்குப் பதிலாக, இது மிகவும் பயனுள்ளதாக இருக்கும்:

  1. தவறான அணுகுமுறையை முழுவதுமாக நிராகரிக்கவும்.
  2. பயிற்சி தரவுகளிலிருந்து புதிய நுண்ணறிவுகளின் அடிப்படையில் புதிதாக ஒரு புதிய கருதுகோளை உருவாக்கவும்.


உடைந்த மூலோபாயத்தை இணைப்பதை விட, ஒரு தீர்வு பாதை பயனற்றதாக நிரூபிக்கப்படும் போது, மறுசீரமைப்பு மற்றும் மறுபரிசீலனை செய்யும் மனித நடத்தையை இது பிரதிபலிக்கிறது.

ஏன் மரபணு அல்காரிதம்கள் வேலை செய்யவில்லை

மரபணு வழிமுறைகள் ஏன் முடிவுகளை மேம்படுத்தத் தவறிவிட்டன என்பதையும் இந்த நுண்ணறிவு விளக்குகிறது. வடிவமைப்பின் மூலம், மரபணு வழிமுறைகள் தீர்வுகளை படிப்படியாக உருவாக்கி, தலைமுறைகளாக அவற்றைச் செம்மைப்படுத்துகின்றன. இருப்பினும், அடிப்படை அனுமானங்கள் தவறாக இருக்கும்போது, அதிகரிக்கும் மாற்றங்கள் சரியான மாற்றத்திலிருந்து மேலும் விலகிச் செல்லும் சுருண்ட தீர்வுகளுக்கு வழிவகுக்கும்.


எல்எல்எம் மதிப்பீடு: கிளாட் 3.5 சோனட் போட்டியாளர்களை விஞ்சியது

ARC சவாலைச் சமாளிக்க, உருவாக்கும் செயல்பாடுகளை எழுதுவதற்கு உதவ, பல பெரிய மொழி மாதிரிகளை (LLMகள்) விரிவாகச் சோதித்தோம். அவர்களில், Claude 3.5 Sonnet அதன் போட்டியாளர்களை கணிசமாக விஞ்சி, மிகவும் திறமையானதாக வெளிப்பட்டது.


முக்கிய கண்டுபிடிப்புகள்:

கிளாட் 3.5 சொனட் எதிராக GPT-4o:

செயல்திறன்: க்ளாட் 3.5 சொனட் GPT-4o ஐ விட அதிகமான வடிவங்களை அடையாளம் கண்டுள்ளது, இது மாதிரி அங்கீகாரத்தில் கிட்டத்தட்ட இரு மடங்கு துல்லியத்தை அடைந்தது.

செயல்திறன்: ஓபன்ஏஐயின் GPT-4o போன்ற அதே முடிவுகளை கிளாட் 1/7 செயல்படுத்தும் நேரத்தில் அடைந்தார், இது மிகவும் பயனுள்ளதாக மட்டுமல்லாமல் வேகமாகவும் ஆக்கியது.


GPT-4o இன் சரிவு:

● காலப்போக்கில் GPT-4o இன் செயல்திறனில் குறிப்பிடத்தக்க சரிவைக் கண்டோம். GPT-4o இன் ஆரம்பப் பதிப்பு, அடுத்தடுத்த பதிப்புகளைக் காட்டிலும், ARC பணிகளுக்கு மிகவும் திறன் வாய்ந்ததாக இருந்தது, இது அதன் தேர்வுமுறையில் சாத்தியமான மாற்றத்தைக் குறிக்கிறது.


கிளாட் 3.5 சொனட் ஏன் தனித்து நிற்கிறது


ARC இன் சில-ஷாட் இயல்புக்கு முக்கியமானதாக இருக்கும் நுட்பமான மாற்றங்களை பொதுமைப்படுத்தி அடையாளம் காணும் திறனில் க்ளாட்டின் விளிம்பு உள்ளது. அதன் சீரான செயல்திறன் மற்றும் செயல்திறன், எங்கள் AI முகவர் கட்டமைப்பில் ஒருங்கிணைப்பதற்கான தெளிவான தேர்வாக அமைந்தது, கட்டமைக்கப்பட்ட சிக்கலைத் தீர்ப்பதில் LLM-உந்துதல் பகுத்தறிவுக்கு ஒரு புதிய தரநிலையை அமைத்தது.

முடிவுகள்

எங்கள் அணுகுமுறை ARC மதிப்பீட்டுத் தொகுப்பில் 30% துல்லியத்தை எட்டியுள்ளது , இது அடிப்படை முறைகளைக் காட்டிலும் குறிப்பிடத்தக்க வகையில் சிறப்பாகச் செயல்படுகிறது. இந்த முடிவு, மனித பிரச்சனைகளைத் தீர்க்கும் நடத்தையைப் பிரதிபலிக்கும் வலிமையை எடுத்துக்காட்டுகிறது, புதிய கருதுகோள்களை மீண்டும் மீண்டும் மேம்படுத்துகிறது, மேலும் Claude 3.5 Sonnet போன்ற மிகவும் திறமையான LLMகளைப் பயன்படுத்துகிறது. முன்னேற்றத்திற்கு இன்னும் கணிசமான இடம் இருந்தாலும், இந்த மைல்கல் ARC இன் சவால்களை எதிர்கொள்வதில் அர்த்தமுள்ள முன்னேற்றத்தை நிரூபிக்கிறது மற்றும் AI இல் பரந்த பொதுமைப்படுத்தலை நோக்கி முன்னேறுகிறது.

ARCக்கான எதிர்கால திசைகள்

WLTech.AI இல், ARC ஐத் தீர்ப்பதற்கான எதிர்காலம் LLM திறன்களின் தொடர்ச்சியான வளர்ச்சியில் உள்ளது என்று நாங்கள் நம்புகிறோம், குறைந்தபட்ச விளக்க நீளம் (MDL) அல்லது சுருக்கமான வடிவ விளக்கத்திற்கான ஒத்த அணுகுமுறைகள் போன்ற உயர்-நிலை பகுத்தறிவு கட்டமைப்புகளுடன் இணைந்துள்ளது. இந்த முன்னேற்றங்கள் மாதிரிகள் சிறந்த சுருக்கம் மற்றும் மாற்றங்களை பொதுமைப்படுத்த உதவும். கூடுதலாக, வளர்ந்து வரும் தீர்வுகள் வங்கியின் அடிப்படையில் ஒரு சுய-சுத்திகரிப்பு உடனடி அமைப்பை ஒருங்கிணைப்பது, மாதிரிகள் தங்கள் பகுத்தறிவைத் திரும்பத் திரும்ப மேம்படுத்தி, கடந்த கால வெற்றிகளிலிருந்து பெற அனுமதிக்கும், மேலும் தகவமைப்பு மற்றும் திறமையான சிக்கலைத் தீர்க்கும் பைப்லைனை உருவாக்குகிறது. மேம்பட்ட LLMகள், கட்டமைக்கப்பட்ட விளக்கங்கள் மற்றும் தழுவல் கற்றல் ஆகியவற்றுக்கு இடையேயான இந்த ஒருங்கிணைப்பு ARC மற்றும் AGI வளர்ச்சியில் புதிய மைல்கற்களைத் திறக்கும் திறனைக் கொண்டுள்ளது.

குறிப்பிடத்தக்க ARC தீர்வுகள்

சுருக்கம் மற்றும் பகுத்தறிவு கார்பஸ் (ARC) அளவுகோல், AI பொது விதிகளை எவ்வளவு சிறப்பாகப் பயன்படுத்துகிறது மற்றும் மிகவும் சுருக்கமான வழியில் சிந்திக்க முடியும் என்பதைச் சோதிப்பதில் முக்கியமானது. பல ஆண்டுகளாக, பல தனித்துவமான தீர்வுகள் வருவதை நாங்கள் பார்த்திருக்கிறோம், ஒவ்வொன்றும் புலத்தில் வித்தியாசமாகச் சேர்க்கின்றன.


● ரியான் கிரீன்ப்ளாட்டின் அணுகுமுறை

2024 ஆம் ஆண்டில், ரெட்வுட் ஆராய்ச்சியின் பொறியியலாளர் ரியான் க்ரீன்ப்ளாட், ARC-AGI பொது மதிப்பீட்டுத் தொகுப்பில் 43% சரிபார்ப்பு மதிப்பெண்ணுடன் 42% மதிப்பெண்களைப் பெற்று ஒரு முக்கிய மைல்கல்லை எட்டினார். அவரது அணுகுமுறையானது GPT-4o ஐப் பயன்படுத்தி பல பைதான் நிரல்களை உருவாக்கி செம்மைப்படுத்துவது மற்றும் சமர்ப்பிப்பதற்கான சிறந்தவற்றைத் தேர்ந்தெடுப்பது. சிக்கலான பகுத்தறிவு பணிகளைச் சமாளிக்க நிரல் தொகுப்புடன் கூடிய பெரிய மொழி மாதிரிகளை எவ்வாறு பயன்படுத்தலாம் என்பதை இது காட்டுகிறது.


● ஐஸ்குபர் 2020

"icecuber 2020" தீர்வு, முந்தைய போட்டி வெற்றியாளர், பொது மதிப்பீடு மதிப்பெண் 39% மற்றும் சரிபார்ப்பு மதிப்பெண் 17% பெற்றது. முறை பற்றிய அனைத்து விவரங்களும் எங்களிடம் இல்லை என்றாலும், அடுத்தடுத்த ARC தீர்வுகளுக்கான பட்டியை அமைப்பதில் இந்தத் தீர்வு மிகவும் முக்கியமானது.

ARC பரிசு 2024 லீடர்போர்டு

ARC பரிசு 2024 லீடர்போர்டில் பின்வரும் சிறந்த கலைஞர்கள் இடம்பெற்றுள்ளனர்:


● MindsAI 55.5% மதிப்பெண்களுடன் முன்னணியில் உள்ளது.

● ARChitects 53.5% மதிப்பெண்களுடன் மிகவும் பின்தங்கி உள்ளனர்.

● 40% மதிப்பெண்களுடன் கில்லர்மோ பார்பாடிலோ மூன்றாவது இடத்தில் உள்ளார்.

● அலிஜ்கள் நான்காவது, 40%.

● 38% மதிப்பெண்களுடன் TuMinhDang ஐந்தாவது இடம்.


இந்த மதிப்பெண்கள் அனைவரும் எவ்வாறு கடினமாக உழைக்கிறார்கள் மற்றும் ARC அளவுகோலைச் சமாளிப்பதற்கான புதிய வழிகளைக் கொண்டு வருகிறார்கள். வெவ்வேறு அணிகள் எவ்வாறு வெவ்வேறு உத்திகளைப் பயன்படுத்துகின்றன என்பதையும் அவை காட்டுகின்றன.

AI ஆராய்ச்சியாளர்களை ஊக்குவிப்பதில் ARC இன் பங்கு

AI அமைப்புகள் எவ்வளவு நன்றாக நியாயப்படுத்தலாம் மற்றும் பொதுமைப்படுத்தலாம் என்பதைச் சோதிக்க ARC அளவுகோல் இன்னும் சிறந்த வழியாகும். சில பெரிய முன்னேற்றங்கள் இருந்தபோதிலும், எந்த மாதிரியும் ARC ஐ முழுமையாகப் பிடிக்கவில்லை, செயற்கை பொது நுண்ணறிவை அடைவது எவ்வளவு தந்திரமானது என்பதை நிரூபிக்கிறது. ஆராய்ச்சியாளர்களும் பயிற்சியாளர்களும் எப்பொழுதும் வெவ்வேறு அணுகுமுறைகளை இணைத்து, நரம்பியல் நெட்வொர்க்குகளுடன் குறியீட்டு பகுத்தறிவைப் பயன்படுத்தி, சிக்கல்களைத் தீர்ப்பதில் நெருங்கி வருவதற்கான வழிகளைத் தேடுகிறார்கள்.


ARC போன்ற வரையறைகள், AI ஆராய்ச்சிக்கான எதிர்காலம் என்ன என்பதைப் பற்றிய ஒரு கண்ணோட்டத்தை நமக்கு வழங்குகிறது. அவர்கள் மனிதர்களைப் போல சிந்திக்கவும் மாற்றியமைக்கவும் கூடிய அமைப்புகளை நோக்கி களத்தை நகர்த்துகிறார்கள். நாங்கள் இன்னும் மெதுவாக முன்னேறிக்கொண்டிருக்கும்போது, AGI ஐ அடைவதற்கான தெளிவான பாதையை ARC ஏற்கனவே அமைத்துள்ளது.


கவனம் பொதுமைப்படுத்தலை நோக்கி நகர்கிறது. ( https://arxiv.org/abs/2305.07141?utm_source=chatgpt.com )

எதிர்காலத்தில், AI அமைப்புகள் நிபுணத்துவத்தை விட பொதுமைப்படுத்த வடிவமைக்கப்படும். ARC பணிகள் காட்டுவது போல், மீண்டும் பயிற்சி பெறாமல் புதிய பிரச்சனைகளை தீர்க்க முடியும் என்பது உண்மையான நுண்ணறிவின் முக்கிய அறிகுறியாகும். சில ஷாட் அல்லது ஜீரோ-ஷாட் கற்றலில் சிறந்த மாதிரிகளை ஆராய்ச்சியாளர்கள் உருவாக்குவார்கள் என்று தெரிகிறது, நமது மூளை எவ்வாறு செயல்படுகிறது என்பதிலிருந்து உத்வேகம் பெறுகிறது.


கலப்பின மாதிரிகள் வழக்கமாக இருக்கும்.

ARC தீர்வுகளின் வெற்றி, ஒற்றை அணுகுமுறை அமைப்புகளுக்கு அவற்றின் வரம்புகள் இருப்பதை ஏற்கனவே நமக்குக் காட்டியுள்ளது. AI இன் எதிர்காலம் நரம்பியல் நெட்வொர்க்குகள், குறியீட்டு அமைப்புகள் மற்றும் நிகழ்தகவு பகுத்தறிவு ஆகியவற்றை ஒருங்கிணைக்கும் கலப்பின மாதிரிகளாக இருக்கும். இந்த மாதிரிகள் ARC இல் சிறப்பாகச் செயல்படும், ஆனால் நெகிழ்வுத்தன்மை மற்றும் தகவமைப்புத் தன்மை ஆகியவை முக்கியமாக இருக்கும் நிஜ உலகச் சிக்கல்களைக் கையாளவும் முடியும்.


அறிவாற்றல் கட்டமைப்பில் ஒரு புதிய கவனம் உள்ளது.

வெவ்வேறு பகுத்தறிவு முறைகளை ஒன்றிணைக்கும் மனித மூளையின் திறனை நகலெடுக்கும் அறிவாற்றல் கட்டமைப்புகளைப் பற்றி ARC மக்களை சிந்திக்க வைத்துள்ளது. வேலை செய்யும் நினைவகம், மெட்டா-லேர்னிங் மற்றும் மல்டி-ஏஜென்ட் அமைப்புகள் பற்றிய கூடுதல் ஆராய்ச்சியைப் பார்ப்போம், இது AI க்கு வழி வகுக்கும்.


AI அமைப்புகள் புத்திசாலித்தனமாக இருப்பதால், அவை நமக்காக நமது வேலைகளைச் செய்வதை விட எங்களுடன் இணைந்து செயல்படத் தொடங்கும். ARC போன்ற வரையறைகள் மனிதர்களுடன் இணைந்து செயல்படும் AI அமைப்புகளை உருவாக்க உதவுகின்றன, அறிவியல் கண்டுபிடிப்பு மற்றும் ஆக்கப்பூர்வமான சிக்கல் தீர்க்கும் சிக்கலான பகுதிகளில் நுண்ணறிவு மற்றும் தீர்வுகளை வழங்குகின்றன.


இது போன்ற போட்டிகள் உண்மையில் AI சமூகத்தை ஊக்கப்படுத்தியுள்ளன. $1,000,000-க்கும் அதிகமான வெகுமதியுடன், தற்போதைய வரையறைகளை முறியடிக்கக்கூடிய திறந்த மூல தீர்வுகளைக் கொண்டு வர ஆராய்ச்சியாளர்களுக்கு ARC பரிசு ஒரு சிறந்த ஊக்கமாகும்.


WLTech.AI இல், அத்தகைய தீர்வுகளின் மதிப்பு $1,000,000 ஐத் தாண்டியுள்ளது என்பதை நாங்கள் அங்கீகரிக்கிறோம், மேலும் இந்தத் துறையில் தொடர்ந்து முன்னேற அடுத்த ஆண்டு மீண்டும் சவாலில் பங்கேற்க நாங்கள் மகிழ்ச்சியடைகிறோம்.

L O A D I N G
. . . comments & more!

About Author

WLTech.AI (WebLab Technology) HackerNoon profile picture
WLTech.AI (WebLab Technology)@wltechai
Experienced Full-Cycle AI Dedicated Development Teams. Since 2013.

ஹேங் டேக்குகள்

இந்த கட்டுரையில் வழங்கப்பட்டது...