– பெர்னார்ட் மார்
– தமிழில்: ரேவதி முகில்
GPT-3 எனப்படும் புதிதாக உருவாக்கப்பட்ட ஒரு தொழில்நுட்பத்தினால் AI எனப்படும் செயற்கை நுண்ணறிவுத் துறையில் ஒரு பெரும் பரபரப்பும் உற்சாகமும் தொற்றிக் கொண்டுள்ளது. எளிமையாகச் சொல்ல வேண்டுமானால் இத்தொழில் நுட்பமானது மனித அல்லது இயந்திர மொழிகளில் ஒரு உள்ளடக்கத்தை உருவாக்குவதற்கு இதற்கு முன் இருந்த எல்லா தொழில்நுட்பங்களையும் விட சிறந்த மொழி கட்டமைப்பைக் கொண்டது.
எலான் மஸ்க் இணைந்து நிறுவிய OpenAI என்கிற ஒரு ஆராய்ச்சி நிறுவனம் GPT-3-யை உருவாக்கியுள்ளது. செ.நு.இன் பல்லாண்டு கால ஆராய்ச்சிகளில் மிக முக்கியமான பயனுள்ள பாய்ச்சலாக GPT-3 விவரிக்கப்படுகிறது.
ஆனால் அது உண்மையில் என்ன செய்கிறது என்பதில் சில குழப்பங்கள் உள்ளன (என்னவெல்லாம் செய்யாது என்பதிலும்), எனவே அதன் பின்னணியில் உள்ள அடிப்படைக் கொள்கைகளைப் புரிந்து கொள்ள ஆர்வமுள்ள, தொழில்நுட்பரல்லாத வாசகர்களுக்காக நான் அதை எளிய சொற்களில் விளக்க முயற்சிக்கிறேன். GPT-3 ஏற்படுத்துகிற சில பிரச்சனைகளையும் அதற்குக் கிடைத்த முக்கியத்துவத்தை சிலர் மிகைப்படுத்தப்பட்டதாக ஒன்றாக நினைப்பது ஏன் என்பதை பற்றியும் பேச இருக்கிறேன்.
GPT-3 என்றால் என்ன?
மிகவும் எளிமையாகக் கூற வேண்டுமானால் GPT-3 என்பது ஜெனரேட்டிவ் ப்ரீ-டிரெயிண்ட் டிரான்ஸ்ஃபார்மர்-3 (மொழி உருவாக்கும் திறன்சார் முன்-பயிற்சி பெற்ற மாற்றி-3) என்பதாகும். இது இத் தொழில் நுட்பத்தின் மூன்றாம் பதிப்பாகும்.
சுருக்கமாக, இது முன்-பயிற்சி பெற்ற அல்காரிதம்களைப் பயன்படுத்தி உரைகளை உருவாக்குகிறது என்று பொருள் படுகிறது. ஒரு பணியைச் செய்யத் தேவையான அனைத்து தரவையும் இந்நிறுவனம் ஏற்கனவே இதில் பதிவேற்றியுள்ளது. குறிப்பாக, விக்கிப்பீடியாவின் உரைமூலம் உட்பட OpenAI -ஆல் தேர்ந்தெடுக்கப்பட்ட பிற உரைமூலங்களுடன் இணையத்தில் (Common Crawl எனப்படும் பொதுவில் கிடைக்கக்கூடிய தரவுத் தொகுப்பு) வலைவலம் செய்வதன் மூலம் சேகரிக்கப்பட்ட 570ரீதீ உரைமூலத் தகவல்களும் பதிவேற்றம் செய்யப்பட்டுள்ளன.
இத் தொழில்நுட்பத்தின் மூலம் உங்களின் கேள்விகளுக்கு, மிகவும் பயனுள்ள மறுமொழிகளை நீங்கள் எதிர்பார்க்கலாம். சுருக்கவுரைகளை உருவாக்குவது, கவிதை எழுதுவது போன்ற பணியை மேற்கொள்வதற்கான ஆணைகளை உள்ளிடுகையில் உங்களுக்கு சிறப்பான ஒரு சுருக்கவுரை அல்லது கவிதை கிடைக்கும்.
இன்னும் தொழில்நுட்ப ரீதியாகச் சொல்வதென்றால் இது மிகப்பெரிய செயற்கை நரம்பியல் வலையமைவாகவும் விவரிக்கப்படுகிறது – நான் அதை மேலும் கீழ்க்கண்டவாறு விவரிக்கிறேன்.
GPT-3-ஆல் என்னவெல்லாம் செய்ய முடியும்?
GPT-3-ஆல் மொழி அமைப்பைக் கொண்ட எதனையும் உருவாக்க முடியும் – அதாவது கேள்விகளுக்கு மறுமொழி கூறும், கட்டுரைகள் எழுதும், நீண்ட உரைகளைச் சுருக்கித் தரும், மொழிபெயர்க்கும், குறிப்புகள் எடுக்கும். கணினி குறியீட்டைக் கூட உருவாக்கும்.
இணையத்தில் கிடைக்கிற ஒரு செயல்முறை விளக்கத்தைப் பயன்படுத்தி செயலிகளை வடிவமைப்பதற்கு பரவலாகப் பயன்படுத்தப்படும் மென்பொருளான ஃபிக்மா செருகுநிரலின் (Plugin) மூலம் இன்ஸ்டாகிராம் செயலியைப் போலவே தோற்றமும் செயல்திறனும் கொண்ட ஒரு செயலியை உருவாக்கிவிட முடியும்.
நிச்சயமாக, இது மிகவும் புரட்சிகரமானது, மேலும் இது நீண்ட காலத்திற்கு பயன் படுத்தக் கூடியதாகவும் பயனுள்ளதாகவும் இருந்தால், எதிர்காலத்தில் மென்பொருள் மற்றும் செயலிகள் உருவாக்குவதில் இத்தொழில்நுட்பம் மாபெரும் தாக்கத்தை ஏற்படுத்தக்கூடும்.
பொதுமக்கள் பயன்பாட்டுக்கு இன்னும் இக்குறியீடு வராத காரணத்தால் (வந்தாலும்), தற்போது Open AI -ஆல் பராமரிக்கப்படும் API மூலம் தேர்ந்தெடுக்கப்பட்ட டெவலப்பர்களுக்கு மட்டுமே அணுகல் அனுமதி கிடைத்துள்ளது. இந்த ஆண்டு ஜூன் மாதம் முதல் API பயன்பாட்டுக்கு வந்ததிலிருந்து, கவிதை, உரைநடை, செய்தி அறிக்கைகள் மற்றும் படைப்பாற்றல் மிக்க புனைகதைகள் போன்றவற்றின் எடுத்துக் காட்டுகள் வெளிவந்துள்ளன.
GPT-3 எந்தத் தீங்கும் செய்யாது என்பதை மனிதர்களாகிய நம்மை நம்ப வைக்கும் முயற்சியை GPT-3 செய்வதைக் காணமுடிகிறது. ஒருவேளை தீயவர்கள் அப்படிச் செய்ய முயற்சித்தால் “மனித குலத்தை அழிப்பதை என்னால் தவிர்க்க முடியாது என்று எனக்குத் தெரியும்” என்று ஒப்புக்கொள்ள வேண்டிய கட்டாயத்தில் உள்ளது அதன் ரோபோட்டிக் நேர்மை.
GPT-3 எப்படி வேலை செய்கிறது?
செயற்கை நுண்ணறிவுப் செயலிகளின் பொதுவான வகைகளுக்குள் இது எங்கு பொருந்துகிறது என்று பார்த்தோமானல் GPT-3 என்பது ஒரு மொழி முன்கணிப்பு மாதிரி. இது உள்ளிடப்படுகிற ஒரு மொழியின் ஒரு பகுதியை எடுத்து, பயனருக்கு தேவையான மொழியாக அதை மாற்றும் வகையில் வடிவமைக்கப்பட்ட அல்காரிதமிக் கட்டமைப்பாகும்.
இதனை‘முன்-பயிற்சிக்கு’ உட்படுத்துவதற்குப் பயன்படுத்தப்பட்ட பரந்து விரிந்த உரைமூலங்களின் மீது மேற்கொள்ளப்பட்ட பயிற்சி-பகுப்பாய்விற்கு நன்றி சொல்லியேயாக வேண்டும். மற்ற அல்காரிதங்களைப் போலல்லாமல், செப்பமற்ற மூல நிலையிலேயே மொழிகள் எவ்வாறு கட்டமைக்கப் படுகின்றன என்பதைப் புரிந்து கொள்வதற்கு GPT-3 க்கு தேவையான பெரிய அளவிலான கணக்கீட்டு வளங்களை Open AI ஏற்கனவே செலவிட்டுள்ளது. இந்நிலையை அடைவதற்குத் தேவையான கணக்கீட்டு நேரம் $4.6 மில்லியன் செலவாகும் என்று Open AI கூறுகிறது.
வாக்கியங்கள் போன்ற மொழி கட்டமைப்பை எப்படி உருவாக்குவது என்பதை அறிந்துகொள்ள, சொற்பொருள் பகுப்பாய்வுகளைப் (Semantic Analysis) பயன்படுத்துகிறது – சொற்கள் மற்றும் அவற்றின் பொருளை மட்டும் ஆராய்வது மட்டுமல்லாமல், உரையில் பயன்படுத்தப்படும் பிற சொற்களைப் பொறுத்து சொற்களின் பயன்பாடு எவ்வாறு வேறுபடுகிறது என்பதைப் பற்றிய புரிதலையும் சேகரிக்கிறது.
இது மேற்பார்வையிடப்படாத கற்றல் எனப்படும் இயந்திரக் கற்றலின் ஒரு வடிவமாகும். ஏனெனில், பயிற்சித் தரவுகளில் மேற்பார்வையிடப்பட்ட கற்றலில் உள்ள ‘சரி’ அல்லது ‘தவறான’ மறுமொழி என்ன என்பது குறித்த எந்தத் தகவலும் இல்லை, நிகழ் தகவைக் கணக்கிடுவதற்குத் பயனருக்குத் தேவையான அனைத்துத் தகவல்களும் பயிற்சி உரைகளிலிருந்தே சேகரிக்கப்படுகிறது.
சொற்கள் மற்றும் வாக்கியங்களின் பயன்பாட்டை ஆராய்ந்தும், அவற்றைப் பிரித்து மீண்டும் உருவாக்க முயற்சிக்கிறது.
எடுத்துக்காட்டாக, பயிற்சியின் போது, “அந்த வீட்டில் ஒரு சிவப்பு கதவு உள்ளது” என்ற சொற்றொடரை அல்காரிதம்கள் எதிர்கொள்கின்றன என்று வைத்துக் கொள்வோம். ஆனால் அதன் பிறகு விடுபட்ட சொல் ஒன்றைச் சேர்த்து உள்ளிடும்போது “வீட்டில் சிவப்பு X உள்ளது.” என்று மீண்டும் மறுகட்டமைக்கிறது.
மொழியில் அதன் பொருள் ஒழுங்கமைக்கப்பட்ட, நூற்றுக்கணக்கான பில்லியன் சொற்களை உள்ளடக்கி, அதன் பயிற்சித் தரவில் உள்ள அனைத்து உரைகளையும் ஸ்கேன் செய்து கொண்டு சரியான சொற்றொடரை மீண்டும் உருவாக்க எந்தெந்த சொற்களைப் பயன் படுத்த வேண்டும் என்பதை தீர்மானிக்கிறது.
துவக்கத்தில் மில்லியன் கணக்கான முறையில் தவறிழைத்தாலும் இறுதியில், அது சரியான சொற்களுடன் கட்டமைந்து விடும். அதன் அசல் உள்ளீட்டுத் தரவைச் சரிபார்ப்பதன் மூலம், வெளியிடப்படுகிற சொற்கள் சரியாக இருப்பதை அறிந்து கொள்ளூம். மேலும் தக்க மறுமொழியை வழங்கிய அல்காரித செயல்முறைக்கு “weight (மதிப்பு)” வழங்கப்படும். எதிர்காலத்தில் சரியான மறுமொழியுடன் வரக்கூடிய முறைகள் என்னென்ன என்பதை இத்தொழில் நுட்பம் படிப்படியாகக் “கற்றுக் கொள்ளும்”.
இதுவரை உருவாக்கப்பட்ட செயற்கை நரம்பியல் வலையமைப்புக்களிலேயே மிகப்பெரிய வலையமைப்பாக GPT-3-ஐத் தனித்துக் காட்டுவது, இடத்துக்குத் தகுந்தாற்போல மாற்றிக் கொள்ளக்கூடிய இத்தகைய ‘வெயிட்டிங்’ செயல்முறையின் அளவுதான். இதைப் போன்ற மொழி கணிப்புக்கான மின்மாற்றி மாதிரிகள் பல ஆண்டுகளாக உபயோகத்தில் இருந்து வருவதால், இத் தொழில் நுட்பத்தில் புதிதாக எதுவும் இல்லை என்றும் குறிப்பிட்டுச் சொல்லப்படுகிறது. எது எவ்வாறாயினும், அல்காரிதம் அதன் நினைவகத்தில் உள்ள ”இடத்திற்குத் தகுந்தாற்போல” மாறுகின்ற ‘வெயிட்’களின் எண்ணிக்கையும் ஒவ்வொரு வினவலையும் செயலாக்கப் பயன்படுத்தும் எடைகளின் எண்ணிக்கையும் 175 பில்லியன் ஆகும். இது அதன் சக போட்டியாளர் NVidia தயாரித்த தொழில் நுட்பத்தை விட பத்து மடங்கு அதிகம்.
GPT-3 இல் உள்ள சில பிரச்சனைகள் என்ன?
GPT-3-இன் மொழியை உருவாக்கும் திறன் செயற்கை நுண்ணறிவு துறையிலேயே இதுவரை காணப்படாத சிறப்பான ஒன்று எனப் பாராட்டப் படுகிறது. இருப்பினும் சில முக்கியமான பிரச்சனைகளையும் பரிசீலிக்க வேண்டியுள்ளது.
“GPT-3-ன் மிகைத்திறன் (hype) மிகவும் அதிகமானது. செயற்கை நுண்ணறிவு உலகையே மாற்றப்போகின்ற ஒன்று, ஆனால் GPT-3 என்பது ஒரு துவக்கக் காட்சி மட்டுமே” என OpenAI-இன் சி.இ.ஓ. சாம் ஆல்ட்மேன் தெரிவித்துள்ளார்.
முதலாவதாக, அதன் செயல்பாட்டைச் நடைமுறைப்படுத்துவதற்கு அதிக அளவு கணினி ஆற்றல் தேவைப்படுவதால், இப்போதைக்கு இத் தொழில் நுட்பம் மிகவும் விலையுயர்ந்ததாகக் கருதப்படுகிறது. இதன் பொருள் – இதைப் பயன்படுத்துவதற்கான செலவு சிறிய நிறுவனங்களின் நிதி ஒதுக்கீட்டிற்கு அப்பாற்பட்டதாக இருக்கும் என்பதே.
இரண்டாவதாக, இது ஒரு வெளிப்படைத் தன்மையற்ற அல்லது கருப்பு-பெட்டி போன்ற அமைப்பாகும். OpenAI அதன் அல்காரிதம்கள் எவ்வாறு செயல்படுகின்றன என்பது பற்றிய முழு விவரங்களையும் வெளியிடவில்லை, எனவே கேள்விகளுக்கு மறுமொழியிடவோ, பயனுள்ள விளைப்பயன்களை நம்பியிருக்கும் எவரும், அவை எவ்வாறு உருவாக்கப்பட்டன என்பதை முழுமையாகவோ உறுதியாகவோ சொல்லிவிட முடியாது.
மூன்றாவதாக, கணினியின் இறுதி விளைப்பயன் இன்னும் முழு நிறைவானதாக இல்லை. GPT-3-ஆல் சிறிய உரைமூலங்கள் அல்லது அடிப்படை பயன்பாடுகளை உருவாக்குவது போன்ற பணிகளை எளிதாகக் கையாள முடிகிறது என்றாலும், நீண்ட அல்லது மிகவும் சிக்கலான உரை ஒன்றை உருவாக்குவதற்கான ஆணைகள் உள்ளிடப்படும்போது அதன் இறுதி விளைபொருள் அத்தனை பயனுள்ளதாக இல்லை (உண்மையில், “பொருளற்ற உளறல் மொழி”யாக உள்ளது எனக் குறிப்பிடப் படுகிறது).
கணிப்பொறியாற்றலின் விலை தொடர்ந்து வீழ்ச்சியடையக்கூடும் என்ற எதிர்பார்ப்பும், செயற்கை நுண்ணறிவு இயங்குதளங்களின் வெளிப்படைத்தன்மை குறித்த தர-நிர்ணயம் நிறுவப்பட்டுள்ள நிலையும், அதிகரித்து வரும் தரவுகளின் அளவுகளுடன் அல்காரிதம்கள் நன்றாக வடிவமைக்கப்பட்டுள்ளன என்கிற செய்தியும் இத்தகைய பிரச்சனைகள் காலப்போக்கில் சரிசெய்யப்படும் என்று எதிர்பார்க்கலாம் என்பது தெளிவாகிறது.
மொத்தத்தில், GPT-3-ஆனது செயற்கை நுண்ணறிவு துறையில் நாம் முன்பு கண்ட முன்னேற்றத்தின் எல்லைகளையும் தாண்டிய பாய்ச்சலாக இருக்கிறது என்கிற தெளிவான முடிவுக்கு வரமுடிகிறது. செயற்கை நுண்ணறிவு மொழியின் விளைபயன்களைக் கண்ணுற்ற எவருக்கும் அவை மாறுபடுகிற மதிப்புக்களை உடையவை என்பது தெரியும். மேலும் GPT3-இன் விளைபயன்கள் மறுக்க முடியாதபடிக்கு ஒரு படி முன்னேற்றம் அடைந்துள்ளது என்பதும் தெளிவாகிறது. இத்தொழில்நுட்பம் அனைவரது கைகளுக்கும் சென்று சேர்ந்து பொதுமக்களின் பயன்பட்டுக்கு தக்கதாக மாறும்பொழுது அதன் செயல்பாடு மேலும் முத்திரை பதிப்பதாக இருக்கும்.
*Bernard Marr (பெர்னார்ட் மார்): உலகப் புகழ்பெற்ற எதிர்காலவியல் வல்லுநர். வணிகம் மற்றும் தொழில்நுட்பத் துறைகளில் தாக்கத்தை ஏற்படுத்தக்கூடிய செல்வாக்குள்ளவர், மனித குலத்தின் நன்மைக்காக தொழில்நுட்பத்தைப் பயன்படுத்துவதில் ஆர்வம் கொண்ட கருத்தியல் தலைவர். அவர் எழுதிய 20 புத்தகங்களும் புகழ் பெற்றவை. ஃபோர்ப்ஸ் இதழுக்குத் தொடர்ந்து பத்திகள்/கட்டுரைகள் எழுதுவதோடு உலகின் பல சிறந்த புகழ்பெற்ற நிறுவனங்களுக்கு ஆலோசனையும் பயிற்சியும் அளித்து வருகிறார். சமூக ஊடகங்களில் 2 மில்லியனுக்கும் அதிகமானோர் இவரைப் பின்தொடர்கின்றனர். இவரது செய்தி மடலுக்கு ஒரு மில்லியன் சந்தாதாரர்கள் உள்ளனர். வணிக உலகில் சிறந்த செல்வாக்கு செலுத்துகிற முதல் ஐவரில் ஒருவராகவும், இங்கிலாந்தில் முதலிடத்திலும், லிங்க்ட்-இன் நிறுவனம் வரிசைப்படுத்தியுள்ளது.
நன்றி: Forbes, அக்டோபர் 5, 2020
***
தமிழ் நவீன இலக்கியத் தளத்தில் செயல்பட்டுக்கொண்டிருக்கும் ரேவதி முகில், முதன்மையாக கவிஞர் மற்றும் மொழிபெயர்ப்பாளர். “எலக்ட்ரா” என்ற பெயரில் சமீபத்தில் வெளிவந்திருக்கும் இவரது கவிதைத் தொகுப்பு, அதன் நவீன தொன்மம் சார்ந்த உளளடக்கத்திற்காக பெரும் கவனம் பெற்றது. உன்னதம் ” மிலோராட் பாவிச்” சிறப்பிதழில், மிகச் சவாலான மொழிநடை கொண்ட அவரது நாவலிலிருந்து ஒரு அத்தியாயத்தை மிகச் சிறப்பாக மொழிபெயர்த்துள்ளார். மேலும் பல்வேறு சிற்றிதழ்களில் இவரது மொழிபெயர்ப்புகளும் கவிதைகளும் வெளியாகி உள்ளன.