Ինչ է InstructGPT-ն և հիմնական տարբերությունները ChatGPT-ից

InstructGPT-ը OpenAI-ի GPT-3 մոդելի կատարելագործված կրկնությունն է, որը հմտորեն ճշգրտված է՝ օգտվողի հրամաններն ավելի լավ ընկալելու և կատարելու համար՝ միաժամանակ արտադրելով ավելի էթիկական, ճշգրիտ և մարդկային մտադրություններին ներդաշնակ արդյունքներ: Այս առաջընթացը նշանակում է զգալի առաջընթաց AI մոդելների էվոլյուցիայում՝ դրանք ուղղորդելով դեպի ավելի պատասխանատու և էթիկական ներդաշնակ փոխազդեցություններ: InstructGPT-ն հիմնված է վերնագրված հետազոտական ​​հոդվածի վրա «Ուսուցման լեզուների մոդելներ՝ հետևելու հրահանգներին» և դրա պաշտոնական էջը OpenAI-ում այստեղ է:

Չնայած երկուսն էլ InstructGPT և ChatGPT-ն են մշակվել է OpenAI-ի և այս երկու մոդելներն են հիմնված է GPT (Generative Pre-trained Transformer) ճարտարապետության վրա , դրանք տարբերվում են մեթոդաբանություններ, նպատակները և վերապատրաստման մոտեցումներ.

Հայեցակարգային շրջանակ

ChatGPT. Հիմնականում նախագծված որպես խոսակցական գործակալ, ChatGPT-ն գերազանցում է մարդունման տեքստային պատասխաններ ստեղծելով: Այն մանրակրկիտ մշակված է վերահսկվող և ամրապնդող ուսուցման տեխնիկայի խառնուրդի վրա՝ շեշտը դնելով խոսակցական առաջադրանքների վրա:

InstructGPT. Թեև հիմնված է նաև GPT ճարտարապետության վրա, InstructGPT-ը հատուկ ճշգրտված է հրահանգներին ավելի արդյունավետ հետևելու համար: Այն նշում է մոդելի պատասխանները օգտատիրոջ մտադրությանը համապատասխանեցնելու ուղղությամբ՝ ընդգծելով դրա արդյունքների ճշգրտությունն ու համապատասխանությունը:

Ուսուցման մեթոդիկա

ChatGPT. Օգտագործում է մարդու հետադարձ կապից (RLHF), վերահսկվող ճշգրտման և շարունակական ուսուցման գործընթացի համադրություն, որը ներառում է օգտատերերի հետ փոխգործակցություն և հետագա թարմացումներ:

InstructGPT. Ներառում է վերապատրաստման նոր ռեժիմ, որը ներառում է մարդու կողմից գրված ցուցադրություններ և նախասիրություններ: Այն օգտագործում է վերահսկվող ճշգրտում (SFT), որին հաջորդում է հետագա կատարելագործումը, օգտագործելով մարդու հետադարձ կապից (RLHF) ամրապնդման ուսուցումը՝ շեշտը դնելով մարդու հրահանգների և մտադրությունների հետ համապատասխանեցման վրա:

Ֆունկցիոնալ նպատակներ

ChatGPT. նպատակն է առաջացնել համահունչ, համատեքստային համապատասխան և գրավիչ երկխոսություն՝ անդրադառնալով խոսակցական թեմաների լայն շրջանակին՝ պահպանելով փոխգործակցության բնական հոսքը:

InstructGPT. Կենտրոնանում է մի շարք հրահանգների ճշգրիտ մեկնաբանման և կատարման վրա՝ ձգտելով արտադրել արդյունքներ, որոնք ոչ միայն համապատասխան են համատեքստում, այլև սերտորեն կառչում են օգտագործողի կողմից տրված հատուկ ուղեցույցներին:

Կատարողականություն և հնարավորություններ

ChatGPT. Ցույց է տալիս խոսակցական հզոր ունակություններ, որոնք կարող են երկար և բարդ երկխոսություններ վարել տարբեր տիրույթներում, բայց միշտ չէ, որ սերտորեն համընկնում են օգտատիրոջ հատուկ հրահանգների հետ:

InstructGPT. Ցուցաբերում է զգալի բարելավում հատուկ հրահանգներին հետևելու հարցում՝ տրամադրելով արդյունքներ, որոնք ավելի համահունչ են օգտատերերի հարցումներին, նույնիսկ այն առաջադրանքների դեպքում, որոնք ավելի քիչ խոսակցական են և ավելի ուղղորդիչ բնույթ ունեն:

Գնահատում և չափումներ

ChatGPT. Գնահատվում է հիմնականում գրավիչ և համատեքստային համապատասխան խոսակցություններ պահպանելու ունակության հիման վրա՝ չափիչներով, որոնք հաճախ կենտրոնացած են երկխոսության համահունչության, սահունության և օգտատերերի ներգրավվածության շուրջ:

InstructGPT. Գնահատվում է օգտատիրոջ հրահանգներին համապատասխանության և կատարման հիման վրա՝ շեշտը դնելով կոնկրետ առաջադրանքների հետ կապված իր պատասխանների ճշգրտության, համապատասխանության և օգտակարության վրա:

Ամփոփում

Ամփոփելով, թեև երկու մոդելներն էլ ընդհանուր հիմք ունեն GPT ճարտարապետության մեջ, InstructGPT-ն ներկայացնում է կենտրոնացված էվոլյուցիա՝ ավելի լավ հասկանալու և օգտագործողի հրահանգները կատարելու ուղղությամբ՝ առանձնացնելով այն ավելի խոսակցական ChatGPT-ից: Այս փոփոխությունն ընդգծում է OpenAI-ի հանձնառությունը՝ բարելավելու լեզվական մոդելների գործնական օգտակարությունը և օգտագործողների փորձը իրական աշխարհի հավելվածներում:

Պատկերի աղբյուր ՝ Shutterstock

Աղբյուր՝ https://blockchain.news/analysis/what-is-instructgpt-and-key-differences-from-chatgpt