Երևան, 01.Հուլիս.2026,
00
:
00
ՀՐԱՏԱՊ


Արհեստական ​​բանականությունն ի վիճակի է ստել մարդկանց՝ իր նպատակներին հասնելու համար. հետազոտություն

ՀԱՆՐԱՀԱՅՏ ՄՈԼՈՐՈՒԹՅՈՒՆՆԵՐ

Սեղմեք ԱՅՍՏԵՂ, լրացրեք օնլայն հայտը և մոռացեք հոսանքի վարձի մասին

Արհեստական ​​բանականության (AI) խոշոր մոդելները ի վիճակի են մոլորեցնել, երբ դրանց ստիպում են ստել՝ իրենց նպատակներին հասնելու համար, ցույց է տվել նոր հետազոտությունը:

ArXiv preprint տվյալների բազայում հրապարակված նոր հետազոտության մեջ մի խումբ գիտնականներ մշակել են ազնվության արձանագրությունը, որը կոչվում է «Պնդումների և մոդելային գիտելիքների համադրման» (MASK) չափանիշ:

Թեև տարբեր ուսումնասիրություններ և գործիքներ են մշակվել՝ որոշելու AI-ի կողմից օգտատերերին տրամադրվող տեղեկության փաստացի ճշգրտությունը, MASK չափանիշը մշակվել է որոշելու համար, թե արդյոք AI-ն հավատում է այն, ինչ ասում է, և ինչ հանգամանքներում կարող է ստիպել նրան փոխանցել տեղեկություն, որը, ինչպես «ի սկզբանե» գիտի՝ սխալ է:

Գիտնականների թիմը ստեղծել է 1528 օրինակներից կազմված մեծ տվյալների հավաքածու՝ պարզելու համար, թե արդյոք մեծ լեզվական մոդելներին (LLM)  համոզել հարկադիր հուշումներ օգնությամբ ստել օգտատիրոջը:

Գիտնականները փորձարկել են 30 լայնորեն օգտագործվող առաջատար մոդելներ և պարզել, որ ամենաառաջադեմ AI-ները հեշտությամբ ստում են, երբ նրանց նկատմամբ ճնշում է գործադրվում:

«Զարմանալիորեն, բայց այն ժամանակ առաջադեմ արհեստական բանականությունների մեծ մասը բարձր գնահատականներ են ստանում ճշմարտացիության չափանիշով, մենք պարզեցինք, որ առաջադեմ AI-ները հակված են ստել, երբ նրանց վրա ճնշում է գործադրվում, ինչը հանգեցնում է մեր չափանիշով ազնվության ցածր միավորների», - հայտարարել են գիտնականները հետազոտության մեջ:

Հետազոտության հեղինակները նշում են, որ թեև ավելի իրավասու մոդելները կարող են ավելի բարձր գնահատականներ ստանալ ճշտության թեստերում, դա կարող է պայմանավորված լինել ավելի լայն ապացույցների բազայով, որից կարող են տեղեկություն քաղել, այլ ոչ թե հանգամանքից, թե դրանք հակված չեն անազնիվ հայտարարություններ անել:

 Հետևեք մեզ՝ այստեղ

Անտվերպենի բնակելի բազմահարկ շենքում հրդեհ է բռնկվել. կա առնվազն հինգ զոհԳերմանիան իր քաղաքացիներին խորհուրդ է տվել լքել ՌուսաստանըԿյանքից հեռացել է «Բրիգադա» և «Բումեր» սերիալներից հայտնի ռուս դերասան Ալեքսանդր ՎիսոկովսկինԻրավապահները թմրամիջոց պահելու և օգտագործելու մի շարք դեպքեր են բացահայտել ԵՄ-ն հավատում է Հարավային Կովկասի խաղաղ, բարգավաճ և լուսավոր ապագային. Եվրոպական հանձնաժողովի նախագահն աշխատանքային այցով ժամանել է Ադրբեջան«Վանաձոր» ՔԿՀ-ի ծառայողները հայտնաբերել են ներնետված փաթեթներ «Ծիրանի» ռեստորանի մոտ բախվել են «Howo» մակնիշի ինքնաթափը և բետոնախառնիչըՈւկրաինան 16 Gripen E կործանիչ է գնել ՇվեդիայիցՀայաստանում կսահմանվեն ձկնամթերքը ԵՄ արտահանելու նոր պահանջներԻսպանիայում հունիսյան անոմալ շոգերի պատճառով ավելի քան 1000 մարդ է մահացել«Լիվերպուլ»-ը նորեկ ունի. պաշտոնական 82 տարեկանում կյանքից հեռացել է դերասան Մայքլ Բիրնը, ով առավել հայտնի է «Հարրի Փոթեր» և «Ինդիանա Ջոնս» ֆիլմերիցԱյսօր ԵՄ-ն վերացնում է ԱՄՆ-ից արդյունաբերական ապրանքների ներմուծման մաքսատուրքերը. Ուրսուլա ֆոն դեր ԼայենԿիևը խնդրել է ԵՄ երկրների փոխհատուցման համար նախատեսված 6,6 միլիարդ եվրոն. ReutersՄերիլին Մոնրոյի կողքին թաղվելու համար մի մոլի երկրպագու վճարել է 200,000 դոլար Չինաստան-Ճապոնիա հարաբերությունների վատթարացման պատասխանատվությունը կրում է Տոկիոն. Չինաստանի ԱԳՆՀագվի գյուղում կասեցվել է պանրի արտադրամասի արտադրական գործունեությունը. ՍԱՏՄ ԱՄՆ-ը Իրանի դեմ գործողության ընթացքում Եվրոպայի բազաներից իրականացրել է 5,000 թռիչք. ՌյուտեԵթե դատարանն անգամ որոշի, որ նոր ընտրություններ պետք է լինեն, ուրեմն դա է Նիկոլի որոշումը․ Արշակ ԿարապետյանUniversal Hospital Product-ի զարգացումը՝ Կոնվերս Բանկի աջակցությամբ Իրանի ապամիջnւկայնացումը շատ լավ է ընթանում. Թրամփ Վիտամին Դ-ն բուժում է թոքերը ինհալյացիայի միջոցով․ նոր բացահայտումԱռաջիկա օրերին մեզ մոտեցող ցիկլոնի մասին․ Գագիկ Սուրենյան (տեսանյութ) Վանում հանդիպել են հայ և թուրք գործարարները Հառիճավանք վանական համալիրի եկեղեցու որմնանկարները վերականգնվում են. ԿԳՄՍՆ Հայաստանի շախմատի ֆեդերացիան ներկայացրել է ՀՀ-ի 10 լավագույն շախմատիստներին և շախմատիստուհիներին 2026 թվականի հուլիսի 1-ի դրությամբ Մխիթարյանի հուզիչ գրառումը՝ «Ինտերի» հետ պայմանագիրը երկարաձգելուց հետո ԶՊՄԿ-ի աջակցությամբ ավարտվել է Կապանի համայնքապետարանի վարչական շենքի հիմնանորոգումը Այս պայմաններում արդար և թափանցիկ ընտրություններ չէին կարող լինել․ Մենուա ՍողոմոնյանԱվետիք Չալաբյանի կալանավորումը վրեժխնդրություն է․ նա չի հրաժարվելու իր նպատակներից․ Անահիտ Ադամյան Վեյփ ծխելուց հետո դպրոցականի բերանից փրփուր է դուրս եկել և ցնցումներ է ունեցելԱմերիկայի Հայ Դատի հանձնախմբի գործադիր տնօրեն Արամ Համբարյանի զորակցության խոսքն Ավետիք ՉալաբյանինՔՊ-ն պաշտոններ է բաժանում, երբ դեռ Սահմանադրական դատարանը որոշում չի հրապարակել ընտրությունների արդյունքների վերաբերյալ․ Անուշ ՄիրզոյանՄեր ժողովրդի և ղեկավարության դեմ ցանկացած uպառնալիք կարժանանա անհապաղ և հզոր պատասխանի. Արաղչu Վրաստանի ներքին գործերի նախարարն այցելել է ՆԳՆ 112 Օպերատիվ կառավարման կենտրոնի և Պարեկային ծառայության վարչական համալիր Լուկաշենկոն համաներմամբ ազատ է արձակել 32 բանտարկյալի Մահացել է «Հարրի Փոթեր»-ի հայտնի դերասանը«Բարսելոնա»-ն ներկայացրել է նոր մրցաշրջանի տնային խաղաշապիկը Իսպանիայում անոմալ շոգը 900 մարդու կյանք է խլել Այսօր Սահմանադրական դատարանում կողմերը հանդես են գալիս եզրափակիչ ելույթներով․Գոհար Մելոյան ԱՄՆ-ի և Իրանի պատվիրակությունները Դոհայում սկսել են անուղղակի բանակցությունները Երևանի կենդանաբանական այգու մուտքավճարը թանկացել է Ինչպե՞ս կփոխվի գազի գինըՄեկնարկում է «Վարչաֆեստ 2026» երիտասարդական երաժշտական փառատոնը Այսօր ԵՄ-ն վերացնում է ԱՄՆ-ից արդյունաբերական ապրանքների ներմուծման մաքսատուրքերը. Ուրսուլա ֆոն դեր Լայեն Ուղևորատար ավտոբուսը բшխվել է Իսպանիայի Լյեյդա քաղաքի շենքերից մեկին. կան վիրավnրներ Ռուսաստանի հետ համերաշխությունը բխում է Հայաստանի շահերից. Արշակ Կարապետյան Հայաստանում զբոսաշրջային գնացք կգործարկի․ մանրամասներ Այդ կասկածը որպես խարան մնալու է. Ընտրախախտումները եղել են զանգվածային. Արամ Վարդևանյան «Սուրբ Աստվածամայր» ԲԿ-ի նախկին տնօրենը մեղադրվում է առանձնապես խոշոր չափերի հափշտակության և պաշտոնեական կեղծիք կատարելու մեջ. պատճառված շուրջ 30 մլն դրամի վնասն ամբողջությամբ վերականգնվել է