Երևան, 27.Մարտ.2026,
00
:
00
ՀՐԱՏԱՊ


Արհեստական ​​բանականությունն ի վիճակի է ստել մարդկանց՝ իր նպատակներին հասնելու համար. հետազոտություն

ՀԱՆՐԱՀԱՅՏ ՄՈԼՈՐՈՒԹՅՈՒՆՆԵՐ

Սեղմեք ԱՅՍՏԵՂ, լրացրեք օնլայն հայտը և մոռացեք հոսանքի վարձի մասին

Արհեստական ​​բանականության (AI) խոշոր մոդելները ի վիճակի են մոլորեցնել, երբ դրանց ստիպում են ստել՝ իրենց նպատակներին հասնելու համար, ցույց է տվել նոր հետազոտությունը:

ArXiv preprint տվյալների բազայում հրապարակված նոր հետազոտության մեջ մի խումբ գիտնականներ մշակել են ազնվության արձանագրությունը, որը կոչվում է «Պնդումների և մոդելային գիտելիքների համադրման» (MASK) չափանիշ:

Թեև տարբեր ուսումնասիրություններ և գործիքներ են մշակվել՝ որոշելու AI-ի կողմից օգտատերերին տրամադրվող տեղեկության փաստացի ճշգրտությունը, MASK չափանիշը մշակվել է որոշելու համար, թե արդյոք AI-ն հավատում է այն, ինչ ասում է, և ինչ հանգամանքներում կարող է ստիպել նրան փոխանցել տեղեկություն, որը, ինչպես «ի սկզբանե» գիտի՝ սխալ է:

Գիտնականների թիմը ստեղծել է 1528 օրինակներից կազմված մեծ տվյալների հավաքածու՝ պարզելու համար, թե արդյոք մեծ լեզվական մոդելներին (LLM)  համոզել հարկադիր հուշումներ օգնությամբ ստել օգտատիրոջը:

Գիտնականները փորձարկել են 30 լայնորեն օգտագործվող առաջատար մոդելներ և պարզել, որ ամենաառաջադեմ AI-ները հեշտությամբ ստում են, երբ նրանց նկատմամբ ճնշում է գործադրվում:

«Զարմանալիորեն, բայց այն ժամանակ առաջադեմ արհեստական բանականությունների մեծ մասը բարձր գնահատականներ են ստանում ճշմարտացիության չափանիշով, մենք պարզեցինք, որ առաջադեմ AI-ները հակված են ստել, երբ նրանց վրա ճնշում է գործադրվում, ինչը հանգեցնում է մեր չափանիշով ազնվության ցածր միավորների», - հայտարարել են գիտնականները հետազոտության մեջ:

Հետազոտության հեղինակները նշում են, որ թեև ավելի իրավասու մոդելները կարող են ավելի բարձր գնահատականներ ստանալ ճշտության թեստերում, դա կարող է պայմանավորված լինել ավելի լայն ապացույցների բազայով, որից կարող են տեղեկություն քաղել, այլ ոչ թե հանգամանքից, թե դրանք հակված չեն անազնիվ հայտարարություններ անել:

 Հետևեք մեզ՝ այստեղ

Ես ավարտեցի կարիերաս, քանի որ չէի ցանկանում հասնել այն կետին, երբ ֆիզիկական խնդիրների պատճառով ինձ վատ կզգայի․ Տոնի Կրոս ԱՄՆ նախագահ Դոնալդ Թրամփը մեկ տարով երկարացրել է Ռուսաստանի դեմ պատժամիջոցները Քարաթափում է տեղի ունեցել Սիսիան-Լծեն-Տաթև ավտոճանապարհին․ երթևեկությունը դարձել է միակողմանի Նվազագույն գնահատականով՝ ամերիկյան կողմը 600-800 զոհ ունի. Իրանի զինված ուժեր Միջնորդ երկրներն Իրանից ազդանշաններ են փոխանցում. նեղուցներով էներգիա է հոսում. Մարկո Ռուբիո Հայհիդրոմետի տնօրենը գրում է «Ասում են՝ եթե հայրենասեր եք, ձեր երեխաները ինչու Հայաստանում չեն ծնվել»․ Սիրուշոն կիսվել է իր տեսակետով Հայաստանում տարեցների և երեխաների մի շարք կենտրոններ կմիավորվեն Ամբողջ օրը չեն դադարել «Հեզբոլլահի» և իրանական հրթիռային հարվածներն Իսրայելի ուղղությամբ. ՑԱԽԱԼ «Արևմտյան Ադրբեջան» թեզի գաղափարը Ալիեւին տվել է Փաշինյանը. Իսագուլյան Բացահայտվել են բեռնատարներից կատարված գողությունները․ երկու եղբայրները ձերբակալվել են Հայաստան-ԵՄ՝ պատմության մեջ առաջին գագաթնաժողովը տեղի կունենա մայիսի 4-5-ը Երևանում. ԵԽ նախագահ Ոչ ոք չի կարող Իրանին և իրանցիներին վերջնագիր ներկայացնել․ Ղալիբաֆ Օդի ջերմաստիճանը կնվազի․ եղանակն՝ առաջիկա օրերին ՖԻՖԱ-ն նախատեսում է մի շարք փոփոխություններ կատարել աշխարհի 2026 թվականի առաջնության կանոններում Վլադիմիր Պուտինի ուղերձները և ռուս ժողովրդի աջակցությունը մեզ ոգեշնչում են այս պшտերազմում․ Փեզեշքիանը շնորհակալություն է հայտնել Ռուսաստանին Գրոսմայստեր Հայկ Մարտիրոսյանը հաղթող է դարձել «19th Agzamov Memorial» շախմատի միջազգային մրցաշարում Պահեստազորայինների վնաuվածք ստանալու դեպքի առթիվ նախաձեռնված քրեական վարույթի շրջանակում վարժական հավաքի զորակոչված անձը ձերբակալվել է․ ՔԿ Խուզարկություններ են կատարվել մայրաքաղաքի 20 հասցեներում. 10 անձ ձերբակալվել է Զգոն եղեք․ Մարտի 27-28-ը Սյունիքում, Վայոց ձորում, Լոռիում և Տավուշում կանխատեսվում է առատ տեղումներ և գետերի ջրի ելքերի մեծացում Առողջության ապահովագրությամբ և օֆերտայի սկզբունքով պացիենտներին ամբողջովին անվճար տրամադրում է 12 անուն հակացնցումային դեղ. ԱՆ Անկարողությունից ծնված սխալը հաճախ ավելի վտանգավոր է, քան ինքնին հանցագործությունը. Թաթոյան Դանակահարվածները վարժական հավաքի մասնակիցներ են, կա ձերբակալված. մանրամասներ Ջուր հավաքեք. ջուր չի լինելու TOON EXPO-ի շրջանակում կարող եք ստանալ 1% idcoin․ Idram&IDBankԻրանը որպես նվեր թույլ է տվել 10 նավթատար լցանավերի անցնել Հորմուզի նեղուցով. Թրամփ Կապահովվի անհատական և հրապարակային ծանուցումների պատշաճ իրականացում. կներդրվի «hartak.am» համակարգը Դանակահարություն. 3 զինծառայող հոսպիտալացվել է Արագածոտնի մարզում բախվել են «Opel»-ն ու «Ford Transit»-ը Իրանն է խնդրում գործարք կնքել, ոչ թե մենք․ Թրամփ ԱՄՆ-ն Պակիստանի միջոցով Իրանին է փոխանցել 15 կետից բաղկացած առաջարկ, որը կարող է հիմք հանդիսանալ խաղաղության համաձայնագրի համար․ Ուիթքոֆ Սպասվում են կարևոր հանդիպումներ․ Զելենսկին ժամանել է Սաուդյան Արաբիա Ճապոնիայի ափերի մոտ 5.9 մագնիտուդով երկրաշարժ է տեղի ունեցել Պարսից ծոցի համագործակցության խորհուրդը չի մասնակցի Իրանի դեմ ռազմական գործողություններին․ ՊՀԽ գլխավոր քարտուղար Մեկնարկել է Հայաստան-Բելառուս ֆուտբոլային խաղի տոմսերի վաճառքը Դեղերի մաֆիա․ ինչու՞ են Հայաստանում երեք անգամ թանկ դեղերը Վրաստանի համեմատ․ Հրայր ԿամենդատյանԼրագրողը հայտարարել է, որ Կիլիան Մբապեն ստել է՝ ասելով, թե իսպանական ակումբի բժիշկներն իր վնասվածքը բուժելիս սխալ թույլ չեն տվել Գորիսեցի փոքրիկի և Նարեկ Կարապետյանի գրկախառնությունըԻրանը միջնորդների միջոցով ուղարկել է ԱՄՆ-ի առաջարկած 15 կետերի պատասխանը Խուզարկություններ են կատարվել մայրաքաղաքի 20 հասցեներում․ հայտնաբերվել է թմրանյութերի արտադրամաս, զենք-զինամթերք. կան ձերբակալվածներ. ոստիկանություն (տեսանյութ) Մարտի 26-ին և 27-ին imID համակարգը կլինի հասանելի․ ՊԵԿ ԱՄՆ Կոնգրեսը ցանկանում է արգելել սպորտային և քաղաքական խաղադրույքները. Axios Ա Սերիա․ Ամսվա լավագույն ֆուտբոլիստի մրցանակի հավակնորդները Հարատև հայկական պետությունը ապահովում է մեր՝ հայերիս, շահերը․ Ավետիք Չալաբյան Իսրայելը օկnւպացնում է Լիբանանը․ Էրդողան Օրենք -ի հակառակ կողմը. Ատոմ Մխիթարյան«Հայֆիլմ» կինոստուդիայի կառավարումը կփոխանցվի ԿԳՄՍՆ–ինՉեղարկված չվերթների փոխհատուցման կարգը դեռ մշակման փուլում է. ԱԳՆ Քաղաքապետարանն անդրադարձել է «Կանազ» մշակույթի տան հրդեհին Ադրբեջանցի է պայթել ականի վրա Ակնայում