GPT-4، آخرین نسخه چت ربات هوش مصنوعی (AI)، ChatGPT، میتواند در آزمونهای دبیرستان و آزمونهای دانشکده حقوق با رتبهبندی در صدک ۹۰ قبول شود و دارای قابلیتهای پردازشی جدیدی است که با نسخه قبلی امکانپذیر نبود.
ارقام نمرات آزمون GPT-4 بودند به اشتراک گذاشته شده است در 14 مارس توسط خالق آن OpenAI فاش کرد که همچنین میتواند ورودیهای تصویر، صدا و ویدیو را به متن تبدیل کند، علاوه بر این که «دستورالعملهای ظریفتر» را خلاقانهتر و قابل اعتمادتر مدیریت میکند.
OpenAI اضافه کرد: “این آزمون یک آزمون شبیه سازی شده وکالت را با امتیازی در حدود 10 درصد از شرکت کنندگان برتر قبول می کند.” در مقابل، امتیاز GPT-3.5 حدود 10 درصد پایین بود.
ارقام نشان میدهند که GPT-4 در امتحان LSAT در صدک 88 نمره 163 را به دست آورد – دانشآموزان کالج آزمون باید در ایالات متحده قبول شوند تا در دانشکده حقوق پذیرفته شوند.
نمره GPT4 آن را در موقعیت خوبی برای پذیرش در یک دانشکده حقوق 20 برتر قرار می دهد و تنها چند نمره کمتر از نمره است. گزارش شده است نمرات مورد نیاز برای پذیرش در مدارس معتبر مانند هاروارد، استنفورد، پرینستون یا ییل.
نسخه قبلی ChatGPT تنها امتیاز 149 را در LSAT کسب کرده است که آن را در 40 درصد پایین قرار می دهد.
GPT-4 همچنین در آزمون وکالت یکنواخت امتیاز 298 از 400 را کسب کرد – آزمونی که توسط دانشجویانی که اخیراً فارغ التحصیل شده اند و به آنها اجازه می دهد به عنوان وکیل در هر حوزه قضایی ایالات متحده مشغول به کار شوند.
نسخه قدیمی ChatGPT در این آزمون با مشکل مواجه شد و با امتیاز 213 از 400 در رده 10 درصد پایین قرار گرفت.
در مورد آزمونهای SAT Evidence-based Reading & Writing و SAT Math که توسط دانشآموزان دبیرستانی ایالات متحده برای اندازهگیری آمادگی دانشگاهی آنها گرفته میشود، GPT-4 به ترتیب در صدک 93 و 89 امتیاز کسب کرد.
GPT-4 در علوم “سخت” نیز سرآمد بود، و نمرات صدک بسیار بالاتری را در AP Biology (85-100٪)، شیمی (71-88٪) و فیزیک 2 (66-84٪) به دست آورد.
با این حال، امتیاز AP Calculus آن نسبتاً متوسط بود و در صدک 43 تا 59 قرار گرفت.
یکی دیگر از زمینه هایی که GPT-4 فاقد آن بود، در امتحانات ادبیات انگلیسی بود که نمرات در صدک 8 تا 44 را در دو آزمون جداگانه ارسال کرد.
OpenAI گفت که GPT-4 و GPT-3.5 این تست ها را از آزمون های عملی 2022-2023 گرفته اند، و “هیچ آموزش خاصی” توسط ابزارهای پردازش زبان انجام نشده است:
ما هیچ آموزش خاصی برای این امتحانات انجام ندادیم. اقلیتی از مشکلات در امتحانات توسط مدل در طول آموزش دیده شد، اما ما معتقدیم که نتایج معرف است.
نتایج باعث ترس در جامعه توییتر نیز شد.
مربوط: ChatGPT چگونه بر فضای Web3 تأثیر می گذارد؟ صنعت پاسخ می دهد
نیک آلموند، بنیانگذار FactoryDAO گفت 14300 دنبال کننده او در توییتر در 14 مارس که GPT4 قرار است “مردم را بترساند” و سیستم آموزشی جهانی را “فروپاشی” خواهد کرد.
تئوری ارزیابی برای چندین سال بخش بزرگی از زندگی من بود. من سالها پیش به این روز فکر می کردم. من در آن زمان به معنای واقعی کلمه شبیه میل لنگ ساکن به نظر می رسیدم.
اما… واقعاً این بدان معنی است که از این نقطه به بعد هر چیزی به جز ارزیابی نادیده گرفته شده به پایان رسیده است.
— drnick ️² (@DrNickA) 14 مارس 2023
مدیر سابق Coinbase، Conor Grogan، گفت که او یک قرارداد هوشمند اتریوم زنده را در GPT-4 وارد کرده است و فوراً به چندین «آسیبپذیری امنیتی» اشاره کرده و نحوه سوء استفاده از کد را توضیح داده است:
من یک قرارداد زنده اتریوم را در GPT-4 ریختم.
در یک لحظه، تعدادی از آسیبپذیریهای امنیتی را برجسته کرد و به مناطق سطحی اشاره کرد که میتوان از قرارداد بهرهبرداری کرد. سپس روش خاصی را تأیید کرد که من میتوانم از قرارداد استفاده کنم pic.twitter.com/its5puakUW
— کنر (@jconorgrogan) 14 مارس 2023
ممیزی قراردادهای هوشمند قبلی در ChatGPT دریافت که نسخه اول آن همچنین قادر به شناسایی اشکالات کد تا حد معقولی است.
Rowan Cheung، بنیانگذار خبرنامه هوش مصنوعی “The Rundown” ویدئویی از GPT را به اشتراک گذاشت که یک وب سایت جعلی را که با دست طراحی شده بود روی یک تکه کاغذ به صورت کد رونویسی می کند.
من به تازگی تماشا کردم که GPT-4 یک طرح دستی را به یک وب سایت کاربردی تبدیل می کند.
این دیوانه کننده است. pic.twitter.com/P5nSjrk7Wn
— روآن چونگ (@rowancheung) 14 مارس 2023